From 3825264d16e3cd4456f3b59d211f2edbab0630af Mon Sep 17 00:00:00 2001
From: dimanaStoyanova7 <stoyanovadimana557@gmail.com>
Date: Wed, 20 May 2026 11:43:29 +0200
Subject: [PATCH 01/12] add slurm scripts, configs and CLAUDE.md

---
 CLAUDE.md                                   | 110 ++++++++++++++++++++
 configs/darcy_cocogen.yaml                  |  13 +++
 configs/darcy_diffusion.yaml                |  13 +++
 configs/darcy_pg.yaml                       |  13 +++
 configs/darcy_pidm_me.yaml                  |  13 +++
 configs/darcy_pidm_se.yaml                  |  13 +++
 configs/mechanics_cocogen.yaml              |  16 +++
 configs/mechanics_diffusion.yaml            |  13 +++
 configs/mechanics_pg.yaml                   |  16 +++
 configs/mechanics_pidm_me.yaml              |  13 +++
 configs/mechanics_pidm_se.yaml              |  13 +++
 slurm/darcy_cocogen.slurm                   |  42 ++++++++
 slurm/darcy_diffusion.slurm                 |  42 ++++++++
 slurm/darcy_pg.slurm                        |  42 ++++++++
 slurm/darcy_pidm_me.slurm                   |  42 ++++++++
 slurm/darcy_pidm_se.slurm                   |  42 ++++++++
 slurm/eval_darcy_pidm_me.slurm              |  37 +++++++
 slurm/eval_darcy_pidm_se.slurm              |  37 +++++++
 slurm/eval_topology_diffusion.slurm         |  37 +++++++
 slurm/eval_topology_pidm.slurm              |  37 +++++++
 slurm/logs/.gitkeep                         |   0
 slurm/logs/eval_darcy_me_9912172.err        |   4 +
 slurm/logs/eval_darcy_me_9912172.out        |   0
 slurm/logs/eval_darcy_me_9912378.err        |  28 +++++
 slurm/logs/eval_darcy_me_9912378.out        |   2 +
 slurm/logs/eval_darcy_me_9912408.err        |   0
 slurm/logs/eval_darcy_me_9912408.out        |   4 +
 slurm/logs/eval_darcy_se_9912173.err        |   4 +
 slurm/logs/eval_darcy_se_9912173.out        |   0
 slurm/logs/eval_darcy_se_9912379.err        |  28 +++++
 slurm/logs/eval_darcy_se_9912379.out        |   2 +
 slurm/logs/eval_darcy_se_9912409.err        |   0
 slurm/logs/eval_darcy_se_9912409.out        |   4 +
 slurm/logs/eval_topo_diff_9912175.err       |   4 +
 slurm/logs/eval_topo_diff_9912175.out       |   0
 slurm/logs/eval_topo_diff_9912381.err       |   1 +
 slurm/logs/eval_topo_diff_9912381.out       |   0
 slurm/logs/eval_topo_pidm_9912174.err       |   4 +
 slurm/logs/eval_topo_pidm_9912174.out       |   0
 slurm/logs/eval_topo_pidm_9912380.err       |   1 +
 slurm/logs/eval_topo_pidm_9912380.out       |   0
 slurm/logs/pidm_darcy_cocogen_9913377.err   |   1 +
 slurm/logs/pidm_darcy_cocogen_9913377.out   |   1 +
 slurm/logs/pidm_darcy_cocogen_9913564.err   |   1 +
 slurm/logs/pidm_darcy_cocogen_9913564.out   |   1 +
 slurm/logs/pidm_darcy_diffusion_9913375.err |   6 ++
 slurm/logs/pidm_darcy_diffusion_9913375.out |   1 +
 slurm/logs/pidm_darcy_diffusion_9913543.err |   1 +
 slurm/logs/pidm_darcy_diffusion_9913543.out |   1 +
 slurm/logs/pidm_darcy_diffusion_9940441.err |  11 ++
 slurm/logs/pidm_darcy_diffusion_9940441.out |   1 +
 slurm/logs/pidm_darcy_pg_9913376.err        |   6 ++
 slurm/logs/pidm_darcy_pg_9913376.out        |   1 +
 slurm/logs/pidm_darcy_pg_9913544.err        |   1 +
 slurm/logs/pidm_darcy_pg_9913544.out        |   1 +
 slurm/logs/pidm_toy_9908779.err             |   7 ++
 slurm/logs/pidm_toy_9908779.out             |   0
 slurm/logs/pidm_toy_9912059.err             |   2 +
 slurm/logs/pidm_toy_9912059.out             |   0
 slurm/logs/pidm_toy_9912070.err             |   1 +
 slurm/logs/pidm_toy_9912070.out             |   1 +
 slurm/logs/pidm_toy_9912868.err             |   1 +
 slurm/logs/pidm_toy_9912868.out             |  21 ++++
 slurm/mechanics_cocogen.slurm               |  46 ++++++++
 slurm/mechanics_diffusion.slurm             |  42 ++++++++
 slurm/mechanics_pg.slurm                    |  46 ++++++++
 slurm/mechanics_pidm_me.slurm               |  42 ++++++++
 slurm/mechanics_pidm_se.slurm               |  42 ++++++++
 slurm/test_gpu.slurm                        |  27 +++++
 slurm/toy.slurm                             |  43 ++++++++
 70 files changed, 1045 insertions(+)
 create mode 100644 CLAUDE.md
 create mode 100644 configs/darcy_cocogen.yaml
 create mode 100644 configs/darcy_diffusion.yaml
 create mode 100644 configs/darcy_pg.yaml
 create mode 100644 configs/darcy_pidm_me.yaml
 create mode 100644 configs/darcy_pidm_se.yaml
 create mode 100644 configs/mechanics_cocogen.yaml
 create mode 100644 configs/mechanics_diffusion.yaml
 create mode 100644 configs/mechanics_pg.yaml
 create mode 100644 configs/mechanics_pidm_me.yaml
 create mode 100644 configs/mechanics_pidm_se.yaml
 create mode 100644 slurm/darcy_cocogen.slurm
 create mode 100644 slurm/darcy_diffusion.slurm
 create mode 100644 slurm/darcy_pg.slurm
 create mode 100644 slurm/darcy_pidm_me.slurm
 create mode 100644 slurm/darcy_pidm_se.slurm
 create mode 100644 slurm/eval_darcy_pidm_me.slurm
 create mode 100644 slurm/eval_darcy_pidm_se.slurm
 create mode 100644 slurm/eval_topology_diffusion.slurm
 create mode 100644 slurm/eval_topology_pidm.slurm
 create mode 100644 slurm/logs/.gitkeep
 create mode 100644 slurm/logs/eval_darcy_me_9912172.err
 create mode 100644 slurm/logs/eval_darcy_me_9912172.out
 create mode 100644 slurm/logs/eval_darcy_me_9912378.err
 create mode 100644 slurm/logs/eval_darcy_me_9912378.out
 create mode 100644 slurm/logs/eval_darcy_me_9912408.err
 create mode 100644 slurm/logs/eval_darcy_me_9912408.out
 create mode 100644 slurm/logs/eval_darcy_se_9912173.err
 create mode 100644 slurm/logs/eval_darcy_se_9912173.out
 create mode 100644 slurm/logs/eval_darcy_se_9912379.err
 create mode 100644 slurm/logs/eval_darcy_se_9912379.out
 create mode 100644 slurm/logs/eval_darcy_se_9912409.err
 create mode 100644 slurm/logs/eval_darcy_se_9912409.out
 create mode 100644 slurm/logs/eval_topo_diff_9912175.err
 create mode 100644 slurm/logs/eval_topo_diff_9912175.out
 create mode 100644 slurm/logs/eval_topo_diff_9912381.err
 create mode 100644 slurm/logs/eval_topo_diff_9912381.out
 create mode 100644 slurm/logs/eval_topo_pidm_9912174.err
 create mode 100644 slurm/logs/eval_topo_pidm_9912174.out
 create mode 100644 slurm/logs/eval_topo_pidm_9912380.err
 create mode 100644 slurm/logs/eval_topo_pidm_9912380.out
 create mode 100644 slurm/logs/pidm_darcy_cocogen_9913377.err
 create mode 100644 slurm/logs/pidm_darcy_cocogen_9913377.out
 create mode 100644 slurm/logs/pidm_darcy_cocogen_9913564.err
 create mode 100644 slurm/logs/pidm_darcy_cocogen_9913564.out
 create mode 100644 slurm/logs/pidm_darcy_diffusion_9913375.err
 create mode 100644 slurm/logs/pidm_darcy_diffusion_9913375.out
 create mode 100644 slurm/logs/pidm_darcy_diffusion_9913543.err
 create mode 100644 slurm/logs/pidm_darcy_diffusion_9913543.out
 create mode 100644 slurm/logs/pidm_darcy_diffusion_9940441.err
 create mode 100644 slurm/logs/pidm_darcy_diffusion_9940441.out
 create mode 100644 slurm/logs/pidm_darcy_pg_9913376.err
 create mode 100644 slurm/logs/pidm_darcy_pg_9913376.out
 create mode 100644 slurm/logs/pidm_darcy_pg_9913544.err
 create mode 100644 slurm/logs/pidm_darcy_pg_9913544.out
 create mode 100644 slurm/logs/pidm_toy_9908779.err
 create mode 100644 slurm/logs/pidm_toy_9908779.out
 create mode 100644 slurm/logs/pidm_toy_9912059.err
 create mode 100644 slurm/logs/pidm_toy_9912059.out
 create mode 100644 slurm/logs/pidm_toy_9912070.err
 create mode 100644 slurm/logs/pidm_toy_9912070.out
 create mode 100644 slurm/logs/pidm_toy_9912868.err
 create mode 100644 slurm/logs/pidm_toy_9912868.out
 create mode 100644 slurm/mechanics_cocogen.slurm
 create mode 100644 slurm/mechanics_diffusion.slurm
 create mode 100644 slurm/mechanics_pg.slurm
 create mode 100644 slurm/mechanics_pidm_me.slurm
 create mode 100644 slurm/mechanics_pidm_se.slurm
 create mode 100644 slurm/test_gpu.slurm
 create mode 100644 slurm/toy.slurm

diff --git a/CLAUDE.md b/CLAUDE.md
new file mode 100644
index 0000000..d7d6476
--- /dev/null
+++ b/CLAUDE.md
@@ -0,0 +1,110 @@
+# PIDM Reproduction Project — Claude Context
+
+## What this project is
+Reproduction of "Physics-Informed Diffusion Models" (Bastek et al., ICLR 2025).
+We are reproducing the Darcy flow and topology optimization experiments from Section 4,
+running hyperparameter sweeps, and writing a blog post about our findings.
+
+Paper: https://arxiv.org/abs/2403.14404
+Repo: https://github.com/jhbastek/PhysicsInformedDiffusionModels
+
+## Who is working on this
+- Person 1 (dstoyanova): week 4 setup, Darcy flow reproduction, blog assembly
+- Person 2: topology optimization reproduction + ablation study
+- Person 3: hyperparameter sweep on Darcy flow
+
+## Cluster: DelftBlue (TU Delft HPC)
+- Login: `ssh dstoyanova@login.delftblue.tudelft.nl`
+- Home dir: `/home/dstoyanova/` — limited quota, do NOT store data or checkpoints here
+- Scratch dir: `/scratch/dstoyanova/` — use this for all data, checkpoints, outputs
+- Scheduler: SLURM
+- GPU partitions available:
+  - `gpu` — NVIDIA Tesla V100S, 32GB VRAM (phase 1)
+  - `gpu-a100` — NVIDIA A100, 80GB VRAM (phase 2)
+  - `gpu-a100-small` — A100 partitioned into 10GB instances (not suitable for us)
+- Use `gpu` or `gpu-a100` partition for all training jobs
+- Must be on TU Delft network or EduVPN to SSH in
+
+## Repo structure
+```
+PhysicsInformedDiffusionModels/
+├── main.py          # main training script for Darcy + topology opt.
+├── main_toy.py      # toy problem (unit circle), ~12 min, use as sanity check
+├── sample.py        # inference/evaluation script
+├── model.yaml       # config file — change this to switch between model variants
+├── src/             # model architecture and utilities
+├── data/            # place downloaded data here (darcy/ and mechanics/)
+└── trained_models/  # place downloaded pretrained models here
+```
+
+Data must be downloaded from ETHZ Research Collection:
+https://doi.org/10.3929/ethz-b-000674074
+Place unzipped contents under `/scratch/dstoyanova/PhysicsInformedDiffusionModels/`
+
+## Conda environment
+Environment name: `pidm`
+Python: 3.11
+Key packages: pytorch>=2.0.1, findiff, solidspy, pandas, einops, einops-exts,
+              rotary_embedding_torch, torchvision, opencv, tqdm, matplotlib,
+              imageio, wandb (optional)
+
+To activate: `conda activate pidm`
+Installed at: `/home/dstoyanova/miniconda3/envs/pidm`
+
+## The 5 model variants and their yaml configs
+
+All variants use the same main.py — only model.yaml changes.
+
+| Variant       | c_residual | x0_estimation | residual_grad_guidance | M_correction | N_correction |
+|---------------|------------|---------------|------------------------|--------------|--------------|
+| Diffusion     | 0          | mean          | False                  | 0            | 0            |
+| PG-Diffusion  | 0          | mean          | True                   | 0            | 0            |
+| CoCoGen       | 0          | mean          | False                  | 25           | 50           |
+| PIDM-ME       | 0.001      | mean          | False                  | 0            | 0            |
+| PIDM-SE       | 0.00001    | sample        | False                  | 0            | 0            |
+
+Fixed for all variants:
+- c_data: 1
+- c_ineq: 0
+- lambda_opt: 0
+- diff_steps: 100
+- fd_acc: 2
+- gov_eqs: darcy (for Darcy); mechanics (for topology opt.)
+
+Separate yaml files are stored as:
+`configs/darcy_diffusion.yaml`
+`configs/darcy_pg.yaml`
+`configs/darcy_cocogen.yaml`
+`configs/darcy_pidm_me.yaml`
+`configs/darcy_pidm_se.yaml`
+(and equivalent mechanics_ variants for topology opt.)
+
+## SLURM job scripts
+Stored in `slurm/`
+- `toy.slurm` — sanity check, ~12 min, 1 GPU
+- `darcy_<variant>.slurm` — Darcy flow training, ~13-22h, 1 GPU
+- `mechanics_<variant>.slurm` — topology opt. training, ~48-54h, 1 GPU
+
+All jobs request 1 GPU, 1 node, appropriate wall time.
+Submit with: `sbatch slurm/<script>.slurm`
+Check status: `squeue -u dstoyanova`
+Cancel job: `scancel <jobid>`
+
+## Week 4 order of operations
+1. SSH into DelftBlue
+2. Clone repo into /scratch/dstoyanova/
+3. Download and place data into /scratch/dstoyanova/PhysicsInformedDiffusionModels/
+4. Install miniconda and create pidm environment
+5. Run toy sanity check (main_toy.py via SLURM)
+6. If toy passes: prepare all yaml configs and submit all Darcy + topology jobs
+
+## Key paper results to reproduce
+- Fig. 2: residual error + test data loss curves over training for all 5 Darcy variants
+- Fig. 3: generated permeability/pressure fields + residual maps
+- Table 1: RMAE, MDN % CE, % VFE for topology opt. (in- and out-of-distribution)
+
+## Notes
+- Scratch storage is purged periodically — copy important checkpoints elsewhere
+- Topology opt. training takes ~48-54h — submit early, set wall time to 60h to be safe
+- CoCoGen required careful epsilon tuning in the paper — see Appendix A.6.2
+- The repo uses wandb for logging (optional) — set to disabled if no account
diff --git a/configs/darcy_cocogen.yaml b/configs/darcy_cocogen.yaml
new file mode 100644
index 0000000..e873ab8
--- /dev/null
+++ b/configs/darcy_cocogen.yaml
@@ -0,0 +1,13 @@
+c_data: 1
+c_residual: 0
+c_ineq: 0
+lambda_opt: 0
+diff_steps: 100
+x0_estimation: 'mean'
+ddim_steps: 0
+residual_grad_guidance: False
+correction_mode: xt
+M_correction: 25
+N_correction: 50
+gov_eqs: darcy
+fd_acc: 2
diff --git a/configs/darcy_diffusion.yaml b/configs/darcy_diffusion.yaml
new file mode 100644
index 0000000..eb0c2e1
--- /dev/null
+++ b/configs/darcy_diffusion.yaml
@@ -0,0 +1,13 @@
+c_data: 1
+c_residual: 0
+c_ineq: 0
+lambda_opt: 0
+diff_steps: 100
+x0_estimation: 'mean'
+ddim_steps: 0
+residual_grad_guidance: False
+correction_mode: xt
+M_correction: 0
+N_correction: 0
+gov_eqs: darcy
+fd_acc: 2
diff --git a/configs/darcy_pg.yaml b/configs/darcy_pg.yaml
new file mode 100644
index 0000000..a3e3716
--- /dev/null
+++ b/configs/darcy_pg.yaml
@@ -0,0 +1,13 @@
+c_data: 1
+c_residual: 0
+c_ineq: 0
+lambda_opt: 0
+diff_steps: 100
+x0_estimation: 'mean'
+ddim_steps: 0
+residual_grad_guidance: True
+correction_mode: xt
+M_correction: 0
+N_correction: 0
+gov_eqs: darcy
+fd_acc: 2
diff --git a/configs/darcy_pidm_me.yaml b/configs/darcy_pidm_me.yaml
new file mode 100644
index 0000000..bfdb2ed
--- /dev/null
+++ b/configs/darcy_pidm_me.yaml
@@ -0,0 +1,13 @@
+c_data: 1
+c_residual: 0.001
+c_ineq: 0
+lambda_opt: 0
+diff_steps: 100
+x0_estimation: 'mean'
+ddim_steps: 0
+residual_grad_guidance: False
+correction_mode: xt
+M_correction: 0
+N_correction: 0
+gov_eqs: darcy
+fd_acc: 2
diff --git a/configs/darcy_pidm_se.yaml b/configs/darcy_pidm_se.yaml
new file mode 100644
index 0000000..c039115
--- /dev/null
+++ b/configs/darcy_pidm_se.yaml
@@ -0,0 +1,13 @@
+c_data: 1
+c_residual: 0.00001
+c_ineq: 0
+lambda_opt: 0
+diff_steps: 100
+x0_estimation: 'sample'
+ddim_steps: 0
+residual_grad_guidance: False
+correction_mode: xt
+M_correction: 0
+N_correction: 0
+gov_eqs: darcy
+fd_acc: 2
diff --git a/configs/mechanics_cocogen.yaml b/configs/mechanics_cocogen.yaml
new file mode 100644
index 0000000..3fe51d6
--- /dev/null
+++ b/configs/mechanics_cocogen.yaml
@@ -0,0 +1,16 @@
+# NOTE: CoCoGen correction steps (M_correction, N_correction) are not implemented
+# for mechanics in this codebase. Running main.py with this config will raise a ValueError.
+# Provided for completeness; use darcy_cocogen.yaml for the Darcy flow experiment.
+c_data: 1
+c_residual: 0
+c_ineq: 0
+lambda_opt: 0
+diff_steps: 100
+x0_estimation: 'mean'
+ddim_steps: 0
+residual_grad_guidance: False
+correction_mode: xt
+M_correction: 25
+N_correction: 50
+gov_eqs: mechanics
+fd_acc: 2
diff --git a/configs/mechanics_diffusion.yaml b/configs/mechanics_diffusion.yaml
new file mode 100644
index 0000000..1078423
--- /dev/null
+++ b/configs/mechanics_diffusion.yaml
@@ -0,0 +1,13 @@
+c_data: 1
+c_residual: 0
+c_ineq: 0
+lambda_opt: 0
+diff_steps: 100
+x0_estimation: 'mean'
+ddim_steps: 0
+residual_grad_guidance: False
+correction_mode: xt
+M_correction: 0
+N_correction: 0
+gov_eqs: mechanics
+fd_acc: 2
diff --git a/configs/mechanics_pg.yaml b/configs/mechanics_pg.yaml
new file mode 100644
index 0000000..0ace3d7
--- /dev/null
+++ b/configs/mechanics_pg.yaml
@@ -0,0 +1,16 @@
+# NOTE: residual_grad_guidance is not implemented for mechanics in this codebase.
+# Running main.py with this config will raise a ValueError.
+# Provided for completeness; use darcy_pg.yaml for the Darcy flow experiment.
+c_data: 1
+c_residual: 0
+c_ineq: 0
+lambda_opt: 0
+diff_steps: 100
+x0_estimation: 'mean'
+ddim_steps: 0
+residual_grad_guidance: True
+correction_mode: xt
+M_correction: 0
+N_correction: 0
+gov_eqs: mechanics
+fd_acc: 2
diff --git a/configs/mechanics_pidm_me.yaml b/configs/mechanics_pidm_me.yaml
new file mode 100644
index 0000000..0780fb5
--- /dev/null
+++ b/configs/mechanics_pidm_me.yaml
@@ -0,0 +1,13 @@
+c_data: 1
+c_residual: 0.001
+c_ineq: 0
+lambda_opt: 0
+diff_steps: 100
+x0_estimation: 'mean'
+ddim_steps: 0
+residual_grad_guidance: False
+correction_mode: xt
+M_correction: 0
+N_correction: 0
+gov_eqs: mechanics
+fd_acc: 2
diff --git a/configs/mechanics_pidm_se.yaml b/configs/mechanics_pidm_se.yaml
new file mode 100644
index 0000000..1673bf9
--- /dev/null
+++ b/configs/mechanics_pidm_se.yaml
@@ -0,0 +1,13 @@
+c_data: 1
+c_residual: 0.00001
+c_ineq: 0
+lambda_opt: 0
+diff_steps: 100
+x0_estimation: 'sample'
+ddim_steps: 0
+residual_grad_guidance: False
+correction_mode: xt
+M_correction: 0
+N_correction: 0
+gov_eqs: mechanics
+fd_acc: 2
diff --git a/slurm/darcy_cocogen.slurm b/slurm/darcy_cocogen.slurm
new file mode 100644
index 0000000..890d1f3
--- /dev/null
+++ b/slurm/darcy_cocogen.slurm
@@ -0,0 +1,42 @@
+#!/bin/bash
+#SBATCH --job-name=pidm_darcy_cocogen
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=7500M
+#SBATCH --time=23:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+
+set -euo pipefail
+
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+VARIANT="darcy_cocogen"
+
+cd "$WORKDIR"
+mkdir -p slurm/logs
+
+module load cuda/12.1
+
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+
+cp "configs/${VARIANT}.yaml" model.yaml
+
+export PIDM_RUN_NAME="${VARIANT}_${SLURM_JOB_ID}"
+
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+
+TMPSCRIPT=$(mktemp --suffix=_main.py)
+sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
+python "$TMPSCRIPT"
+rm -f "$TMPSCRIPT"
diff --git a/slurm/darcy_diffusion.slurm b/slurm/darcy_diffusion.slurm
new file mode 100644
index 0000000..54c5a49
--- /dev/null
+++ b/slurm/darcy_diffusion.slurm
@@ -0,0 +1,42 @@
+#!/bin/bash
+#SBATCH --job-name=pidm_darcy_diffusion
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=7500M
+#SBATCH --time=20:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+
+set -euo pipefail
+
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+VARIANT="darcy_diffusion"
+
+cd "$WORKDIR"
+mkdir -p slurm/logs
+
+module load cuda/12.1
+
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+
+cp "configs/${VARIANT}.yaml" model.yaml
+
+export PIDM_RUN_NAME="${VARIANT}_${SLURM_JOB_ID}"
+
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+
+TMPSCRIPT=$(mktemp --suffix=_main.py)
+sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
+python "$TMPSCRIPT"
+rm -f "$TMPSCRIPT"
diff --git a/slurm/darcy_pg.slurm b/slurm/darcy_pg.slurm
new file mode 100644
index 0000000..5897108
--- /dev/null
+++ b/slurm/darcy_pg.slurm
@@ -0,0 +1,42 @@
+#!/bin/bash
+#SBATCH --job-name=pidm_darcy_pg
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=7500M
+#SBATCH --time=23:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+
+set -euo pipefail
+
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+VARIANT="darcy_pg"
+
+cd "$WORKDIR"
+mkdir -p slurm/logs
+
+module load cuda/12.1
+
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+
+cp "configs/${VARIANT}.yaml" model.yaml
+
+export PIDM_RUN_NAME="${VARIANT}_${SLURM_JOB_ID}"
+
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+
+TMPSCRIPT=$(mktemp --suffix=_main.py)
+sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
+python "$TMPSCRIPT"
+rm -f "$TMPSCRIPT"
diff --git a/slurm/darcy_pidm_me.slurm b/slurm/darcy_pidm_me.slurm
new file mode 100644
index 0000000..b5cae64
--- /dev/null
+++ b/slurm/darcy_pidm_me.slurm
@@ -0,0 +1,42 @@
+#!/bin/bash
+#SBATCH --job-name=pidm_darcy_pidm_me
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=7500M
+#SBATCH --time=20:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+
+set -euo pipefail
+
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+VARIANT="darcy_pidm_me"
+
+cd "$WORKDIR"
+mkdir -p slurm/logs
+
+module load cuda/12.1
+
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+
+cp "configs/${VARIANT}.yaml" model.yaml
+
+export PIDM_RUN_NAME="${VARIANT}_${SLURM_JOB_ID}"
+
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+
+TMPSCRIPT=$(mktemp --suffix=_main.py)
+sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
+python "$TMPSCRIPT"
+rm -f "$TMPSCRIPT"
diff --git a/slurm/darcy_pidm_se.slurm b/slurm/darcy_pidm_se.slurm
new file mode 100644
index 0000000..59fad7d
--- /dev/null
+++ b/slurm/darcy_pidm_se.slurm
@@ -0,0 +1,42 @@
+#!/bin/bash
+#SBATCH --job-name=pidm_darcy_pidm_se
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=7500M
+#SBATCH --time=26:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+
+set -euo pipefail
+
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+VARIANT="darcy_pidm_se"
+
+cd "$WORKDIR"
+mkdir -p slurm/logs
+
+module load cuda/12.1
+
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+
+cp "configs/${VARIANT}.yaml" model.yaml
+
+export PIDM_RUN_NAME="${VARIANT}_${SLURM_JOB_ID}"
+
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+
+TMPSCRIPT=$(mktemp --suffix=_main.py)
+sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
+python "$TMPSCRIPT"
+rm -f "$TMPSCRIPT"
diff --git a/slurm/eval_darcy_pidm_me.slurm b/slurm/eval_darcy_pidm_me.slurm
new file mode 100644
index 0000000..5d24573
--- /dev/null
+++ b/slurm/eval_darcy_pidm_me.slurm
@@ -0,0 +1,37 @@
+#!/bin/bash
+#SBATCH --job-name=eval_darcy_me
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=7500M
+#SBATCH --time=02:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+
+set -euo pipefail
+
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+cd "$WORKDIR"
+mkdir -p slurm/logs
+
+module load cuda/12.1
+
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+
+python sample_eval.py \
+    --directory_path ./trained_models/darcy/ \
+    --name PIDM-ME \
+    --load_model_step 300000 \
+    --output_dir ./results/reproduced/darcy/PIDM-ME
diff --git a/slurm/eval_darcy_pidm_se.slurm b/slurm/eval_darcy_pidm_se.slurm
new file mode 100644
index 0000000..d80e0a3
--- /dev/null
+++ b/slurm/eval_darcy_pidm_se.slurm
@@ -0,0 +1,37 @@
+#!/bin/bash
+#SBATCH --job-name=eval_darcy_se
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=7500M
+#SBATCH --time=02:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+
+set -euo pipefail
+
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+cd "$WORKDIR"
+mkdir -p slurm/logs
+
+module load cuda/12.1
+
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+
+python sample_eval.py \
+    --directory_path ./trained_models/darcy/ \
+    --name PIDM-SE \
+    --load_model_step 300000 \
+    --output_dir ./results/reproduced/darcy/PIDM-SE
diff --git a/slurm/eval_topology_diffusion.slurm b/slurm/eval_topology_diffusion.slurm
new file mode 100644
index 0000000..996bd12
--- /dev/null
+++ b/slurm/eval_topology_diffusion.slurm
@@ -0,0 +1,37 @@
+#!/bin/bash
+#SBATCH --job-name=eval_topo_diff
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=7500M
+#SBATCH --time=02:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+
+set -euo pipefail
+
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+cd "$WORKDIR"
+mkdir -p slurm/logs
+
+module load cuda/12.1
+
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+
+python sample_eval.py \
+    --directory_path ./trained_models/mechanics/ \
+    --name standard_diffusion \
+    --load_model_step 600000 \
+    --output_dir ./results/reproduced/topology/standard_diffusion
diff --git a/slurm/eval_topology_pidm.slurm b/slurm/eval_topology_pidm.slurm
new file mode 100644
index 0000000..6128f25
--- /dev/null
+++ b/slurm/eval_topology_pidm.slurm
@@ -0,0 +1,37 @@
+#!/bin/bash
+#SBATCH --job-name=eval_topo_pidm
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=7500M
+#SBATCH --time=02:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+
+set -euo pipefail
+
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+cd "$WORKDIR"
+mkdir -p slurm/logs
+
+module load cuda/12.1
+
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+
+python sample_eval.py \
+    --directory_path ./trained_models/mechanics/ \
+    --name PIDM \
+    --load_model_step 600000 \
+    --output_dir ./results/reproduced/topology/PIDM
diff --git a/slurm/logs/.gitkeep b/slurm/logs/.gitkeep
new file mode 100644
index 0000000..e69de29
diff --git a/slurm/logs/eval_darcy_me_9912172.err b/slurm/logs/eval_darcy_me_9912172.err
new file mode 100644
index 0000000..52e8d60
--- /dev/null
+++ b/slurm/logs/eval_darcy_me_9912172.err
@@ -0,0 +1,4 @@
+Traceback (most recent call last):
+  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/sample_eval.py", line 10, in <module>
+    import argparse, os, yaml, time
+ModuleNotFoundError: No module named 'yaml'
diff --git a/slurm/logs/eval_darcy_me_9912172.out b/slurm/logs/eval_darcy_me_9912172.out
new file mode 100644
index 0000000..e69de29
diff --git a/slurm/logs/eval_darcy_me_9912378.err b/slurm/logs/eval_darcy_me_9912378.err
new file mode 100644
index 0000000..5576a00
--- /dev/null
+++ b/slurm/logs/eval_darcy_me_9912378.err
@@ -0,0 +1,28 @@
+Traceback (most recent call last):
+  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/sample_eval.py", line 117, in <module>
+    residuals = ResidualsDarcy(model=model, fd_acc=fd_acc, pixels_per_dim=pixels_per_dim,
+                ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/src/residuals_darcy.py", line 35, in __init__
+    self.grads = GradientsHelper(d0=d0, d1=d1, fd_acc = fd_acc, periodic=self.periodic, device=device)
+                 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/src/grad_utils.py", line 184, in __init__
+    self.stencil_gradients = StencilGradients(d0=d0, d1=d1, fd_acc = fd_acc, periodic=periodic, device = device)
+                             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/src/grad_utils.py", line 156, in __init__
+    self.d_d1 = StencilGradientComputation(FinDiff(1, d1, 1, acc=fd_acc).stencil((99,99)).data, periodic, device)
+                                           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/compatible.py", line 106, in FinDiff
+    return diff_from_tuple(args)
+           ^^^^^^^^^^^^^^^^^^^^^
+  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/compatible.py", line 92, in diff_from_tuple
+    return Diff(axis, h, **kwargs) ** order
+           ^^^^^^^^^^^^^^^^^^^^^^^
+  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/interface.py", line 62, in __init__
+    grid_axis = make_axis(axis, grid, periodic)
+                ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/grids.py", line 82, in make_axis
+    return EquidistantAxis(dim, spacing=config_or_axis, periodic=periodic)
+           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/grids.py", line 22, in __init__
+    raise ValueError("Spacing must be > 0.")
+ValueError: Spacing must be > 0.
diff --git a/slurm/logs/eval_darcy_me_9912378.out b/slurm/logs/eval_darcy_me_9912378.out
new file mode 100644
index 0000000..6ea6c31
--- /dev/null
+++ b/slurm/logs/eval_darcy_me_9912378.out
@@ -0,0 +1,2 @@
+
+Checkpoint loaded from trained_models/darcy/PIDM-ME/model/checkpoint_300000.pt
diff --git a/slurm/logs/eval_darcy_me_9912408.err b/slurm/logs/eval_darcy_me_9912408.err
new file mode 100644
index 0000000..e69de29
diff --git a/slurm/logs/eval_darcy_me_9912408.out b/slurm/logs/eval_darcy_me_9912408.out
new file mode 100644
index 0000000..009a6f4
--- /dev/null
+++ b/slurm/logs/eval_darcy_me_9912408.out
@@ -0,0 +1,4 @@
+
+Checkpoint loaded from trained_models/darcy/PIDM-ME/model/checkpoint_300000.pt
+Number of trainable parameters: 10386482
+Evaluation for model PIDM-ME done (time: 00:00:00).
diff --git a/slurm/logs/eval_darcy_se_9912173.err b/slurm/logs/eval_darcy_se_9912173.err
new file mode 100644
index 0000000..52e8d60
--- /dev/null
+++ b/slurm/logs/eval_darcy_se_9912173.err
@@ -0,0 +1,4 @@
+Traceback (most recent call last):
+  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/sample_eval.py", line 10, in <module>
+    import argparse, os, yaml, time
+ModuleNotFoundError: No module named 'yaml'
diff --git a/slurm/logs/eval_darcy_se_9912173.out b/slurm/logs/eval_darcy_se_9912173.out
new file mode 100644
index 0000000..e69de29
diff --git a/slurm/logs/eval_darcy_se_9912379.err b/slurm/logs/eval_darcy_se_9912379.err
new file mode 100644
index 0000000..5576a00
--- /dev/null
+++ b/slurm/logs/eval_darcy_se_9912379.err
@@ -0,0 +1,28 @@
+Traceback (most recent call last):
+  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/sample_eval.py", line 117, in <module>
+    residuals = ResidualsDarcy(model=model, fd_acc=fd_acc, pixels_per_dim=pixels_per_dim,
+                ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/src/residuals_darcy.py", line 35, in __init__
+    self.grads = GradientsHelper(d0=d0, d1=d1, fd_acc = fd_acc, periodic=self.periodic, device=device)
+                 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/src/grad_utils.py", line 184, in __init__
+    self.stencil_gradients = StencilGradients(d0=d0, d1=d1, fd_acc = fd_acc, periodic=periodic, device = device)
+                             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/src/grad_utils.py", line 156, in __init__
+    self.d_d1 = StencilGradientComputation(FinDiff(1, d1, 1, acc=fd_acc).stencil((99,99)).data, periodic, device)
+                                           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/compatible.py", line 106, in FinDiff
+    return diff_from_tuple(args)
+           ^^^^^^^^^^^^^^^^^^^^^
+  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/compatible.py", line 92, in diff_from_tuple
+    return Diff(axis, h, **kwargs) ** order
+           ^^^^^^^^^^^^^^^^^^^^^^^
+  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/interface.py", line 62, in __init__
+    grid_axis = make_axis(axis, grid, periodic)
+                ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/grids.py", line 82, in make_axis
+    return EquidistantAxis(dim, spacing=config_or_axis, periodic=periodic)
+           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/grids.py", line 22, in __init__
+    raise ValueError("Spacing must be > 0.")
+ValueError: Spacing must be > 0.
diff --git a/slurm/logs/eval_darcy_se_9912379.out b/slurm/logs/eval_darcy_se_9912379.out
new file mode 100644
index 0000000..4bd460c
--- /dev/null
+++ b/slurm/logs/eval_darcy_se_9912379.out
@@ -0,0 +1,2 @@
+
+Checkpoint loaded from trained_models/darcy/PIDM-SE/model/checkpoint_300000.pt
diff --git a/slurm/logs/eval_darcy_se_9912409.err b/slurm/logs/eval_darcy_se_9912409.err
new file mode 100644
index 0000000..e69de29
diff --git a/slurm/logs/eval_darcy_se_9912409.out b/slurm/logs/eval_darcy_se_9912409.out
new file mode 100644
index 0000000..dbb2d1c
--- /dev/null
+++ b/slurm/logs/eval_darcy_se_9912409.out
@@ -0,0 +1,4 @@
+
+Checkpoint loaded from trained_models/darcy/PIDM-SE/model/checkpoint_300000.pt
+Number of trainable parameters: 10386482
+Evaluation for model PIDM-SE done (time: 00:00:00).
diff --git a/slurm/logs/eval_topo_diff_9912175.err b/slurm/logs/eval_topo_diff_9912175.err
new file mode 100644
index 0000000..52e8d60
--- /dev/null
+++ b/slurm/logs/eval_topo_diff_9912175.err
@@ -0,0 +1,4 @@
+Traceback (most recent call last):
+  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/sample_eval.py", line 10, in <module>
+    import argparse, os, yaml, time
+ModuleNotFoundError: No module named 'yaml'
diff --git a/slurm/logs/eval_topo_diff_9912175.out b/slurm/logs/eval_topo_diff_9912175.out
new file mode 100644
index 0000000..e69de29
diff --git a/slurm/logs/eval_topo_diff_9912381.err b/slurm/logs/eval_topo_diff_9912381.err
new file mode 100644
index 0000000..c58f042
--- /dev/null
+++ b/slurm/logs/eval_topo_diff_9912381.err
@@ -0,0 +1 @@
+slurmstepd: error: *** JOB 9912381 ON gpu015 CANCELLED AT 2026-05-14T14:00:47 DUE TO TIME LIMIT ***
diff --git a/slurm/logs/eval_topo_diff_9912381.out b/slurm/logs/eval_topo_diff_9912381.out
new file mode 100644
index 0000000..e69de29
diff --git a/slurm/logs/eval_topo_pidm_9912174.err b/slurm/logs/eval_topo_pidm_9912174.err
new file mode 100644
index 0000000..52e8d60
--- /dev/null
+++ b/slurm/logs/eval_topo_pidm_9912174.err
@@ -0,0 +1,4 @@
+Traceback (most recent call last):
+  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/sample_eval.py", line 10, in <module>
+    import argparse, os, yaml, time
+ModuleNotFoundError: No module named 'yaml'
diff --git a/slurm/logs/eval_topo_pidm_9912174.out b/slurm/logs/eval_topo_pidm_9912174.out
new file mode 100644
index 0000000..e69de29
diff --git a/slurm/logs/eval_topo_pidm_9912380.err b/slurm/logs/eval_topo_pidm_9912380.err
new file mode 100644
index 0000000..db74d50
--- /dev/null
+++ b/slurm/logs/eval_topo_pidm_9912380.err
@@ -0,0 +1 @@
+slurmstepd: error: *** JOB 9912380 ON gpu015 CANCELLED AT 2026-05-14T14:00:47 DUE TO TIME LIMIT ***
diff --git a/slurm/logs/eval_topo_pidm_9912380.out b/slurm/logs/eval_topo_pidm_9912380.out
new file mode 100644
index 0000000..e69de29
diff --git a/slurm/logs/pidm_darcy_cocogen_9913377.err b/slurm/logs/pidm_darcy_cocogen_9913377.err
new file mode 100644
index 0000000..6eab51f
--- /dev/null
+++ b/slurm/logs/pidm_darcy_cocogen_9913377.err
@@ -0,0 +1 @@
+  0%|          | 0/300001 [00:00<?, ?it/s]training loss: 2.933e+00:   0%|          | 0/300001 [00:33<?, ?it/s]slurmstepd: error: *** JOB 9913377 ON gpu018 CANCELLED AT 2026-05-14T16:02:53 ***
diff --git a/slurm/logs/pidm_darcy_cocogen_9913377.out b/slurm/logs/pidm_darcy_cocogen_9913377.out
new file mode 100644
index 0000000..4b80c77
--- /dev/null
+++ b/slurm/logs/pidm_darcy_cocogen_9913377.out
@@ -0,0 +1 @@
+Number of trainable parameters: 10386482
diff --git a/slurm/logs/pidm_darcy_cocogen_9913564.err b/slurm/logs/pidm_darcy_cocogen_9913564.err
new file mode 100644
index 0000000..d349b27
--- /dev/null
+++ b/slurm/logs/pidm_darcy_cocogen_9913564.err
@@ -0,0 +1 @@
+  0%|          | 0/300001 [00:00<?, ?it/s]training loss: 3.250e+00:   0%|          | 0/300001 [00:34<?, ?it/s]training loss: 3.250e+00:   0%|          | 1/300001 [23:32<117690:41:59, 1412.29s/it]training loss: 3.250e+00:   0%|          | 2/300001 [24:05<50077:18:36, 600.93s/it]  training loss: 3.250e+00:   0%|          | 3/300001 [24:38<28472:50:32, 341.68s/it]training loss: 3.250e+00:   0%|          | 4/300001 [25:10<18298:31:57, 219.58s/it]training loss: 3.250e+00:   0%|          | 5/300001 [25:42<12664:14:35, 151.97s/it]training loss: 3.250e+00:   0%|          | 6/300001 [26:14<9250:45:17, 111.01s/it] training loss: 3.250e+00:   0%|          | 7/300001 [26:46<7088:44:09, 85.07s/it] training loss: 3.250e+00:   0%|          | 8/300001 [27:17<5658:48:40, 67.91s/it]training loss: 3.250e+00:   0%|          | 9/300001 [27:48<4711:18:40, 56.54s/it]training loss: 3.250e+00:   0%|          | 10/300001 [28:22<4119:42:03, 49.44s/it]training loss: 3.250e+00:   0%|          | 11/300001 [28:55<3717:24:35, 44.61s/it]training loss: 3.250e+00:   0%|          | 12/300001 [29:27<3390:29:17, 40.69s/it]training loss: 3.250e+00:   0%|          | 13/300001 [30:00<3191:32:30, 38.30s/it]training loss: 3.250e+00:   0%|          | 14/300001 [30:31<3015:03:21, 36.18s/it]training loss: 3.250e+00:   0%|          | 15/300001 [31:05<2954:55:46, 35.46s/it]training loss: 3.250e+00:   0%|          | 16/300001 [31:37<2860:28:02, 34.33s/it]training loss: 3.250e+00:   0%|          | 17/300001 [32:09<2813:01:42, 33.76s/it]training loss: 3.250e+00:   0%|          | 18/300001 [32:42<2776:42:30, 33.32s/it]training loss: 3.250e+00:   0%|          | 19/300001 [33:14<2758:28:52, 33.10s/it]training loss: 3.250e+00:   0%|          | 20/300001 [33:47<2753:39:39, 33.05s/it]training loss: 2.818e-01:   0%|          | 20/300001 [34:20<2753:39:39, 33.05s/it]training loss: 2.818e-01:   0%|          | 21/300001 [34:20<2752:21:59, 33.03s/it]training loss: 2.818e-01:   0%|          | 22/300001 [34:53<2754:35:21, 33.06s/it]training loss: 2.818e-01:   0%|          | 23/300001 [35:26<2743:41:18, 32.93s/it]training loss: 2.818e-01:   0%|          | 24/300001 [35:57<2708:54:53, 32.51s/it]training loss: 2.818e-01:   0%|          | 25/300001 [36:30<2705:39:08, 32.47s/it]training loss: 2.818e-01:   0%|          | 26/300001 [37:02<2702:35:37, 32.43s/it]training loss: 2.818e-01:   0%|          | 27/300001 [37:34<2686:45:46, 32.24s/it]training loss: 2.818e-01:   0%|          | 28/300001 [38:06<2688:48:28, 32.27s/it]training loss: 2.818e-01:   0%|          | 29/300001 [38:39<2710:54:52, 32.53s/it]training loss: 2.818e-01:   0%|          | 30/300001 [39:11<2688:45:26, 32.27s/it]training loss: 2.818e-01:   0%|          | 31/300001 [39:44<2697:34:58, 32.37s/it]training loss: 2.818e-01:   0%|          | 32/300001 [40:16<2699:51:09, 32.40s/it]training loss: 2.818e-01:   0%|          | 33/300001 [40:48<2676:24:31, 32.12s/it]training loss: 2.818e-01:   0%|          | 34/300001 [41:20<2683:13:07, 32.20s/it]training loss: 2.818e-01:   0%|          | 35/300001 [41:53<2699:06:29, 32.39s/it]training loss: 2.818e-01:   0%|          | 36/300001 [42:25<2706:37:31, 32.48s/it]training loss: 2.818e-01:   0%|          | 37/300001 [42:58<2706:31:02, 32.48s/it]training loss: 2.818e-01:   0%|          | 38/300001 [43:30<2697:47:04, 32.38s/it]training loss: 2.818e-01:   0%|          | 39/300001 [44:01<2662:21:29, 31.95s/it]training loss: 2.818e-01:   0%|          | 40/300001 [44:33<2673:56:42, 32.09s/it]training loss: 6.856e-02:   0%|          | 40/300001 [45:06<2673:56:42, 32.09s/it]training loss: 6.856e-02:   0%|          | 41/300001 [45:06<2686:55:43, 32.25s/it]training loss: 6.856e-02:   0%|          | 42/300001 [45:38<2688:55:36, 32.27s/it]training loss: 6.856e-02:   0%|          | 43/300001 [46:11<2695:51:24, 32.35s/it]training loss: 6.856e-02:   0%|          | 44/300001 [46:44<2702:00:42, 32.43s/it]training loss: 6.856e-02:   0%|          | 45/300001 [47:16<2701:56:04, 32.43s/it]training loss: 6.856e-02:   0%|          | 46/300001 [47:48<2687:22:11, 32.25s/it]training loss: 6.856e-02:   0%|          | 47/300001 [48:20<2690:20:44, 32.29s/it]training loss: 6.856e-02:   0%|          | 48/300001 [48:52<2682:41:31, 32.20s/it]training loss: 6.856e-02:   0%|          | 49/300001 [49:25<2702:51:43, 32.44s/it]training loss: 6.856e-02:   0%|          | 50/300001 [49:58<2712:08:46, 32.55s/it]training loss: 6.856e-02:   0%|          | 51/300001 [50:30<2694:41:03, 32.34s/it]training loss: 6.856e-02:   0%|          | 52/300001 [51:02<2693:50:31, 32.33s/it]training loss: 6.856e-02:   0%|          | 53/300001 [51:34<2693:35:08, 32.33s/it]training loss: 6.856e-02:   0%|          | 54/300001 [52:07<2698:16:16, 32.38s/it]training loss: 6.856e-02:   0%|          | 55/300001 [52:39<2692:26:54, 32.32s/it]training loss: 6.856e-02:   0%|          | 56/300001 [53:12<2698:29:22, 32.39s/it]training loss: 6.856e-02:   0%|          | 57/300001 [53:43<2681:43:33, 32.19s/it]training loss: 6.856e-02:   0%|          | 58/300001 [54:17<2710:56:02, 32.54s/it]training loss: 6.856e-02:   0%|          | 59/300001 [54:50<2731:33:40, 32.79s/it]training loss: 6.856e-02:   0%|          | 60/300001 [55:23<2736:13:45, 32.84s/it]training loss: 4.237e-02:   0%|          | 60/300001 [55:54<2736:13:45, 32.84s/it]training loss: 4.237e-02:   0%|          | 61/300001 [55:54<2680:45:31, 32.18s/it]training loss: 4.237e-02:   0%|          | 62/300001 [56:26<2686:03:57, 32.24s/it]training loss: 4.237e-02:   0%|          | 63/300001 [56:59<2699:49:53, 32.40s/it]training loss: 4.237e-02:   0%|          | 64/300001 [57:31<2701:52:38, 32.43s/it]training loss: 4.237e-02:   0%|          | 65/300001 [58:04<2700:20:57, 32.41s/it]training loss: 4.237e-02:   0%|          | 66/300001 [58:35<2683:21:44, 32.21s/it]training loss: 4.237e-02:   0%|          | 67/300001 [59:10<2733:32:02, 32.81s/it]training loss: 4.237e-02:   0%|          | 68/300001 [59:41<2687:57:39, 32.26s/it]training loss: 4.237e-02:   0%|          | 69/300001 [1:00:13<2684:04:10, 32.22s/it]training loss: 4.237e-02:   0%|          | 70/300001 [1:00:45<2689:18:53, 32.28s/it]training loss: 4.237e-02:   0%|          | 71/300001 [1:01:18<2695:47:13, 32.36s/it]training loss: 4.237e-02:   0%|          | 72/300001 [1:01:50<2702:24:47, 32.44s/it]training loss: 4.237e-02:   0%|          | 73/300001 [1:02:23<2701:17:54, 32.42s/it]training loss: 4.237e-02:   0%|          | 74/300001 [1:02:54<2683:33:00, 32.21s/it]training loss: 4.237e-02:   0%|          | 75/300001 [1:03:25<2645:55:33, 31.76s/it]training loss: 4.237e-02:   0%|          | 76/300001 [1:03:58<2670:06:14, 32.05s/it]training loss: 4.237e-02:   0%|          | 77/300001 [1:04:31<2684:29:17, 32.22s/it]training loss: 4.237e-02:   0%|          | 78/300001 [1:05:03<2681:43:21, 32.19s/it]training loss: 4.237e-02:   0%|          | 79/300001 [1:05:36<2702:39:21, 32.44s/it]training loss: 4.237e-02:   0%|          | 80/300001 [1:06:08<2693:59:52, 32.34s/it]training loss: 3.210e-02:   0%|          | 80/300001 [1:06:41<2693:59:52, 32.34s/it]training loss: 3.210e-02:   0%|          | 81/300001 [1:06:41<2714:34:05, 32.58s/it]training loss: 3.210e-02:   0%|          | 82/300001 [1:07:13<2693:02:45, 32.33s/it]training loss: 3.210e-02:   0%|          | 83/300001 [1:07:45<2694:23:47, 32.34s/it]training loss: 3.210e-02:   0%|          | 84/300001 [1:08:18<2712:27:46, 32.56s/it]training loss: 3.210e-02:   0%|          | 85/300001 [1:08:50<2687:41:39, 32.26s/it]training loss: 3.210e-02:   0%|          | 86/300001 [1:09:21<2671:55:54, 32.07s/it]training loss: 3.210e-02:   0%|          | 87/300001 [1:09:54<2686:57:19, 32.25s/it]training loss: 3.210e-02:   0%|          | 88/300001 [1:10:27<2705:11:54, 32.47s/it]training loss: 3.210e-02:   0%|          | 89/300001 [1:11:00<2713:01:00, 32.57s/it]training loss: 3.210e-02:   0%|          | 90/300001 [1:11:32<2709:24:40, 32.52s/it]training loss: 3.210e-02:   0%|          | 91/300001 [1:12:06<2731:01:40, 32.78s/it]training loss: 3.210e-02:   0%|          | 92/300001 [1:12:37<2693:47:53, 32.34s/it]training loss: 3.210e-02:   0%|          | 93/300001 [1:13:08<2675:05:24, 32.11s/it]training loss: 3.210e-02:   0%|          | 94/300001 [1:13:41<2689:12:21, 32.28s/it]training loss: 3.210e-02:   0%|          | 95/300001 [1:14:14<2704:35:36, 32.47s/it]training loss: 3.210e-02:   0%|          | 96/300001 [1:14:46<2698:22:24, 32.39s/it]training loss: 3.210e-02:   0%|          | 97/300001 [1:15:19<2713:41:48, 32.57s/it]training loss: 3.210e-02:   0%|          | 98/300001 [1:15:51<2701:39:47, 32.43s/it]training loss: 3.210e-02:   0%|          | 99/300001 [1:16:24<2703:54:03, 32.46s/it]training loss: 3.210e-02:   0%|          | 100/300001 [1:16:56<2688:59:45, 32.28s/it]training loss: 2.823e-02:   0%|          | 100/300001 [1:17:28<2688:59:45, 32.28s/it]training loss: 2.823e-02:   0%|          | 101/300001 [1:17:28<2701:55:08, 32.43s/it]training loss: 2.823e-02:   0%|          | 102/300001 [1:18:01<2699:27:58, 32.40s/it]training loss: 2.823e-02:   0%|          | 103/300001 [1:18:33<2699:34:42, 32.41s/it]training loss: 2.823e-02:   0%|          | 104/300001 [1:19:05<2690:19:31, 32.29s/it]training loss: 2.823e-02:   0%|          | 105/300001 [1:19:38<2695:56:45, 32.36s/it]training loss: 2.823e-02:   0%|          | 106/300001 [1:20:11<2726:22:59, 32.73s/it]training loss: 2.823e-02:   0%|          | 107/300001 [1:20:43<2700:19:00, 32.42s/it]training loss: 2.823e-02:   0%|          | 108/300001 [1:21:15<2698:43:02, 32.40s/it]training loss: 2.823e-02:   0%|          | 109/300001 [1:21:48<2696:41:06, 32.37s/it]training loss: 2.823e-02:   0%|          | 110/300001 [1:22:20<2704:44:18, 32.47s/it]training loss: 2.823e-02:   0%|          | 111/300001 [1:22:53<2701:04:45, 32.42s/it]training loss: 2.823e-02:   0%|          | 112/300001 [1:23:25<2708:32:20, 32.51s/it]training loss: 2.823e-02:   0%|          | 113/300001 [1:23:58<2698:08:11, 32.39s/it]training loss: 2.823e-02:   0%|          | 114/300001 [1:24:29<2682:10:12, 32.20s/it]training loss: 2.823e-02:   0%|          | 115/300001 [1:25:01<2681:17:26, 32.19s/it]training loss: 2.823e-02:   0%|          | 116/300001 [1:25:34<2696:29:15, 32.37s/it]training loss: 2.823e-02:   0%|          | 117/300001 [1:26:06<2673:27:08, 32.09s/it]training loss: 2.823e-02:   0%|          | 118/300001 [1:26:39<2697:54:42, 32.39s/it]training loss: 2.823e-02:   0%|          | 119/300001 [1:27:11<2701:51:10, 32.43s/it]training loss: 2.823e-02:   0%|          | 120/300001 [1:27:42<2665:26:13, 32.00s/it]training loss: 2.844e-02:   0%|          | 120/300001 [1:28:14<2665:26:13, 32.00s/it]training loss: 2.844e-02:   0%|          | 121/300001 [1:28:14<2664:00:58, 31.98s/it]training loss: 2.844e-02:   0%|          | 122/300001 [1:28:46<2664:36:05, 31.99s/it]training loss: 2.844e-02:   0%|          | 123/300001 [1:29:17<2631:11:49, 31.59s/it]training loss: 2.844e-02:   0%|          | 124/300001 [1:29:50<2680:52:13, 32.18s/it]training loss: 2.844e-02:   0%|          | 125/300001 [1:30:24<2708:09:05, 32.51s/it]training loss: 2.844e-02:   0%|          | 126/300001 [1:30:56<2689:42:56, 32.29s/it]training loss: 2.844e-02:   0%|          | 127/300001 [1:31:28<2692:03:06, 32.32s/it]training loss: 2.844e-02:   0%|          | 128/300001 [1:32:00<2685:58:40, 32.25s/it]training loss: 2.844e-02:   0%|          | 129/300001 [1:32:34<2730:02:08, 32.77s/it]training loss: 2.844e-02:   0%|          | 130/300001 [1:33:06<2705:23:34, 32.48s/it]training loss: 2.844e-02:   0%|          | 131/300001 [1:33:38<2691:49:12, 32.32s/it]training loss: 2.844e-02:   0%|          | 132/300001 [1:34:11<2713:27:40, 32.58s/it]training loss: 2.844e-02:   0%|          | 133/300001 [1:34:43<2700:42:47, 32.42s/it]training loss: 2.844e-02:   0%|          | 134/300001 [1:35:15<2688:47:52, 32.28s/it]training loss: 2.844e-02:   0%|          | 135/300001 [1:35:47<2680:11:00, 32.18s/it]training loss: 2.844e-02:   0%|          | 136/300001 [1:36:19<2684:51:53, 32.23s/it]training loss: 2.844e-02:   0%|          | 137/300001 [1:36:53<2721:30:09, 32.67s/it]training loss: 2.844e-02:   0%|          | 138/300001 [1:37:24<2676:09:08, 32.13s/it]training loss: 2.844e-02:   0%|          | 139/300001 [1:37:56<2675:53:50, 32.13s/it]training loss: 2.844e-02:   0%|          | 140/300001 [1:38:29<2693:07:20, 32.33s/it]training loss: 2.464e-02:   0%|          | 140/300001 [1:39:01<2693:07:20, 32.33s/it]training loss: 2.464e-02:   0%|          | 141/300001 [1:39:01<2683:19:07, 32.21s/it]training loss: 2.464e-02:   0%|          | 142/300001 [1:39:32<2650:01:43, 31.82s/it]training loss: 2.464e-02:   0%|          | 143/300001 [1:40:04<2671:48:43, 32.08s/it]training loss: 2.464e-02:   0%|          | 144/300001 [1:40:37<2684:41:19, 32.23s/it]training loss: 2.464e-02:   0%|          | 145/300001 [1:41:09<2688:32:32, 32.28s/it]training loss: 2.464e-02:   0%|          | 146/300001 [1:41:42<2693:14:14, 32.33s/it]training loss: 2.464e-02:   0%|          | 147/300001 [1:42:13<2660:44:41, 31.94s/it]training loss: 2.464e-02:   0%|          | 148/300001 [1:42:46<2689:11:26, 32.29s/it]training loss: 2.464e-02:   0%|          | 149/300001 [1:43:19<2719:12:17, 32.65s/it]training loss: 2.464e-02:   0%|          | 150/300001 [1:43:52<2721:09:35, 32.67s/it]training loss: 2.464e-02:   0%|          | 151/300001 [1:44:25<2723:35:16, 32.70s/it]training loss: 2.464e-02:   0%|          | 152/300001 [1:44:58<2731:12:24, 32.79s/it]training loss: 2.464e-02:   0%|          | 153/300001 [1:45:31<2738:44:24, 32.88s/it]training loss: 2.464e-02:   0%|          | 154/300001 [1:46:04<2743:50:54, 32.94s/it]training loss: 2.464e-02:   0%|          | 155/300001 [1:46:36<2714:26:45, 32.59s/it]training loss: 2.464e-02:   0%|          | 156/300001 [1:47:08<2707:47:54, 32.51s/it]training loss: 2.464e-02:   0%|          | 157/300001 [1:47:31<2466:17:32, 29.61s/it]training loss: 2.464e-02:   0%|          | 158/300001 [1:48:04<2552:10:49, 30.64s/it]training loss: 2.464e-02:   0%|          | 159/300001 [1:48:36<2590:30:26, 31.10s/it]training loss: 2.464e-02:   0%|          | 160/300001 [1:49:08<2612:51:59, 31.37s/it]training loss: 1.694e-02:   0%|          | 160/300001 [1:49:41<2612:51:59, 31.37s/it]training loss: 1.694e-02:   0%|          | 161/300001 [1:49:41<2653:23:02, 31.86s/it]training loss: 1.694e-02:   0%|          | 162/300001 [1:50:13<2653:44:20, 31.86s/it]training loss: 1.694e-02:   0%|          | 163/300001 [1:50:46<2694:47:28, 32.35s/it]training loss: 1.694e-02:   0%|          | 164/300001 [1:51:18<2680:28:05, 32.18s/it]training loss: 1.694e-02:   0%|          | 165/300001 [1:51:51<2686:20:12, 32.25s/it]training loss: 1.694e-02:   0%|          | 166/300001 [1:52:24<2703:46:56, 32.46s/it]training loss: 1.694e-02:   0%|          | 167/300001 [1:52:56<2689:28:09, 32.29s/it]training loss: 1.694e-02:   0%|          | 168/300001 [1:53:28<2685:47:36, 32.25s/it]training loss: 1.694e-02:   0%|          | 169/300001 [1:54:00<2684:54:53, 32.24s/it]training loss: 1.694e-02:   0%|          | 170/300001 [1:54:32<2676:30:20, 32.14s/it]training loss: 1.694e-02:   0%|          | 171/300001 [1:55:05<2692:26:50, 32.33s/it]training loss: 1.694e-02:   0%|          | 172/300001 [1:55:37<2692:15:49, 32.33s/it]training loss: 1.694e-02:   0%|          | 173/300001 [1:56:09<2683:51:36, 32.22s/it]training loss: 1.694e-02:   0%|          | 174/300001 [1:56:42<2700:49:42, 32.43s/it]training loss: 1.694e-02:   0%|          | 175/300001 [1:57:15<2710:59:34, 32.55s/it]training loss: 1.694e-02:   0%|          | 176/300001 [1:57:48<2725:18:15, 32.72s/it]training loss: 1.694e-02:   0%|          | 177/300001 [1:58:20<2723:44:27, 32.70s/it]training loss: 1.694e-02:   0%|          | 178/300001 [1:58:52<2707:48:39, 32.51s/it]training loss: 1.694e-02:   0%|          | 179/300001 [1:59:24<2695:30:42, 32.37s/it]training loss: 1.694e-02:   0%|          | 180/300001 [1:59:57<2697:57:47, 32.39s/it]training loss: 2.042e-02:   0%|          | 180/300001 [2:00:29<2697:57:47, 32.39s/it]training loss: 2.042e-02:   0%|          | 181/300001 [2:00:29<2682:00:40, 32.20s/it]training loss: 2.042e-02:   0%|          | 182/300001 [2:01:02<2711:19:47, 32.56s/it]training loss: 2.042e-02:   0%|          | 183/300001 [2:01:34<2701:19:56, 32.44s/it]training loss: 2.042e-02:   0%|          | 184/300001 [2:02:06<2695:44:15, 32.37s/it]training loss: 2.042e-02:   0%|          | 185/300001 [2:02:39<2697:19:03, 32.39s/it]training loss: 2.042e-02:   0%|          | 186/300001 [2:03:11<2689:50:49, 32.30s/it]training loss: 2.042e-02:   0%|          | 187/300001 [2:03:44<2702:04:18, 32.44s/it]training loss: 2.042e-02:   0%|          | 188/300001 [2:04:16<2688:47:06, 32.29s/it]training loss: 2.042e-02:   0%|          | 189/300001 [2:04:48<2679:12:28, 32.17s/it]training loss: 2.042e-02:   0%|          | 190/300001 [2:05:20<2689:54:29, 32.30s/it]training loss: 2.042e-02:   0%|          | 191/300001 [2:05:51<2665:18:14, 32.00s/it]training loss: 2.042e-02:   0%|          | 192/300001 [2:06:24<2673:32:20, 32.10s/it]training loss: 2.042e-02:   0%|          | 193/300001 [2:06:55<2644:29:59, 31.75s/it]training loss: 2.042e-02:   0%|          | 194/300001 [2:07:27<2664:20:33, 31.99s/it]training loss: 2.042e-02:   0%|          | 195/300001 [2:08:01<2702:46:54, 32.45s/it]training loss: 2.042e-02:   0%|          | 196/300001 [2:08:34<2718:57:25, 32.65s/it]training loss: 2.042e-02:   0%|          | 197/300001 [2:09:06<2706:31:29, 32.50s/it]training loss: 2.042e-02:   0%|          | 198/300001 [2:09:39<2727:12:56, 32.75s/it]training loss: 2.042e-02:   0%|          | 199/300001 [2:10:13<2746:18:13, 32.98s/it]training loss: 2.042e-02:   0%|          | 200/300001 [2:10:47<2762:08:29, 33.17s/it]training loss: 1.852e-02:   0%|          | 200/300001 [2:11:19<2762:08:29, 33.17s/it]training loss: 1.852e-02:   0%|          | 201/300001 [2:11:19<2748:57:05, 33.01s/it]training loss: 1.852e-02:   0%|          | 202/300001 [2:11:52<2732:55:30, 32.82s/it]training loss: 1.852e-02:   0%|          | 203/300001 [2:12:26<2763:10:13, 33.18s/it]training loss: 1.852e-02:   0%|          | 204/300001 [2:12:58<2733:30:05, 32.82s/it]training loss: 1.852e-02:   0%|          | 205/300001 [2:13:30<2724:54:28, 32.72s/it]training loss: 1.852e-02:   0%|          | 206/300001 [2:14:02<2706:00:49, 32.49s/it]training loss: 1.852e-02:   0%|          | 207/300001 [2:14:35<2714:41:58, 32.60s/it]training loss: 1.852e-02:   0%|          | 208/300001 [2:15:06<2680:15:22, 32.19s/it]training loss: 1.852e-02:   0%|          | 209/300001 [2:15:39<2698:58:37, 32.41s/it]training loss: 1.852e-02:   0%|          | 210/300001 [2:16:11<2681:17:20, 32.20s/it]training loss: 1.852e-02:   0%|          | 211/300001 [2:16:43<2674:45:56, 32.12s/it]training loss: 1.852e-02:   0%|          | 212/300001 [2:17:15<2685:50:27, 32.25s/it]training loss: 1.852e-02:   0%|          | 213/300001 [2:17:48<2704:05:30, 32.47s/it]training loss: 1.852e-02:   0%|          | 214/300001 [2:18:19<2674:24:59, 32.12s/it]training loss: 1.852e-02:   0%|          | 215/300001 [2:18:53<2700:43:55, 32.43s/it]training loss: 1.852e-02:   0%|          | 216/300001 [2:19:25<2689:30:24, 32.30s/it]training loss: 1.852e-02:   0%|          | 217/300001 [2:19:58<2708:58:22, 32.53s/it]training loss: 1.852e-02:   0%|          | 218/300001 [2:20:30<2693:22:58, 32.34s/it]training loss: 1.852e-02:   0%|          | 219/300001 [2:21:02<2686:24:05, 32.26s/it]training loss: 1.852e-02:   0%|          | 220/300001 [2:21:34<2676:02:05, 32.14s/it]training loss: 1.564e-02:   0%|          | 220/300001 [2:22:06<2676:02:05, 32.14s/it]training loss: 1.564e-02:   0%|          | 221/300001 [2:22:06<2677:40:26, 32.16s/it]training loss: 1.564e-02:   0%|          | 222/300001 [2:22:39<2692:54:13, 32.34s/it]training loss: 1.564e-02:   0%|          | 223/300001 [2:23:11<2698:37:20, 32.41s/it]training loss: 1.564e-02:   0%|          | 224/300001 [2:23:42<2673:30:55, 32.11s/it]training loss: 1.564e-02:   0%|          | 225/300001 [2:24:14<2655:28:47, 31.89s/it]training loss: 1.564e-02:   0%|          | 226/300001 [2:24:46<2650:29:10, 31.83s/it]training loss: 1.564e-02:   0%|          | 227/300001 [2:25:17<2645:20:57, 31.77s/it]training loss: 1.564e-02:   0%|          | 228/300001 [2:25:50<2674:25:33, 32.12s/it]training loss: 1.564e-02:   0%|          | 229/300001 [2:26:23<2701:17:13, 32.44s/it]training loss: 1.564e-02:   0%|          | 230/300001 [2:26:55<2690:32:43, 32.31s/it]training loss: 1.564e-02:   0%|          | 231/300001 [2:27:26<2658:30:55, 31.93s/it]training loss: 1.564e-02:   0%|          | 232/300001 [2:27:58<2661:36:17, 31.96s/it]training loss: 1.564e-02:   0%|          | 233/300001 [2:28:31<2668:09:00, 32.04s/it]training loss: 1.564e-02:   0%|          | 234/300001 [2:29:01<2635:10:59, 31.65s/it]training loss: 1.564e-02:   0%|          | 235/300001 [2:29:34<2654:25:15, 31.88s/it]training loss: 1.564e-02:   0%|          | 236/300001 [2:30:06<2667:40:47, 32.04s/it]training loss: 1.564e-02:   0%|          | 237/300001 [2:30:38<2671:19:07, 32.08s/it]training loss: 1.564e-02:   0%|          | 238/300001 [2:31:12<2713:12:42, 32.58s/it]training loss: 1.564e-02:   0%|          | 239/300001 [2:31:45<2719:35:00, 32.66s/it]training loss: 1.564e-02:   0%|          | 240/300001 [2:32:16<2689:24:22, 32.30s/it]training loss: 1.659e-02:   0%|          | 240/300001 [2:32:49<2689:24:22, 32.30s/it]training loss: 1.659e-02:   0%|          | 241/300001 [2:32:49<2690:08:03, 32.31s/it]training loss: 1.659e-02:   0%|          | 242/300001 [2:33:21<2694:02:44, 32.35s/it]training loss: 1.659e-02:   0%|          | 243/300001 [2:33:53<2687:35:46, 32.28s/it]training loss: 1.659e-02:   0%|          | 244/300001 [2:34:24<2659:55:33, 31.94s/it]training loss: 1.659e-02:   0%|          | 245/300001 [2:34:57<2685:03:23, 32.25s/it]training loss: 1.659e-02:   0%|          | 246/300001 [2:35:29<2666:14:36, 32.02s/it]training loss: 1.659e-02:   0%|          | 247/300001 [2:36:02<2695:20:13, 32.37s/it]training loss: 1.659e-02:   0%|          | 248/300001 [2:36:34<2671:38:21, 32.09s/it]training loss: 1.659e-02:   0%|          | 249/300001 [2:37:06<2679:27:36, 32.18s/it]training loss: 1.659e-02:   0%|          | 250/300001 [2:37:38<2685:21:57, 32.25s/it]training loss: 1.659e-02:   0%|          | 251/300001 [2:38:11<2689:11:44, 32.30s/it]training loss: 1.659e-02:   0%|          | 252/300001 [2:38:43<2699:20:02, 32.42s/it]training loss: 1.659e-02:   0%|          | 253/300001 [2:39:15<2670:53:07, 32.08s/it]training loss: 1.659e-02:   0%|          | 254/300001 [2:39:47<2671:59:16, 32.09s/it]training loss: 1.659e-02:   0%|          | 255/300001 [2:40:19<2673:23:17, 32.11s/it]training loss: 1.659e-02:   0%|          | 256/300001 [2:40:52<2683:33:59, 32.23s/it]training loss: 1.659e-02:   0%|          | 257/300001 [2:41:24<2690:11:51, 32.31s/it]training loss: 1.659e-02:   0%|          | 258/300001 [2:41:56<2694:35:54, 32.36s/it]training loss: 1.659e-02:   0%|          | 259/300001 [2:42:28<2681:39:20, 32.21s/it]training loss: 1.659e-02:   0%|          | 260/300001 [2:43:01<2700:08:32, 32.43s/it]training loss: 1.446e-02:   0%|          | 260/300001 [2:43:34<2700:08:32, 32.43s/it]training loss: 1.446e-02:   0%|          | 261/300001 [2:43:34<2705:09:17, 32.49s/it]training loss: 1.446e-02:   0%|          | 262/300001 [2:44:06<2704:18:36, 32.48s/it]training loss: 1.446e-02:   0%|          | 263/300001 [2:44:39<2706:30:05, 32.51s/it]training loss: 1.446e-02:   0%|          | 264/300001 [2:45:11<2700:27:28, 32.43s/it]training loss: 1.446e-02:   0%|          | 265/300001 [2:45:44<2716:50:09, 32.63s/it]training loss: 1.446e-02:   0%|          | 266/300001 [2:46:18<2735:29:30, 32.85s/it]training loss: 1.446e-02:   0%|          | 267/300001 [2:46:50<2731:59:28, 32.81s/it]training loss: 1.446e-02:   0%|          | 268/300001 [2:47:22<2704:39:39, 32.48s/it]training loss: 1.446e-02:   0%|          | 269/300001 [2:47:55<2722:25:53, 32.70s/it]training loss: 1.446e-02:   0%|          | 270/300001 [2:48:28<2721:41:31, 32.69s/it]training loss: 1.446e-02:   0%|          | 271/300001 [2:49:01<2740:39:41, 32.92s/it]training loss: 1.446e-02:   0%|          | 272/300001 [2:49:33<2711:47:38, 32.57s/it]training loss: 1.446e-02:   0%|          | 273/300001 [2:50:06<2711:51:07, 32.57s/it]training loss: 1.446e-02:   0%|          | 274/300001 [2:50:38<2694:42:30, 32.37s/it]training loss: 1.446e-02:   0%|          | 275/300001 [2:51:11<2709:26:16, 32.54s/it]training loss: 1.446e-02:   0%|          | 276/300001 [2:51:42<2691:13:05, 32.32s/it]training loss: 1.446e-02:   0%|          | 277/300001 [2:52:16<2731:59:09, 32.81s/it]training loss: 1.446e-02:   0%|          | 278/300001 [2:52:50<2754:30:18, 33.08s/it]training loss: 1.446e-02:   0%|          | 279/300001 [2:53:23<2757:03:48, 33.12s/it]training loss: 1.446e-02:   0%|          | 280/300001 [2:53:56<2755:53:17, 33.10s/it]training loss: 1.090e-02:   0%|          | 280/300001 [2:54:29<2755:53:17, 33.10s/it]training loss: 1.090e-02:   0%|          | 281/300001 [2:54:29<2753:51:24, 33.08s/it]training loss: 1.090e-02:   0%|          | 282/300001 [2:55:01<2705:40:44, 32.50s/it]training loss: 1.090e-02:   0%|          | 283/300001 [2:55:32<2681:57:45, 32.21s/it]training loss: 1.090e-02:   0%|          | 284/300001 [2:56:04<2671:17:10, 32.09s/it]training loss: 1.090e-02:   0%|          | 285/300001 [2:56:37<2708:21:06, 32.53s/it]training loss: 1.090e-02:   0%|          | 286/300001 [2:57:10<2709:32:51, 32.55s/it]training loss: 1.090e-02:   0%|          | 287/300001 [2:57:42<2690:35:58, 32.32s/it]training loss: 1.090e-02:   0%|          | 288/300001 [2:58:14<2677:59:13, 32.17s/it]training loss: 1.090e-02:   0%|          | 289/300001 [2:58:45<2656:29:23, 31.91s/it]training loss: 1.090e-02:   0%|          | 290/300001 [2:59:17<2665:25:52, 32.02s/it]training loss: 1.090e-02:   0%|          | 291/300001 [2:59:49<2667:53:08, 32.05s/it]training loss: 1.090e-02:   0%|          | 292/300001 [3:00:21<2662:15:52, 31.98s/it]training loss: 1.090e-02:   0%|          | 293/300001 [3:00:55<2706:12:31, 32.51s/it]training loss: 1.090e-02:   0%|          | 294/300001 [3:01:28<2710:30:42, 32.56s/it]training loss: 1.090e-02:   0%|          | 295/300001 [3:01:59<2677:22:07, 32.16s/it]training loss: 1.090e-02:   0%|          | 296/300001 [3:02:32<2713:19:19, 32.59s/it]training loss: 1.090e-02:   0%|          | 297/300001 [3:03:05<2702:29:04, 32.46s/it]training loss: 1.090e-02:   0%|          | 298/300001 [3:03:36<2685:15:05, 32.25s/it]training loss: 1.090e-02:   0%|          | 299/300001 [3:04:08<2671:39:44, 32.09s/it]training loss: 1.090e-02:   0%|          | 300/300001 [3:04:40<2677:55:13, 32.17s/it]training loss: 1.049e-02:   0%|          | 300/300001 [3:05:12<2677:55:13, 32.17s/it]training loss: 1.049e-02:   0%|          | 301/300001 [3:05:12<2663:18:49, 31.99s/it]training loss: 1.049e-02:   0%|          | 302/300001 [3:05:44<2668:56:49, 32.06s/it]training loss: 1.049e-02:   0%|          | 303/300001 [3:06:15<2645:11:15, 31.77s/it]training loss: 1.049e-02:   0%|          | 304/300001 [3:06:48<2667:11:10, 32.04s/it]training loss: 1.049e-02:   0%|          | 305/300001 [3:07:22<2708:07:13, 32.53s/it]training loss: 1.049e-02:   0%|          | 306/300001 [3:07:54<2710:06:25, 32.55s/it]training loss: 1.049e-02:   0%|          | 307/300001 [3:08:26<2681:32:38, 32.21s/it]training loss: 1.049e-02:   0%|          | 308/300001 [3:08:58<2687:24:05, 32.28s/it]training loss: 1.049e-02:   0%|          | 309/300001 [3:09:30<2683:35:59, 32.24s/it]training loss: 1.049e-02:   0%|          | 310/300001 [3:10:01<2659:51:43, 31.95s/it]training loss: 1.049e-02:   0%|          | 311/300001 [3:10:34<2678:54:39, 32.18s/it]training loss: 1.049e-02:   0%|          | 312/300001 [3:11:06<2670:30:18, 32.08s/it]training loss: 1.049e-02:   0%|          | 313/300001 [3:11:37<2653:53:12, 31.88s/it]training loss: 1.049e-02:   0%|          | 314/300001 [3:12:00<2426:00:53, 29.14s/it]training loss: 1.049e-02:   0%|          | 315/300001 [3:12:32<2500:23:50, 30.04s/it]training loss: 1.049e-02:   0%|          | 316/300001 [3:13:04<2552:37:27, 30.66s/it]training loss: 1.049e-02:   0%|          | 317/300001 [3:13:37<2603:47:59, 31.28s/it]training loss: 1.049e-02:   0%|          | 318/300001 [3:14:10<2640:55:34, 31.72s/it]training loss: 1.049e-02:   0%|          | 319/300001 [3:14:43<2679:36:32, 32.19s/it]training loss: 1.049e-02:   0%|          | 320/300001 [3:15:16<2701:26:43, 32.45s/it]training loss: 1.102e-02:   0%|          | 320/300001 [3:15:49<2701:26:43, 32.45s/it]training loss: 1.102e-02:   0%|          | 321/300001 [3:15:49<2706:24:00, 32.51s/it]training loss: 1.102e-02:   0%|          | 322/300001 [3:16:22<2713:16:35, 32.59s/it]training loss: 1.102e-02:   0%|          | 323/300001 [3:16:53<2692:51:58, 32.35s/it]training loss: 1.102e-02:   0%|          | 324/300001 [3:17:27<2710:07:26, 32.56s/it]training loss: 1.102e-02:   0%|          | 325/300001 [3:17:59<2703:57:27, 32.48s/it]training loss: 1.102e-02:   0%|          | 326/300001 [3:18:31<2698:19:06, 32.41s/it]training loss: 1.102e-02:   0%|          | 327/300001 [3:19:03<2688:27:56, 32.30s/it]training loss: 1.102e-02:   0%|          | 328/300001 [3:19:36<2698:04:51, 32.41s/it]training loss: 1.102e-02:   0%|          | 329/300001 [3:20:08<2681:19:05, 32.21s/it]training loss: 1.102e-02:   0%|          | 330/300001 [3:20:41<2707:29:22, 32.53s/it]training loss: 1.102e-02:   0%|          | 331/300001 [3:21:13<2708:13:40, 32.53s/it]training loss: 1.102e-02:   0%|          | 332/300001 [3:21:45<2680:20:42, 32.20s/it]training loss: 1.102e-02:   0%|          | 333/300001 [3:22:18<2709:22:01, 32.55s/it]training loss: 1.102e-02:   0%|          | 334/300001 [3:22:50<2699:54:09, 32.43s/it]training loss: 1.102e-02:   0%|          | 335/300001 [3:23:23<2711:19:42, 32.57s/it]training loss: 1.102e-02:   0%|          | 336/300001 [3:23:55<2698:34:18, 32.42s/it]training loss: 1.102e-02:   0%|          | 337/300001 [3:24:27<2693:25:28, 32.36s/it]training loss: 1.102e-02:   0%|          | 338/300001 [3:25:00<2697:11:55, 32.40s/it]training loss: 1.102e-02:   0%|          | 339/300001 [3:25:33<2715:30:50, 32.62s/it]training loss: 1.102e-02:   0%|          | 340/300001 [3:26:04<2675:28:06, 32.14s/it]training loss: 1.178e-02:   0%|          | 340/300001 [3:26:37<2675:28:06, 32.14s/it]training loss: 1.178e-02:   0%|          | 341/300001 [3:26:37<2690:02:36, 32.32s/it]training loss: 1.178e-02:   0%|          | 342/300001 [3:27:10<2708:41:31, 32.54s/it]training loss: 1.178e-02:   0%|          | 343/300001 [3:27:44<2737:04:08, 32.88s/it]training loss: 1.178e-02:   0%|          | 344/300001 [3:28:15<2702:11:10, 32.46s/it]training loss: 1.178e-02:   0%|          | 345/300001 [3:28:48<2711:37:09, 32.58s/it]training loss: 1.178e-02:   0%|          | 346/300001 [3:29:21<2714:25:49, 32.61s/it]training loss: 1.178e-02:   0%|          | 347/300001 [3:29:53<2701:07:20, 32.45s/it]training loss: 1.178e-02:   0%|          | 348/300001 [3:30:25<2689:42:08, 32.31s/it]training loss: 1.178e-02:   0%|          | 349/300001 [3:30:58<2707:25:06, 32.53s/it]training loss: 1.178e-02:   0%|          | 350/300001 [3:31:31<2714:34:12, 32.61s/it]training loss: 1.178e-02:   0%|          | 351/300001 [3:32:04<2743:42:44, 32.96s/it]training loss: 1.178e-02:   0%|          | 352/300001 [3:32:36<2720:44:35, 32.69s/it]training loss: 1.178e-02:   0%|          | 353/300001 [3:33:08<2706:18:00, 32.51s/it]training loss: 1.178e-02:   0%|          | 354/300001 [3:33:41<2711:10:16, 32.57s/it]training loss: 1.178e-02:   0%|          | 355/300001 [3:34:13<2702:26:06, 32.47s/it]training loss: 1.178e-02:   0%|          | 356/300001 [3:34:45<2684:46:09, 32.26s/it]training loss: 1.178e-02:   0%|          | 357/300001 [3:35:17<2678:16:31, 32.18s/it]training loss: 1.178e-02:   0%|          | 358/300001 [3:35:49<2676:44:36, 32.16s/it]training loss: 1.178e-02:   0%|          | 359/300001 [3:36:22<2680:47:51, 32.21s/it]training loss: 1.178e-02:   0%|          | 360/300001 [3:36:54<2697:45:12, 32.41s/it]training loss: 1.177e-02:   0%|          | 360/300001 [3:37:27<2697:45:12, 32.41s/it]training loss: 1.177e-02:   0%|          | 361/300001 [3:37:27<2691:10:32, 32.33s/it]training loss: 1.177e-02:   0%|          | 362/300001 [3:37:58<2669:32:13, 32.07s/it]training loss: 1.177e-02:   0%|          | 363/300001 [3:38:30<2670:57:09, 32.09s/it]training loss: 1.177e-02:   0%|          | 364/300001 [3:39:02<2671:49:35, 32.10s/it]training loss: 1.177e-02:   0%|          | 365/300001 [3:39:34<2672:39:15, 32.11s/it]training loss: 1.177e-02:   0%|          | 366/300001 [3:40:07<2676:46:25, 32.16s/it]training loss: 1.177e-02:   0%|          | 367/300001 [3:40:39<2680:12:19, 32.20s/it]training loss: 1.177e-02:   0%|          | 368/300001 [3:41:11<2666:13:57, 32.03s/it]training loss: 1.177e-02:   0%|          | 369/300001 [3:41:43<2670:38:23, 32.09s/it]training loss: 1.177e-02:   0%|          | 370/300001 [3:42:17<2714:38:52, 32.62s/it]training loss: 1.177e-02:   0%|          | 371/300001 [3:42:50<2718:39:59, 32.66s/it]training loss: 1.177e-02:   0%|          | 372/300001 [3:43:22<2705:24:38, 32.51s/it]training loss: 1.177e-02:   0%|          | 373/300001 [3:43:54<2694:20:34, 32.37s/it]training loss: 1.177e-02:   0%|          | 374/300001 [3:44:26<2687:43:04, 32.29s/it]training loss: 1.177e-02:   0%|          | 375/300001 [3:44:59<2700:52:04, 32.45s/it]training loss: 1.177e-02:   0%|          | 376/300001 [3:45:31<2707:24:53, 32.53s/it]training loss: 1.177e-02:   0%|          | 377/300001 [3:46:05<2724:45:19, 32.74s/it]training loss: 1.177e-02:   0%|          | 378/300001 [3:46:37<2724:52:00, 32.74s/it]training loss: 1.177e-02:   0%|          | 379/300001 [3:47:10<2711:11:34, 32.58s/it]training loss: 1.177e-02:   0%|          | 380/300001 [3:47:43<2736:40:30, 32.88s/it]training loss: 1.195e-02:   0%|          | 380/300001 [3:48:16<2736:40:30, 32.88s/it]training loss: 1.195e-02:   0%|          | 381/300001 [3:48:16<2726:21:29, 32.76s/it]training loss: 1.195e-02:   0%|          | 382/300001 [3:48:48<2717:35:24, 32.65s/it]training loss: 1.195e-02:   0%|          | 383/300001 [3:49:21<2715:49:42, 32.63s/it]training loss: 1.195e-02:   0%|          | 384/300001 [3:49:54<2732:08:02, 32.83s/it]training loss: 1.195e-02:   0%|          | 385/300001 [3:50:25<2697:40:36, 32.41s/it]training loss: 1.195e-02:   0%|          | 386/300001 [3:50:57<2681:30:40, 32.22s/it]training loss: 1.195e-02:   0%|          | 387/300001 [3:51:30<2695:33:36, 32.39s/it]training loss: 1.195e-02:   0%|          | 388/300001 [3:52:02<2690:10:22, 32.32s/it]training loss: 1.195e-02:   0%|          | 389/300001 [3:52:34<2683:17:20, 32.24s/it]training loss: 1.195e-02:   0%|          | 390/300001 [3:53:07<2690:41:36, 32.33s/it]training loss: 1.195e-02:   0%|          | 391/300001 [3:53:39<2682:39:22, 32.23s/it]training loss: 1.195e-02:   0%|          | 392/300001 [3:54:10<2660:05:36, 31.96s/it]training loss: 1.195e-02:   0%|          | 393/300001 [3:54:43<2687:45:38, 32.30s/it]training loss: 1.195e-02:   0%|          | 394/300001 [3:55:14<2664:18:55, 32.01s/it]training loss: 1.195e-02:   0%|          | 395/300001 [3:55:46<2651:59:45, 31.87s/it]training loss: 1.195e-02:   0%|          | 396/300001 [3:56:19<2670:36:52, 32.09s/it]training loss: 1.195e-02:   0%|          | 397/300001 [3:56:50<2657:16:58, 31.93s/it]training loss: 1.195e-02:   0%|          | 398/300001 [3:57:20<2619:19:23, 31.47s/it]training loss: 1.195e-02:   0%|          | 399/300001 [3:57:53<2647:05:06, 31.81s/it]training loss: 1.195e-02:   0%|          | 400/300001 [3:58:26<2676:32:57, 32.16s/it]training loss: 1.096e-02:   0%|          | 400/300001 [3:58:58<2676:32:57, 32.16s/it]training loss: 1.096e-02:   0%|          | 401/300001 [3:58:58<2667:40:16, 32.05s/it]training loss: 1.096e-02:   0%|          | 402/300001 [3:59:30<2676:20:48, 32.16s/it]training loss: 1.096e-02:   0%|          | 403/300001 [4:00:01<2648:06:39, 31.82s/it]training loss: 1.096e-02:   0%|          | 404/300001 [4:00:33<2637:52:26, 31.70s/it]training loss: 1.096e-02:   0%|          | 405/300001 [4:01:04<2626:37:59, 31.56s/it]training loss: 1.096e-02:   0%|          | 406/300001 [4:01:36<2641:02:38, 31.74s/it]training loss: 1.096e-02:   0%|          | 407/300001 [4:02:08<2651:40:07, 31.86s/it]training loss: 1.096e-02:   0%|          | 408/300001 [4:02:39<2629:13:06, 31.59s/it]training loss: 1.096e-02:   0%|          | 409/300001 [4:03:12<2660:15:06, 31.97s/it]training loss: 1.096e-02:   0%|          | 410/300001 [4:03:45<2674:58:39, 32.14s/it]training loss: 1.096e-02:   0%|          | 411/300001 [4:04:17<2670:27:51, 32.09s/it]training loss: 1.096e-02:   0%|          | 412/300001 [4:04:49<2669:17:30, 32.08s/it]training loss: 1.096e-02:   0%|          | 413/300001 [4:05:21<2686:48:04, 32.29s/it]training loss: 1.096e-02:   0%|          | 414/300001 [4:05:53<2680:05:40, 32.21s/it]training loss: 1.096e-02:   0%|          | 415/300001 [4:06:26<2677:20:49, 32.17s/it]training loss: 1.096e-02:   0%|          | 416/300001 [4:06:59<2722:34:24, 32.72s/it]training loss: 1.096e-02:   0%|          | 417/300001 [4:07:32<2721:57:33, 32.71s/it]training loss: 1.096e-02:   0%|          | 418/300001 [4:08:05<2733:08:20, 32.84s/it]training loss: 1.096e-02:   0%|          | 419/300001 [4:08:39<2743:02:07, 32.96s/it]training loss: 1.096e-02:   0%|          | 420/300001 [4:09:12<2752:08:02, 33.07s/it]training loss: 1.025e-02:   0%|          | 420/300001 [4:09:45<2752:08:02, 33.07s/it]training loss: 1.025e-02:   0%|          | 421/300001 [4:09:45<2744:59:13, 32.99s/it]training loss: 1.025e-02:   0%|          | 422/300001 [4:10:16<2712:37:43, 32.60s/it]training loss: 1.025e-02:   0%|          | 423/300001 [4:10:50<2725:36:29, 32.75s/it]training loss: 1.025e-02:   0%|          | 424/300001 [4:11:21<2691:59:37, 32.35s/it]training loss: 1.025e-02:   0%|          | 425/300001 [4:11:53<2687:15:23, 32.29s/it]training loss: 1.025e-02:   0%|          | 426/300001 [4:12:25<2671:08:52, 32.10s/it]training loss: 1.025e-02:   0%|          | 427/300001 [4:12:56<2649:53:48, 31.84s/it]training loss: 1.025e-02:   0%|          | 428/300001 [4:13:29<2679:02:24, 32.19s/it]training loss: 1.025e-02:   0%|          | 429/300001 [4:14:01<2668:15:43, 32.06s/it]training loss: 1.025e-02:   0%|          | 430/300001 [4:14:34<2688:32:20, 32.31s/it]training loss: 1.025e-02:   0%|          | 431/300001 [4:15:06<2689:01:08, 32.31s/it]training loss: 1.025e-02:   0%|          | 432/300001 [4:15:38<2673:57:06, 32.13s/it]training loss: 1.025e-02:   0%|          | 433/300001 [4:16:11<2697:02:12, 32.41s/it]training loss: 1.025e-02:   0%|          | 434/300001 [4:16:43<2687:48:50, 32.30s/it]training loss: 1.025e-02:   0%|          | 435/300001 [4:17:15<2674:15:08, 32.14s/it]training loss: 1.025e-02:   0%|          | 436/300001 [4:17:47<2684:22:25, 32.26s/it]training loss: 1.025e-02:   0%|          | 437/300001 [4:18:19<2688:09:40, 32.30s/it]training loss: 1.025e-02:   0%|          | 438/300001 [4:18:52<2685:27:12, 32.27s/it]training loss: 1.025e-02:   0%|          | 439/300001 [4:19:23<2657:57:10, 31.94s/it]training loss: 1.025e-02:   0%|          | 440/300001 [4:19:55<2666:18:23, 32.04s/it]training loss: 1.087e-02:   0%|          | 440/300001 [4:20:27<2666:18:23, 32.04s/it]training loss: 1.087e-02:   0%|          | 441/300001 [4:20:27<2672:38:56, 32.12s/it]training loss: 1.087e-02:   0%|          | 442/300001 [4:21:00<2684:02:00, 32.26s/it]training loss: 1.087e-02:   0%|          | 443/300001 [4:21:33<2694:10:48, 32.38s/it]training loss: 1.087e-02:   0%|          | 444/300001 [4:22:05<2682:51:52, 32.24s/it]training loss: 1.087e-02:   0%|          | 445/300001 [4:22:36<2674:46:01, 32.14s/it]training loss: 1.087e-02:   0%|          | 446/300001 [4:23:10<2710:56:59, 32.58s/it]training loss: 1.087e-02:   0%|          | 447/300001 [4:23:43<2728:12:49, 32.79s/it]training loss: 1.087e-02:   0%|          | 448/300001 [4:24:16<2729:07:16, 32.80s/it]training loss: 1.087e-02:   0%|          | 449/300001 [4:24:49<2728:19:07, 32.79s/it]training loss: 1.087e-02:   0%|          | 450/300001 [4:25:21<2708:04:53, 32.55s/it]training loss: 1.087e-02:   0%|          | 451/300001 [4:25:54<2714:13:58, 32.62s/it]training loss: 1.087e-02:   0%|          | 452/300001 [4:26:25<2686:36:21, 32.29s/it]training loss: 1.087e-02:   0%|          | 453/300001 [4:26:57<2673:28:45, 32.13s/it]training loss: 1.087e-02:   0%|          | 454/300001 [4:27:30<2699:48:22, 32.45s/it]training loss: 1.087e-02:   0%|          | 455/300001 [4:28:03<2708:28:40, 32.55s/it]training loss: 1.087e-02:   0%|          | 456/300001 [4:28:36<2713:04:17, 32.61s/it]training loss: 1.087e-02:   0%|          | 457/300001 [4:29:09<2724:37:12, 32.75s/it]training loss: 1.087e-02:   0%|          | 458/300001 [4:29:41<2718:55:17, 32.68s/it]training loss: 1.087e-02:   0%|          | 459/300001 [4:30:14<2712:39:06, 32.60s/it]training loss: 1.087e-02:   0%|          | 460/300001 [4:30:45<2673:19:13, 32.13s/it]training loss: 9.073e-03:   0%|          | 460/300001 [4:31:17<2673:19:13, 32.13s/it]training loss: 9.073e-03:   0%|          | 461/300001 [4:31:17<2687:00:18, 32.29s/it]training loss: 9.073e-03:   0%|          | 462/300001 [4:31:50<2693:35:30, 32.37s/it]training loss: 9.073e-03:   0%|          | 463/300001 [4:32:23<2716:06:09, 32.64s/it]training loss: 9.073e-03:   0%|          | 464/300001 [4:32:56<2720:36:44, 32.70s/it]training loss: 9.073e-03:   0%|          | 465/300001 [4:33:29<2724:42:09, 32.75s/it]training loss: 9.073e-03:   0%|          | 466/300001 [4:34:01<2696:07:06, 32.40s/it]training loss: 9.073e-03:   0%|          | 467/300001 [4:34:34<2727:43:37, 32.78s/it]training loss: 9.073e-03:   0%|          | 468/300001 [4:35:06<2708:41:11, 32.55s/it]training loss: 9.073e-03:   0%|          | 469/300001 [4:35:38<2684:57:01, 32.27s/it]training loss: 9.073e-03:   0%|          | 470/300001 [4:36:09<2665:31:00, 32.04s/it]training loss: 9.073e-03:   0%|          | 471/300001 [4:36:32<2429:24:22, 29.20s/it]training loss: 9.073e-03:   0%|          | 472/300001 [4:37:04<2511:26:32, 30.18s/it]training loss: 9.073e-03:   0%|          | 473/300001 [4:37:38<2591:17:29, 31.14s/it]training loss: 9.073e-03:   0%|          | 474/300001 [4:38:10<2617:32:40, 31.46s/it]training loss: 9.073e-03:   0%|          | 475/300001 [4:38:42<2624:18:48, 31.54s/it]training loss: 9.073e-03:   0%|          | 476/300001 [4:39:13<2625:27:29, 31.56s/it]training loss: 9.073e-03:   0%|          | 477/300001 [4:39:46<2649:13:56, 31.84s/it]training loss: 9.073e-03:   0%|          | 478/300001 [4:40:18<2663:21:26, 32.01s/it]training loss: 9.073e-03:   0%|          | 479/300001 [4:40:50<2655:53:58, 31.92s/it]training loss: 9.073e-03:   0%|          | 480/300001 [4:41:23<2676:20:30, 32.17s/it]training loss: 1.018e-02:   0%|          | 480/300001 [4:41:55<2676:20:30, 32.17s/it]training loss: 1.018e-02:   0%|          | 481/300001 [4:41:55<2682:22:47, 32.24s/it]training loss: 1.018e-02:   0%|          | 482/300001 [4:42:27<2677:54:43, 32.19s/it]training loss: 1.018e-02:   0%|          | 483/300001 [4:42:59<2681:56:55, 32.24s/it]training loss: 1.018e-02:   0%|          | 484/300001 [4:43:32<2691:20:03, 32.35s/it]training loss: 1.018e-02:   0%|          | 485/300001 [4:44:02<2635:31:41, 31.68s/it]training loss: 1.018e-02:   0%|          | 486/300001 [4:44:35<2664:44:02, 32.03s/it]training loss: 1.018e-02:   0%|          | 487/300001 [4:45:07<2671:55:19, 32.12s/it]training loss: 1.018e-02:   0%|          | 488/300001 [4:45:40<2680:28:02, 32.22s/it]training loss: 1.018e-02:   0%|          | 489/300001 [4:46:12<2672:40:21, 32.12s/it]training loss: 1.018e-02:   0%|          | 490/300001 [4:46:44<2669:49:39, 32.09s/it]training loss: 1.018e-02:   0%|          | 491/300001 [4:47:17<2702:46:51, 32.49s/it]training loss: 1.018e-02:   0%|          | 492/300001 [4:47:50<2710:42:48, 32.58s/it]training loss: 1.018e-02:   0%|          | 493/300001 [4:48:22<2708:21:23, 32.55s/it]training loss: 1.018e-02:   0%|          | 494/300001 [4:48:55<2710:32:12, 32.58s/it]training loss: 1.018e-02:   0%|          | 495/300001 [4:49:27<2702:55:16, 32.49s/it]training loss: 1.018e-02:   0%|          | 496/300001 [4:49:59<2692:14:26, 32.36s/it]training loss: 1.018e-02:   0%|          | 497/300001 [4:50:31<2669:00:41, 32.08s/it]training loss: 1.018e-02:   0%|          | 498/300001 [4:51:04<2685:18:17, 32.28s/it]training loss: 1.018e-02:   0%|          | 499/300001 [4:51:35<2672:25:01, 32.12s/it]training loss: 1.018e-02:   0%|          | 500/300001 [4:52:07<2670:17:20, 32.10s/it]training loss: 8.834e-03:   0%|          | 500/300001 [4:52:39<2670:17:20, 32.10s/it]training loss: 8.834e-03:   0%|          | 501/300001 [4:52:44<2773:30:52, 33.34s/it]training loss: 8.834e-03:   0%|          | 502/300001 [4:53:17<2771:18:42, 33.31s/it]training loss: 8.834e-03:   0%|          | 503/300001 [4:53:50<2762:41:22, 33.21s/it]training loss: 8.834e-03:   0%|          | 504/300001 [4:54:23<2758:14:16, 33.15s/it]training loss: 8.834e-03:   0%|          | 505/300001 [4:54:56<2753:03:01, 33.09s/it]training loss: 8.834e-03:   0%|          | 506/300001 [4:55:29<2762:15:21, 33.20s/it]training loss: 8.834e-03:   0%|          | 507/300001 [4:56:02<2743:18:11, 32.98s/it]training loss: 8.834e-03:   0%|          | 508/300001 [4:56:34<2718:42:23, 32.68s/it]training loss: 8.834e-03:   0%|          | 509/300001 [4:57:06<2707:04:06, 32.54s/it]training loss: 8.834e-03:   0%|          | 510/300001 [4:57:40<2739:19:50, 32.93s/it]training loss: 8.834e-03:   0%|          | 511/300001 [4:58:13<2735:53:23, 32.89s/it]training loss: 8.834e-03:   0%|          | 512/300001 [4:58:45<2734:46:41, 32.87s/it]training loss: 8.834e-03:   0%|          | 513/300001 [4:59:19<2753:04:17, 33.09s/it]training loss: 8.834e-03:   0%|          | 514/300001 [4:59:52<2760:20:47, 33.18s/it]training loss: 8.834e-03:   0%|          | 515/300001 [5:00:27<2800:49:21, 33.67s/it]training loss: 8.834e-03:   0%|          | 516/300001 [5:01:01<2800:25:08, 33.66s/it]training loss: 8.834e-03:   0%|          | 517/300001 [5:01:33<2756:49:57, 33.14s/it]training loss: 8.834e-03:   0%|          | 518/300001 [5:02:05<2733:10:27, 32.85s/it]training loss: 8.834e-03:   0%|          | 519/300001 [5:02:38<2728:56:06, 32.80s/it]training loss: 8.834e-03:   0%|          | 520/300001 [5:03:09<2704:29:05, 32.51s/it]training loss: 9.339e-03:   0%|          | 520/300001 [5:03:41<2704:29:05, 32.51s/it]training loss: 9.339e-03:   0%|          | 521/300001 [5:03:41<2691:46:05, 32.36s/it]training loss: 9.339e-03:   0%|          | 522/300001 [5:04:14<2700:16:30, 32.46s/it]training loss: 9.339e-03:   0%|          | 523/300001 [5:04:46<2696:22:49, 32.41s/it]training loss: 9.339e-03:   0%|          | 524/300001 [5:05:19<2696:23:56, 32.41s/it]training loss: 9.339e-03:   0%|          | 525/300001 [5:05:51<2689:58:11, 32.34s/it]training loss: 9.339e-03:   0%|          | 526/300001 [5:06:23<2692:09:35, 32.36s/it]training loss: 9.339e-03:   0%|          | 527/300001 [5:06:56<2707:37:01, 32.55s/it]training loss: 9.339e-03:   0%|          | 528/300001 [5:07:28<2692:34:06, 32.37s/it]training loss: 9.339e-03:   0%|          | 529/300001 [5:08:01<2698:14:44, 32.44s/it]training loss: 9.339e-03:   0%|          | 530/300001 [5:08:33<2685:01:56, 32.28s/it]training loss: 9.339e-03:   0%|          | 531/300001 [5:09:06<2696:17:00, 32.41s/it]training loss: 9.339e-03:   0%|          | 532/300001 [5:09:38<2697:19:05, 32.43s/it]training loss: 9.339e-03:   0%|          | 533/300001 [5:10:10<2683:31:52, 32.26s/it]training loss: 9.339e-03:   0%|          | 534/300001 [5:10:43<2701:14:34, 32.47s/it]training loss: 9.339e-03:   0%|          | 535/300001 [5:11:15<2701:49:30, 32.48s/it]training loss: 9.339e-03:   0%|          | 536/300001 [5:11:49<2726:50:12, 32.78s/it]training loss: 9.339e-03:   0%|          | 537/300001 [5:12:21<2716:06:33, 32.65s/it]training loss: 9.339e-03:   0%|          | 538/300001 [5:12:54<2723:42:55, 32.74s/it]training loss: 9.339e-03:   0%|          | 539/300001 [5:13:26<2705:56:15, 32.53s/it]training loss: 9.339e-03:   0%|          | 540/300001 [5:13:59<2715:38:27, 32.65s/it]training loss: 8.590e-03:   0%|          | 540/300001 [5:14:30<2715:38:27, 32.65s/it]training loss: 8.590e-03:   0%|          | 541/300001 [5:14:30<2675:22:57, 32.16s/it]training loss: 8.590e-03:   0%|          | 542/300001 [5:15:04<2705:16:32, 32.52s/it]training loss: 8.590e-03:   0%|          | 543/300001 [5:15:36<2711:32:24, 32.60s/it]training loss: 8.590e-03:   0%|          | 544/300001 [5:16:09<2725:10:27, 32.76s/it]training loss: 8.590e-03:   0%|          | 545/300001 [5:16:43<2743:47:20, 32.99s/it]training loss: 8.590e-03:   0%|          | 546/300001 [5:17:16<2744:08:12, 32.99s/it]training loss: 8.590e-03:   0%|          | 547/300001 [5:17:49<2748:02:54, 33.04s/it]training loss: 8.590e-03:   0%|          | 548/300001 [5:18:23<2757:35:59, 33.15s/it]training loss: 8.590e-03:   0%|          | 549/300001 [5:18:55<2745:43:38, 33.01s/it]training loss: 8.590e-03:   0%|          | 550/300001 [5:19:27<2704:57:14, 32.52s/it]training loss: 8.590e-03:   0%|          | 551/300001 [5:20:00<2722:42:16, 32.73s/it]training loss: 8.590e-03:   0%|          | 552/300001 [5:20:32<2702:02:08, 32.48s/it]training loss: 8.590e-03:   0%|          | 553/300001 [5:21:04<2703:53:14, 32.51s/it]training loss: 8.590e-03:   0%|          | 554/300001 [5:21:36<2690:57:51, 32.35s/it]training loss: 8.590e-03:   0%|          | 555/300001 [5:22:08<2685:40:49, 32.29s/it]training loss: 8.590e-03:   0%|          | 556/300001 [5:22:40<2679:00:31, 32.21s/it]training loss: 8.590e-03:   0%|          | 557/300001 [5:23:13<2677:29:18, 32.19s/it]training loss: 8.590e-03:   0%|          | 558/300001 [5:23:45<2676:09:19, 32.17s/it]training loss: 8.590e-03:   0%|          | 559/300001 [5:24:17<2684:37:58, 32.28s/it]training loss: 8.590e-03:   0%|          | 560/300001 [5:24:51<2709:24:10, 32.57s/it]training loss: 9.032e-03:   0%|          | 560/300001 [5:25:24<2709:24:10, 32.57s/it]training loss: 9.032e-03:   0%|          | 561/300001 [5:25:24<2730:37:48, 32.83s/it]training loss: 9.032e-03:   0%|          | 562/300001 [5:25:55<2693:35:45, 32.38s/it]training loss: 9.032e-03:   0%|          | 563/300001 [5:26:27<2682:11:24, 32.25s/it]training loss: 9.032e-03:   0%|          | 564/300001 [5:27:00<2690:02:28, 32.34s/it]training loss: 9.032e-03:   0%|          | 565/300001 [5:27:32<2680:53:06, 32.23s/it]training loss: 9.032e-03:   0%|          | 566/300001 [5:28:04<2692:33:33, 32.37s/it]training loss: 9.032e-03:   0%|          | 567/300001 [5:28:37<2693:07:44, 32.38s/it]training loss: 9.032e-03:   0%|          | 568/300001 [5:29:10<2703:02:29, 32.50s/it]training loss: 9.032e-03:   0%|          | 569/300001 [5:29:42<2701:31:54, 32.48s/it]training loss: 9.032e-03:   0%|          | 570/300001 [5:30:14<2687:06:52, 32.31s/it]training loss: 9.032e-03:   0%|          | 571/300001 [5:30:46<2681:04:23, 32.23s/it]training loss: 9.032e-03:   0%|          | 572/300001 [5:31:18<2681:23:18, 32.24s/it]training loss: 9.032e-03:   0%|          | 573/300001 [5:31:51<2688:23:29, 32.32s/it]training loss: 9.032e-03:   0%|          | 574/300001 [5:32:23<2696:31:01, 32.42s/it]training loss: 9.032e-03:   0%|          | 575/300001 [5:32:56<2696:33:00, 32.42s/it]training loss: 9.032e-03:   0%|          | 576/300001 [5:33:28<2695:41:59, 32.41s/it]training loss: 9.032e-03:   0%|          | 577/300001 [5:34:00<2674:48:47, 32.16s/it]training loss: 9.032e-03:   0%|          | 578/300001 [5:34:33<2711:46:50, 32.60s/it]training loss: 9.032e-03:   0%|          | 579/300001 [5:35:05<2679:48:46, 32.22s/it]training loss: 9.032e-03:   0%|          | 580/300001 [5:35:38<2702:51:53, 32.50s/it]training loss: 9.345e-03:   0%|          | 580/300001 [5:36:11<2702:51:53, 32.50s/it]training loss: 9.345e-03:   0%|          | 581/300001 [5:36:11<2713:21:25, 32.62s/it]training loss: 9.345e-03:   0%|          | 582/300001 [5:36:43<2704:28:53, 32.52s/it]training loss: 9.345e-03:   0%|          | 583/300001 [5:37:16<2706:19:47, 32.54s/it]training loss: 9.345e-03:   0%|          | 584/300001 [5:37:48<2688:37:09, 32.33s/it]training loss: 9.345e-03:   0%|          | 585/300001 [5:38:19<2671:39:52, 32.12s/it]training loss: 9.345e-03:   0%|          | 586/300001 [5:38:50<2643:15:16, 31.78s/it]training loss: 9.345e-03:   0%|          | 587/300001 [5:39:22<2637:39:34, 31.71s/it]training loss: 9.345e-03:   0%|          | 588/300001 [5:39:55<2686:46:58, 32.30s/it]training loss: 9.345e-03:   0%|          | 589/300001 [5:40:29<2719:53:43, 32.70s/it]training loss: 9.345e-03:   0%|          | 590/300001 [5:41:02<2735:35:22, 32.89s/it]training loss: 9.345e-03:   0%|          | 591/300001 [5:41:35<2731:48:02, 32.85s/it]training loss: 9.345e-03:   0%|          | 592/300001 [5:42:08<2733:49:51, 32.87s/it]training loss: 9.345e-03:   0%|          | 593/300001 [5:42:41<2737:19:12, 32.91s/it]training loss: 9.345e-03:   0%|          | 594/300001 [5:43:14<2732:50:05, 32.86s/it]training loss: 9.345e-03:   0%|          | 595/300001 [5:43:45<2698:32:37, 32.45s/it]training loss: 9.345e-03:   0%|          | 596/300001 [5:44:18<2703:31:29, 32.51s/it]training loss: 9.345e-03:   0%|          | 597/300001 [5:44:51<2727:11:38, 32.79s/it]training loss: 9.345e-03:   0%|          | 598/300001 [5:45:23<2692:26:02, 32.37s/it]training loss: 9.345e-03:   0%|          | 599/300001 [5:45:55<2688:34:00, 32.33s/it]training loss: 9.345e-03:   0%|          | 600/300001 [5:46:26<2667:53:48, 32.08s/it]training loss: 8.208e-03:   0%|          | 600/300001 [5:46:58<2667:53:48, 32.08s/it]training loss: 8.208e-03:   0%|          | 601/300001 [5:46:58<2652:00:11, 31.89s/it]training loss: 8.208e-03:   0%|          | 602/300001 [5:47:30<2669:01:39, 32.09s/it]training loss: 8.208e-03:   0%|          | 603/300001 [5:48:02<2663:49:02, 32.03s/it]training loss: 8.208e-03:   0%|          | 604/300001 [5:48:35<2667:33:32, 32.08s/it]training loss: 8.208e-03:   0%|          | 605/300001 [5:49:08<2691:27:37, 32.36s/it]training loss: 8.208e-03:   0%|          | 606/300001 [5:49:40<2694:49:30, 32.40s/it]training loss: 8.208e-03:   0%|          | 607/300001 [5:50:11<2658:30:42, 31.97s/it]training loss: 8.208e-03:   0%|          | 608/300001 [5:50:43<2660:28:22, 31.99s/it]training loss: 8.208e-03:   0%|          | 609/300001 [5:51:15<2670:00:25, 32.11s/it]training loss: 8.208e-03:   0%|          | 610/300001 [5:51:47<2653:59:12, 31.91s/it]training loss: 8.208e-03:   0%|          | 611/300001 [5:52:19<2660:36:44, 31.99s/it]training loss: 8.208e-03:   0%|          | 612/300001 [5:52:51<2670:18:46, 32.11s/it]training loss: 8.208e-03:   0%|          | 613/300001 [5:53:24<2681:48:17, 32.25s/it]training loss: 8.208e-03:   0%|          | 614/300001 [5:53:56<2674:01:16, 32.15s/it]training loss: 8.208e-03:   0%|          | 615/300001 [5:54:28<2668:25:10, 32.09s/it]training loss: 8.208e-03:   0%|          | 616/300001 [5:55:01<2688:16:36, 32.33s/it]training loss: 8.208e-03:   0%|          | 617/300001 [5:55:33<2681:08:40, 32.24s/it]training loss: 8.208e-03:   0%|          | 618/300001 [5:56:05<2674:46:56, 32.16s/it]training loss: 8.208e-03:   0%|          | 619/300001 [5:56:36<2655:51:15, 31.94s/it]training loss: 8.208e-03:   0%|          | 620/300001 [5:57:08<2655:03:03, 31.93s/it]training loss: 7.626e-03:   0%|          | 620/300001 [5:57:41<2655:03:03, 31.93s/it]training loss: 7.626e-03:   0%|          | 621/300001 [5:57:41<2689:06:23, 32.34s/it]training loss: 7.626e-03:   0%|          | 622/300001 [5:58:13<2678:44:11, 32.21s/it]training loss: 7.626e-03:   0%|          | 623/300001 [5:58:47<2707:14:53, 32.55s/it]training loss: 7.626e-03:   0%|          | 624/300001 [5:59:18<2686:38:54, 32.31s/it]training loss: 7.626e-03:   0%|          | 625/300001 [5:59:51<2693:57:31, 32.39s/it]training loss: 7.626e-03:   0%|          | 626/300001 [6:00:23<2680:38:20, 32.23s/it]training loss: 7.626e-03:   0%|          | 627/300001 [6:00:55<2684:13:03, 32.28s/it]training loss: 7.626e-03:   0%|          | 628/300001 [6:01:17<2422:03:36, 29.13s/it]training loss: 7.626e-03:   0%|          | 629/300001 [6:01:49<2504:02:40, 30.11s/it]training loss: 7.626e-03:   0%|          | 630/300001 [6:02:21<2540:29:04, 30.55s/it]training loss: 7.626e-03:   0%|          | 631/300001 [6:02:55<2619:45:38, 31.50s/it]training loss: 7.626e-03:   0%|          | 632/300001 [6:03:26<2611:44:46, 31.41s/it]training loss: 7.626e-03:   0%|          | 633/300001 [6:03:58<2639:21:10, 31.74s/it]training loss: 7.626e-03:   0%|          | 634/300001 [6:04:31<2651:07:05, 31.88s/it]training loss: 7.626e-03:   0%|          | 635/300001 [6:05:03<2665:44:16, 32.06s/it]training loss: 7.626e-03:   0%|          | 636/300001 [6:05:35<2668:16:07, 32.09s/it]training loss: 7.626e-03:   0%|          | 637/300001 [6:06:09<2706:05:06, 32.54s/it]training loss: 7.626e-03:   0%|          | 638/300001 [6:06:41<2701:54:50, 32.49s/it]training loss: 7.626e-03:   0%|          | 639/300001 [6:07:14<2716:28:40, 32.67s/it]training loss: 7.626e-03:   0%|          | 640/300001 [6:07:47<2708:24:55, 32.57s/it]training loss: 7.198e-03:   0%|          | 640/300001 [6:08:18<2708:24:55, 32.57s/it]training loss: 7.198e-03:   0%|          | 641/300001 [6:08:18<2670:46:59, 32.12s/it]training loss: 7.198e-03:   0%|          | 642/300001 [6:08:51<2700:48:48, 32.48s/it]training loss: 7.198e-03:   0%|          | 643/300001 [6:09:23<2689:25:00, 32.34s/it]training loss: 7.198e-03:   0%|          | 644/300001 [6:09:55<2671:58:25, 32.13s/it]training loss: 7.198e-03:   0%|          | 645/300001 [6:10:27<2682:48:12, 32.26s/it]training loss: 7.198e-03:   0%|          | 646/300001 [6:11:01<2707:04:40, 32.55s/it]training loss: 7.198e-03:   0%|          | 647/300001 [6:11:33<2700:10:37, 32.47s/it]training loss: 7.198e-03:   0%|          | 648/300001 [6:12:05<2699:55:18, 32.47s/it]training loss: 7.198e-03:   0%|          | 649/300001 [6:12:37<2692:51:19, 32.38s/it]training loss: 7.198e-03:   0%|          | 650/300001 [6:13:11<2715:33:40, 32.66s/it]training loss: 7.198e-03:   0%|          | 651/300001 [6:13:43<2702:06:30, 32.50s/it]training loss: 7.198e-03:   0%|          | 652/300001 [6:14:16<2705:41:05, 32.54s/it]training loss: 7.198e-03:   0%|          | 653/300001 [6:14:48<2697:54:22, 32.45s/it]training loss: 7.198e-03:   0%|          | 654/300001 [6:15:20<2689:45:11, 32.35s/it]training loss: 7.198e-03:   0%|          | 655/300001 [6:15:52<2690:23:30, 32.36s/it]training loss: 7.198e-03:   0%|          | 656/300001 [6:16:24<2679:16:26, 32.22s/it]training loss: 7.198e-03:   0%|          | 657/300001 [6:16:56<2675:59:18, 32.18s/it]training loss: 7.198e-03:   0%|          | 658/300001 [6:17:30<2706:31:51, 32.55s/it]training loss: 7.198e-03:   0%|          | 659/300001 [6:18:02<2706:39:23, 32.55s/it]training loss: 7.198e-03:   0%|          | 660/300001 [6:18:33<2670:54:46, 32.12s/it]training loss: 8.114e-03:   0%|          | 660/300001 [6:19:06<2670:54:46, 32.12s/it]training loss: 8.114e-03:   0%|          | 661/300001 [6:19:06<2676:59:26, 32.19s/it]training loss: 8.114e-03:   0%|          | 662/300001 [6:19:37<2665:00:59, 32.05s/it]training loss: 8.114e-03:   0%|          | 663/300001 [6:20:08<2639:48:44, 31.75s/it]training loss: 8.114e-03:   0%|          | 664/300001 [6:20:40<2633:43:55, 31.67s/it]training loss: 8.114e-03:   0%|          | 665/300001 [6:21:13<2657:49:26, 31.96s/it]training loss: 8.114e-03:   0%|          | 666/300001 [6:21:46<2682:41:19, 32.26s/it]training loss: 8.114e-03:   0%|          | 667/300001 [6:22:17<2661:49:10, 32.01s/it]training loss: 8.114e-03:   0%|          | 668/300001 [6:22:50<2690:16:22, 32.36s/it]training loss: 8.114e-03:   0%|          | 669/300001 [6:23:22<2683:48:37, 32.28s/it]training loss: 8.114e-03:   0%|          | 670/300001 [6:23:54<2669:06:12, 32.10s/it]training loss: 8.114e-03:   0%|          | 671/300001 [6:24:26<2675:08:38, 32.17s/it]training loss: 8.114e-03:   0%|          | 672/300001 [6:24:59<2692:51:53, 32.39s/it]training loss: 8.114e-03:   0%|          | 673/300001 [6:25:33<2718:00:42, 32.69s/it]training loss: 8.114e-03:   0%|          | 674/300001 [6:26:05<2717:57:48, 32.69s/it]training loss: 8.114e-03:   0%|          | 675/300001 [6:26:38<2712:51:48, 32.63s/it]training loss: 8.114e-03:   0%|          | 676/300001 [6:27:09<2689:24:30, 32.35s/it]training loss: 8.114e-03:   0%|          | 677/300001 [6:27:41<2669:26:03, 32.11s/it]training loss: 8.114e-03:   0%|          | 678/300001 [6:28:13<2671:56:35, 32.14s/it]training loss: 8.114e-03:   0%|          | 679/300001 [6:28:45<2672:51:42, 32.15s/it]training loss: 8.114e-03:   0%|          | 680/300001 [6:29:18<2677:51:16, 32.21s/it]training loss: 8.454e-03:   0%|          | 680/300001 [6:29:49<2677:51:16, 32.21s/it]training loss: 8.454e-03:   0%|          | 681/300001 [6:29:49<2657:47:05, 31.97s/it]training loss: 8.454e-03:   0%|          | 682/300001 [6:30:21<2669:08:54, 32.10s/it]training loss: 8.454e-03:   0%|          | 683/300001 [6:30:53<2648:57:08, 31.86s/it]training loss: 8.454e-03:   0%|          | 684/300001 [6:31:25<2646:04:28, 31.83s/it]training loss: 8.454e-03:   0%|          | 685/300001 [6:31:57<2663:05:59, 32.03s/it]training loss: 8.454e-03:   0%|          | 686/300001 [6:32:28<2645:30:10, 31.82s/it]training loss: 8.454e-03:   0%|          | 687/300001 [6:32:59<2624:44:38, 31.57s/it]training loss: 8.454e-03:   0%|          | 688/300001 [6:33:32<2640:06:19, 31.75s/it]training loss: 8.454e-03:   0%|          | 689/300001 [6:34:03<2629:30:36, 31.63s/it]training loss: 8.454e-03:   0%|          | 690/300001 [6:34:35<2650:03:42, 31.87s/it]training loss: 8.454e-03:   0%|          | 691/300001 [6:35:09<2695:55:07, 32.43s/it]training loss: 8.454e-03:   0%|          | 692/300001 [6:35:42<2713:40:11, 32.64s/it]training loss: 8.454e-03:   0%|          | 693/300001 [6:36:14<2692:18:35, 32.38s/it]training loss: 8.454e-03:   0%|          | 694/300001 [6:36:48<2721:57:36, 32.74s/it]training loss: 8.454e-03:   0%|          | 695/300001 [6:37:20<2718:50:49, 32.70s/it]training loss: 8.454e-03:   0%|          | 696/300001 [6:37:54<2736:15:55, 32.91s/it]training loss: 8.454e-03:   0%|          | 697/300001 [6:38:27<2749:28:00, 33.07s/it]training loss: 8.454e-03:   0%|          | 698/300001 [6:38:59<2731:22:18, 32.85s/it]training loss: 8.454e-03:   0%|          | 699/300001 [6:39:32<2719:32:28, 32.71s/it]training loss: 8.454e-03:   0%|          | 700/300001 [6:40:04<2718:24:32, 32.70s/it]training loss: 7.659e-03:   0%|          | 700/300001 [6:40:37<2718:24:32, 32.70s/it]training loss: 7.659e-03:   0%|          | 701/300001 [6:40:37<2727:41:42, 32.81s/it]training loss: 7.659e-03:   0%|          | 702/300001 [6:41:09<2688:01:49, 32.33s/it]training loss: 7.659e-03:   0%|          | 703/300001 [6:41:40<2668:03:32, 32.09s/it]training loss: 7.659e-03:   0%|          | 704/300001 [6:42:12<2671:10:41, 32.13s/it]training loss: 7.659e-03:   0%|          | 705/300001 [6:42:45<2671:28:01, 32.13s/it]training loss: 7.659e-03:   0%|          | 706/300001 [6:43:17<2668:31:24, 32.10s/it]training loss: 7.659e-03:   0%|          | 707/300001 [6:43:49<2669:54:58, 32.11s/it]training loss: 7.659e-03:   0%|          | 708/300001 [6:44:22<2695:47:05, 32.43s/it]training loss: 7.659e-03:   0%|          | 709/300001 [6:44:53<2675:15:47, 32.18s/it]training loss: 7.659e-03:   0%|          | 710/300001 [6:45:26<2677:43:17, 32.21s/it]training loss: 7.659e-03:   0%|          | 711/300001 [6:45:59<2696:57:26, 32.44s/it]training loss: 7.659e-03:   0%|          | 712/300001 [6:46:30<2665:35:53, 32.06s/it]training loss: 7.659e-03:   0%|          | 713/300001 [6:47:03<2696:09:16, 32.43s/it]training loss: 7.659e-03:   0%|          | 714/300001 [6:47:36<2707:06:20, 32.56s/it]training loss: 7.659e-03:   0%|          | 715/300001 [6:48:08<2701:04:07, 32.49s/it]training loss: 7.659e-03:   0%|          | 716/300001 [6:48:39<2666:27:25, 32.07s/it]training loss: 7.659e-03:   0%|          | 717/300001 [6:49:13<2702:32:44, 32.51s/it]training loss: 7.659e-03:   0%|          | 718/300001 [6:49:46<2710:33:52, 32.60s/it]training loss: 7.659e-03:   0%|          | 719/300001 [6:50:18<2699:35:46, 32.47s/it]training loss: 7.659e-03:   0%|          | 720/300001 [6:50:51<2704:29:13, 32.53s/it]training loss: 7.829e-03:   0%|          | 720/300001 [6:51:23<2704:29:13, 32.53s/it]training loss: 7.829e-03:   0%|          | 721/300001 [6:51:23<2709:11:10, 32.59s/it]training loss: 7.829e-03:   0%|          | 722/300001 [6:51:56<2711:13:35, 32.61s/it]training loss: 7.829e-03:   0%|          | 723/300001 [6:52:28<2687:49:01, 32.33s/it]training loss: 7.829e-03:   0%|          | 724/300001 [6:53:00<2675:43:17, 32.19s/it]training loss: 7.829e-03:   0%|          | 725/300001 [6:53:32<2683:56:34, 32.29s/it]training loss: 7.829e-03:   0%|          | 726/300001 [6:54:05<2687:30:32, 32.33s/it]training loss: 7.829e-03:   0%|          | 727/300001 [6:54:36<2676:52:39, 32.20s/it]training loss: 7.829e-03:   0%|          | 728/300001 [6:55:08<2673:03:46, 32.15s/it]training loss: 7.829e-03:   0%|          | 729/300001 [6:55:41<2686:09:09, 32.31s/it]training loss: 7.829e-03:   0%|          | 730/300001 [6:56:12<2660:55:35, 32.01s/it]training loss: 7.829e-03:   0%|          | 731/300001 [6:56:44<2646:10:17, 31.83s/it]training loss: 7.829e-03:   0%|          | 732/300001 [6:57:16<2649:11:42, 31.87s/it]training loss: 7.829e-03:   0%|          | 733/300001 [6:57:49<2678:02:53, 32.22s/it]training loss: 7.829e-03:   0%|          | 734/300001 [6:58:21<2680:26:14, 32.24s/it]training loss: 7.829e-03:   0%|          | 735/300001 [6:58:54<2683:03:17, 32.28s/it]training loss: 7.829e-03:   0%|          | 736/300001 [6:59:26<2687:07:37, 32.32s/it]training loss: 7.829e-03:   0%|          | 737/300001 [6:59:59<2713:51:51, 32.65s/it]training loss: 7.829e-03:   0%|          | 738/300001 [7:00:32<2719:25:56, 32.71s/it]training loss: 7.829e-03:   0%|          | 739/300001 [7:01:05<2719:51:15, 32.72s/it]training loss: 7.829e-03:   0%|          | 740/300001 [7:01:38<2721:44:45, 32.74s/it]training loss: 7.182e-03:   0%|          | 740/300001 [7:02:09<2721:44:45, 32.74s/it]training loss: 7.182e-03:   0%|          | 741/300001 [7:02:09<2684:26:57, 32.29s/it]training loss: 7.182e-03:   0%|          | 742/300001 [7:02:41<2667:32:15, 32.09s/it]training loss: 7.182e-03:   0%|          | 743/300001 [7:03:13<2671:15:40, 32.13s/it]training loss: 7.182e-03:   0%|          | 744/300001 [7:03:45<2676:19:57, 32.20s/it]training loss: 7.182e-03:   0%|          | 745/300001 [7:04:18<2682:49:57, 32.27s/it]training loss: 7.182e-03:   0%|          | 746/300001 [7:04:50<2688:29:44, 32.34s/it]training loss: 7.182e-03:   0%|          | 747/300001 [7:05:22<2687:12:26, 32.33s/it]training loss: 7.182e-03:   0%|          | 748/300001 [7:05:55<2695:01:29, 32.42s/it]training loss: 7.182e-03:   0%|          | 749/300001 [7:06:28<2709:40:37, 32.60s/it]training loss: 7.182e-03:   0%|          | 750/300001 [7:07:01<2707:48:50, 32.58s/it]training loss: 7.182e-03:   0%|          | 751/300001 [7:07:33<2705:31:06, 32.55s/it]training loss: 7.182e-03:   0%|          | 752/300001 [7:08:06<2710:59:11, 32.61s/it]training loss: 7.182e-03:   0%|          | 753/300001 [7:08:39<2723:04:39, 32.76s/it]training loss: 7.182e-03:   0%|          | 754/300001 [7:09:11<2704:27:29, 32.54s/it]training loss: 7.182e-03:   0%|          | 755/300001 [7:09:42<2673:57:52, 32.17s/it]training loss: 7.182e-03:   0%|          | 756/300001 [7:10:13<2631:11:36, 31.65s/it]training loss: 7.182e-03:   0%|          | 757/300001 [7:10:45<2647:21:39, 31.85s/it]training loss: 7.182e-03:   0%|          | 758/300001 [7:11:17<2642:07:31, 31.79s/it]training loss: 7.182e-03:   0%|          | 759/300001 [7:11:50<2679:02:32, 32.23s/it]training loss: 7.182e-03:   0%|          | 760/300001 [7:12:22<2683:27:13, 32.28s/it]training loss: 7.122e-03:   0%|          | 760/300001 [7:12:54<2683:27:13, 32.28s/it]training loss: 7.122e-03:   0%|          | 761/300001 [7:12:55<2680:39:46, 32.25s/it]training loss: 7.122e-03:   0%|          | 762/300001 [7:13:27<2679:40:44, 32.24s/it]training loss: 7.122e-03:   0%|          | 763/300001 [7:14:02<2754:03:28, 33.13s/it]training loss: 7.122e-03:   0%|          | 764/300001 [7:14:34<2716:40:57, 32.68s/it]training loss: 7.122e-03:   0%|          | 765/300001 [7:15:07<2743:23:03, 33.00s/it]training loss: 7.122e-03:   0%|          | 766/300001 [7:15:40<2741:31:33, 32.98s/it]training loss: 7.122e-03:   0%|          | 767/300001 [7:16:14<2759:27:27, 33.20s/it]training loss: 7.122e-03:   0%|          | 768/300001 [7:16:45<2712:26:41, 32.63s/it]training loss: 7.122e-03:   0%|          | 769/300001 [7:17:19<2737:08:13, 32.93s/it]training loss: 7.122e-03:   0%|          | 770/300001 [7:17:52<2731:32:51, 32.86s/it]training loss: 7.122e-03:   0%|          | 771/300001 [7:18:24<2726:30:54, 32.80s/it]training loss: 7.122e-03:   0%|          | 772/300001 [7:18:56<2703:38:41, 32.53s/it]training loss: 7.122e-03:   0%|          | 773/300001 [7:19:29<2715:16:07, 32.67s/it]training loss: 7.122e-03:   0%|          | 774/300001 [7:20:02<2729:00:40, 32.83s/it]training loss: 7.122e-03:   0%|          | 775/300001 [7:20:34<2696:36:30, 32.44s/it]training loss: 7.122e-03:   0%|          | 776/300001 [7:21:06<2689:42:36, 32.36s/it]training loss: 7.122e-03:   0%|          | 777/300001 [7:21:40<2734:45:50, 32.90s/it]training loss: 7.122e-03:   0%|          | 778/300001 [7:22:13<2720:39:20, 32.73s/it]training loss: 7.122e-03:   0%|          | 779/300001 [7:22:44<2695:31:51, 32.43s/it]training loss: 7.122e-03:   0%|          | 780/300001 [7:23:17<2691:53:34, 32.39s/it]training loss: 7.272e-03:   0%|          | 780/300001 [7:23:50<2691:53:34, 32.39s/it]training loss: 7.272e-03:   0%|          | 781/300001 [7:23:50<2710:39:30, 32.61s/it]training loss: 7.272e-03:   0%|          | 782/300001 [7:24:22<2701:51:02, 32.51s/it]training loss: 7.272e-03:   0%|          | 783/300001 [7:24:53<2666:55:18, 32.09s/it]training loss: 7.272e-03:   0%|          | 784/300001 [7:25:26<2687:12:14, 32.33s/it]training loss: 7.272e-03:   0%|          | 785/300001 [7:25:48<2429:32:12, 29.23s/it]training loss: 7.272e-03:   0%|          | 786/300001 [7:26:20<2492:45:17, 29.99s/it]training loss: 7.272e-03:   0%|          | 787/300001 [7:26:53<2575:17:38, 30.98s/it]training loss: 7.272e-03:   0%|          | 788/300001 [7:27:25<2601:44:46, 31.30s/it]training loss: 7.272e-03:   0%|          | 789/300001 [7:27:58<2639:47:00, 31.76s/it]training loss: 7.272e-03:   0%|          | 790/300001 [7:28:31<2665:41:25, 32.07s/it]training loss: 7.272e-03:   0%|          | 791/300001 [7:29:03<2668:43:38, 32.11s/it]training loss: 7.272e-03:   0%|          | 792/300001 [7:29:36<2693:43:49, 32.41s/it]training loss: 7.272e-03:   0%|          | 793/300001 [7:30:08<2694:18:56, 32.42s/it]training loss: 7.272e-03:   0%|          | 794/300001 [7:30:41<2691:59:41, 32.39s/it]training loss: 7.272e-03:   0%|          | 795/300001 [7:31:14<2702:05:12, 32.51s/it]training loss: 7.272e-03:   0%|          | 796/300001 [7:31:46<2695:15:49, 32.43s/it]training loss: 7.272e-03:   0%|          | 797/300001 [7:32:19<2714:12:15, 32.66s/it]training loss: 7.272e-03:   0%|          | 798/300001 [7:32:50<2672:11:52, 32.15s/it]training loss: 7.272e-03:   0%|          | 799/300001 [7:33:23<2695:31:08, 32.43s/it]training loss: 7.272e-03:   0%|          | 800/300001 [7:33:55<2689:35:19, 32.36s/it]training loss: 6.817e-03:   0%|          | 800/300001 [7:34:28<2689:35:19, 32.36s/it]training loss: 6.817e-03:   0%|          | 801/300001 [7:34:28<2693:32:54, 32.41s/it]training loss: 6.817e-03:   0%|          | 802/300001 [7:35:00<2685:15:33, 32.31s/it]training loss: 6.817e-03:   0%|          | 803/300001 [7:35:32<2689:04:34, 32.36s/it]training loss: 6.817e-03:   0%|          | 804/300001 [7:36:05<2689:34:40, 32.36s/it]training loss: 6.817e-03:   0%|          | 805/300001 [7:36:37<2693:08:30, 32.40s/it]training loss: 6.817e-03:   0%|          | 806/300001 [7:37:09<2667:21:28, 32.09s/it]training loss: 6.817e-03:   0%|          | 807/300001 [7:37:41<2681:47:15, 32.27s/it]training loss: 6.817e-03:   0%|          | 808/300001 [7:38:13<2680:06:44, 32.25s/it]training loss: 6.817e-03:   0%|          | 809/300001 [7:38:46<2679:45:12, 32.24s/it]training loss: 6.817e-03:   0%|          | 810/300001 [7:39:19<2706:30:47, 32.57s/it]training loss: 6.817e-03:   0%|          | 811/300001 [7:39:52<2720:25:24, 32.73s/it]training loss: 6.817e-03:   0%|          | 812/300001 [7:40:24<2708:42:38, 32.59s/it]training loss: 6.817e-03:   0%|          | 813/300001 [7:40:57<2713:23:21, 32.65s/it]training loss: 6.817e-03:   0%|          | 814/300001 [7:41:29<2695:14:04, 32.43s/it]training loss: 6.817e-03:   0%|          | 815/300001 [7:42:02<2717:54:40, 32.70s/it]training loss: 6.817e-03:   0%|          | 816/300001 [7:42:34<2693:26:19, 32.41s/it]training loss: 6.817e-03:   0%|          | 817/300001 [7:43:06<2667:51:38, 32.10s/it]training loss: 6.817e-03:   0%|          | 818/300001 [7:43:39<2694:59:51, 32.43s/it]training loss: 6.817e-03:   0%|          | 819/300001 [7:44:12<2706:03:28, 32.56s/it]training loss: 6.817e-03:   0%|          | 820/300001 [7:44:45<2725:36:03, 32.80s/it]training loss: 8.380e-03:   0%|          | 820/300001 [7:45:17<2725:36:03, 32.80s/it]training loss: 8.380e-03:   0%|          | 821/300001 [7:45:17<2703:32:41, 32.53s/it]training loss: 8.380e-03:   0%|          | 822/300001 [7:45:49<2687:05:14, 32.33s/it]training loss: 8.380e-03:   0%|          | 823/300001 [7:46:21<2677:37:45, 32.22s/it]training loss: 8.380e-03:   0%|          | 824/300001 [7:46:53<2683:58:26, 32.30s/it]training loss: 8.380e-03:   0%|          | 825/300001 [7:47:26<2684:44:46, 32.31s/it]training loss: 8.380e-03:   0%|          | 826/300001 [7:47:57<2676:03:00, 32.20s/it]training loss: 8.380e-03:   0%|          | 827/300001 [7:48:29<2655:24:44, 31.95s/it]training loss: 8.380e-03:   0%|          | 828/300001 [7:49:01<2668:39:36, 32.11s/it]training loss: 8.380e-03:   0%|          | 829/300001 [7:49:34<2675:51:24, 32.20s/it]training loss: 8.380e-03:   0%|          | 830/300001 [7:50:05<2654:27:52, 31.94s/it]training loss: 8.380e-03:   0%|          | 831/300001 [7:50:37<2648:06:03, 31.87s/it]training loss: 8.380e-03:   0%|          | 832/300001 [7:51:11<2708:20:51, 32.59s/it]training loss: 8.380e-03:   0%|          | 833/300001 [7:51:44<2722:07:56, 32.76s/it]training loss: 8.380e-03:   0%|          | 834/300001 [7:52:16<2710:50:18, 32.62s/it]training loss: 8.380e-03:   0%|          | 835/300001 [7:52:48<2677:35:20, 32.22s/it]training loss: 8.380e-03:   0%|          | 836/300001 [7:53:21<2694:16:30, 32.42s/it]training loss: 8.380e-03:   0%|          | 837/300001 [7:53:54<2706:07:09, 32.56s/it]training loss: 8.380e-03:   0%|          | 838/300001 [7:54:27<2715:42:46, 32.68s/it]training loss: 8.380e-03:   0%|          | 839/300001 [7:54:58<2688:09:15, 32.35s/it]training loss: 8.380e-03:   0%|          | 840/300001 [7:55:31<2694:21:49, 32.42s/it]training loss: 6.932e-03:   0%|          | 840/300001 [7:56:04<2694:21:49, 32.42s/it]training loss: 6.932e-03:   0%|          | 841/300001 [7:56:04<2720:15:59, 32.73s/it]training loss: 6.932e-03:   0%|          | 842/300001 [7:56:37<2722:33:23, 32.76s/it]training loss: 6.932e-03:   0%|          | 843/300001 [7:57:12<2774:44:13, 33.39s/it]training loss: 6.932e-03:   0%|          | 844/300001 [7:57:44<2743:45:01, 33.02s/it]training loss: 6.932e-03:   0%|          | 845/300001 [7:58:17<2739:45:51, 32.97s/it]training loss: 6.932e-03:   0%|          | 846/300001 [7:58:50<2733:24:02, 32.89s/it]training loss: 6.932e-03:   0%|          | 847/300001 [7:59:22<2713:16:22, 32.65s/it]training loss: 6.932e-03:   0%|          | 848/300001 [7:59:54<2708:06:17, 32.59s/it]training loss: 6.932e-03:   0%|          | 849/300001 [8:00:25<2672:25:29, 32.16s/it]training loss: 6.932e-03:   0%|          | 850/300001 [8:00:58<2681:58:53, 32.28s/it]training loss: 6.932e-03:   0%|          | 851/300001 [8:01:31<2706:00:58, 32.56s/it]training loss: 6.932e-03:   0%|          | 852/300001 [8:02:04<2718:28:31, 32.71s/it]training loss: 6.932e-03:   0%|          | 853/300001 [8:02:36<2697:49:04, 32.47s/it]training loss: 6.932e-03:   0%|          | 854/300001 [8:03:09<2702:00:16, 32.52s/it]training loss: 6.932e-03:   0%|          | 855/300001 [8:03:42<2713:57:39, 32.66s/it]training loss: 6.932e-03:   0%|          | 856/300001 [8:04:14<2707:23:19, 32.58s/it]training loss: 6.932e-03:   0%|          | 857/300001 [8:04:46<2700:35:03, 32.50s/it]training loss: 6.932e-03:   0%|          | 858/300001 [8:05:19<2714:42:59, 32.67s/it]training loss: 6.932e-03:   0%|          | 859/300001 [8:05:51<2699:56:57, 32.49s/it]training loss: 6.932e-03:   0%|          | 860/300001 [8:06:25<2714:27:38, 32.67s/it]training loss: 7.668e-03:   0%|          | 860/300001 [8:06:58<2714:27:38, 32.67s/it]training loss: 7.668e-03:   0%|          | 861/300001 [8:06:58<2735:51:41, 32.92s/it]training loss: 7.668e-03:   0%|          | 862/300001 [8:07:30<2713:13:13, 32.65s/it]training loss: 7.668e-03:   0%|          | 863/300001 [8:08:02<2697:55:43, 32.47s/it]training loss: 7.668e-03:   0%|          | 864/300001 [8:08:35<2713:44:29, 32.66s/it]training loss: 7.668e-03:   0%|          | 865/300001 [8:09:07<2697:59:33, 32.47s/it]training loss: 7.668e-03:   0%|          | 866/300001 [8:09:39<2685:02:08, 32.31s/it]training loss: 7.668e-03:   0%|          | 867/300001 [8:10:13<2710:32:02, 32.62s/it]training loss: 7.668e-03:   0%|          | 868/300001 [8:10:44<2678:33:09, 32.24s/it]training loss: 7.668e-03:   0%|          | 869/300001 [8:11:16<2671:24:58, 32.15s/it]training loss: 7.668e-03:   0%|          | 870/300001 [8:11:49<2686:33:43, 32.33s/it]training loss: 7.668e-03:   0%|          | 871/300001 [8:12:21<2681:34:44, 32.27s/it]training loss: 7.668e-03:   0%|          | 872/300001 [8:12:53<2687:29:42, 32.34s/it]training loss: 7.668e-03:   0%|          | 873/300001 [8:13:25<2663:05:12, 32.05s/it]training loss: 7.668e-03:   0%|          | 874/300001 [8:13:56<2652:05:31, 31.92s/it]training loss: 7.668e-03:   0%|          | 875/300001 [8:14:28<2659:02:02, 32.00s/it]training loss: 7.668e-03:   0%|          | 876/300001 [8:15:01<2678:59:35, 32.24s/it]training loss: 7.668e-03:   0%|          | 877/300001 [8:15:33<2675:13:59, 32.20s/it]training loss: 7.668e-03:   0%|          | 878/300001 [8:16:06<2676:05:34, 32.21s/it]training loss: 7.668e-03:   0%|          | 879/300001 [8:16:37<2652:01:01, 31.92s/it]training loss: 7.668e-03:   0%|          | 880/300001 [8:17:09<2665:11:38, 32.08s/it]training loss: 7.367e-03:   0%|          | 880/300001 [8:17:43<2665:11:38, 32.08s/it]training loss: 7.367e-03:   0%|          | 881/300001 [8:17:43<2706:58:09, 32.58s/it]training loss: 7.367e-03:   0%|          | 882/300001 [8:18:17<2732:57:13, 32.89s/it]training loss: 7.367e-03:   0%|          | 883/300001 [8:18:49<2717:32:55, 32.71s/it]training loss: 7.367e-03:   0%|          | 884/300001 [8:19:21<2700:34:11, 32.50s/it]training loss: 7.367e-03:   0%|          | 885/300001 [8:19:54<2710:02:02, 32.62s/it]training loss: 7.367e-03:   0%|          | 886/300001 [8:20:25<2664:23:21, 32.07s/it]training loss: 7.367e-03:   0%|          | 887/300001 [8:20:57<2665:55:57, 32.09s/it]training loss: 7.367e-03:   0%|          | 888/300001 [8:21:29<2667:18:48, 32.10s/it]training loss: 7.367e-03:   0%|          | 889/300001 [8:22:01<2681:11:24, 32.27s/it]training loss: 7.367e-03:   0%|          | 890/300001 [8:22:33<2660:37:19, 32.02s/it]training loss: 7.367e-03:   0%|          | 891/300001 [8:23:06<2674:35:17, 32.19s/it]training loss: 7.367e-03:   0%|          | 892/300001 [8:23:38<2682:11:41, 32.28s/it]training loss: 7.367e-03:   0%|          | 893/300001 [8:24:12<2719:10:40, 32.73s/it]training loss: 7.367e-03:   0%|          | 894/300001 [8:24:45<2730:15:53, 32.86s/it]training loss: 7.367e-03:   0%|          | 895/300001 [8:25:17<2705:31:00, 32.56s/it]training loss: 7.367e-03:   0%|          | 896/300001 [8:25:48<2681:36:10, 32.28s/it]training loss: 7.367e-03:   0%|          | 897/300001 [8:26:20<2661:18:46, 32.03s/it]training loss: 7.367e-03:   0%|          | 898/300001 [8:26:53<2699:15:54, 32.49s/it]training loss: 7.367e-03:   0%|          | 899/300001 [8:27:26<2692:49:14, 32.41s/it]training loss: 7.367e-03:   0%|          | 900/300001 [8:27:58<2689:09:36, 32.37s/it]training loss: 6.462e-03:   0%|          | 900/300001 [8:28:30<2689:09:36, 32.37s/it]training loss: 6.462e-03:   0%|          | 901/300001 [8:28:30<2685:26:00, 32.32s/it]training loss: 6.462e-03:   0%|          | 902/300001 [8:29:02<2682:58:04, 32.29s/it]training loss: 6.462e-03:   0%|          | 903/300001 [8:29:35<2679:14:43, 32.25s/it]training loss: 6.462e-03:   0%|          | 904/300001 [8:30:07<2687:53:59, 32.35s/it]training loss: 6.462e-03:   0%|          | 905/300001 [8:30:39<2687:57:45, 32.35s/it]training loss: 6.462e-03:   0%|          | 906/300001 [8:31:12<2683:46:35, 32.30s/it]training loss: 6.462e-03:   0%|          | 907/300001 [8:31:44<2680:35:18, 32.26s/it]training loss: 6.462e-03:   0%|          | 908/300001 [8:32:16<2689:02:20, 32.37s/it]training loss: 6.462e-03:   0%|          | 909/300001 [8:32:49<2682:45:04, 32.29s/it]training loss: 6.462e-03:   0%|          | 910/300001 [8:33:21<2674:57:18, 32.20s/it]training loss: 6.462e-03:   0%|          | 911/300001 [8:33:54<2700:26:33, 32.50s/it]training loss: 6.462e-03:   0%|          | 912/300001 [8:34:25<2669:38:09, 32.13s/it]training loss: 6.462e-03:   0%|          | 913/300001 [8:34:57<2665:41:55, 32.09s/it]training loss: 6.462e-03:   0%|          | 914/300001 [8:35:30<2698:39:45, 32.48s/it]training loss: 6.462e-03:   0%|          | 915/300001 [8:36:04<2716:19:50, 32.70s/it]training loss: 6.462e-03:   0%|          | 916/300001 [8:36:36<2702:10:52, 32.53s/it]training loss: 6.462e-03:   0%|          | 917/300001 [8:37:08<2685:26:56, 32.32s/it]training loss: 6.462e-03:   0%|          | 918/300001 [8:37:38<2643:29:01, 31.82s/it]training loss: 6.462e-03:   0%|          | 919/300001 [8:38:10<2644:31:53, 31.83s/it]training loss: 6.462e-03:   0%|          | 920/300001 [8:38:43<2667:17:16, 32.11s/it]training loss: 6.883e-03:   0%|          | 920/300001 [8:39:15<2667:17:16, 32.11s/it]training loss: 6.883e-03:   0%|          | 921/300001 [8:39:15<2670:18:47, 32.14s/it]training loss: 6.883e-03:   0%|          | 922/300001 [8:39:48<2689:31:45, 32.37s/it]training loss: 6.883e-03:   0%|          | 923/300001 [8:40:19<2658:27:14, 32.00s/it]training loss: 6.883e-03:   0%|          | 924/300001 [8:40:52<2672:13:02, 32.17s/it]training loss: 6.883e-03:   0%|          | 925/300001 [8:41:24<2680:26:59, 32.26s/it]training loss: 6.883e-03:   0%|          | 926/300001 [8:41:56<2671:50:50, 32.16s/it]training loss: 6.883e-03:   0%|          | 927/300001 [8:42:28<2677:37:22, 32.23s/it]training loss: 6.883e-03:   0%|          | 928/300001 [8:43:01<2674:17:53, 32.19s/it]training loss: 6.883e-03:   0%|          | 929/300001 [8:43:32<2655:30:36, 31.96s/it]training loss: 6.883e-03:   0%|          | 930/300001 [8:44:05<2672:02:28, 32.16s/it]training loss: 6.883e-03:   0%|          | 931/300001 [8:44:37<2676:10:25, 32.21s/it]training loss: 6.883e-03:   0%|          | 932/300001 [8:45:09<2671:14:07, 32.15s/it]training loss: 6.883e-03:   0%|          | 933/300001 [8:45:42<2703:10:47, 32.54s/it]training loss: 6.883e-03:   0%|          | 934/300001 [8:46:14<2683:41:54, 32.30s/it]training loss: 6.883e-03:   0%|          | 935/300001 [8:46:46<2668:22:37, 32.12s/it]training loss: 6.883e-03:   0%|          | 936/300001 [8:47:19<2693:46:25, 32.43s/it]training loss: 6.883e-03:   0%|          | 937/300001 [8:47:52<2710:23:24, 32.63s/it]training loss: 6.883e-03:   0%|          | 938/300001 [8:48:25<2722:22:41, 32.77s/it]training loss: 6.883e-03:   0%|          | 939/300001 [8:48:58<2723:10:06, 32.78s/it]training loss: 6.883e-03:   0%|          | 940/300001 [8:49:32<2745:27:43, 33.05s/it]training loss: 7.860e-03:   0%|          | 940/300001 [8:50:04<2745:27:43, 33.05s/it]training loss: 7.860e-03:   0%|          | 941/300001 [8:50:04<2719:32:00, 32.74s/it]training loss: 7.860e-03:   0%|          | 942/300001 [8:50:26<2450:21:35, 29.50s/it]training loss: 7.860e-03:   0%|          | 943/300001 [8:50:58<2516:39:14, 30.29s/it]training loss: 7.860e-03:   0%|          | 944/300001 [8:51:32<2602:38:43, 31.33s/it]training loss: 7.860e-03:   0%|          | 945/300001 [8:52:04<2631:40:00, 31.68s/it]training loss: 7.860e-03:   0%|          | 946/300001 [8:52:35<2615:29:03, 31.48s/it]training loss: 7.860e-03:   0%|          | 947/300001 [8:53:07<2634:13:33, 31.71s/it]training loss: 7.860e-03:   0%|          | 948/300001 [8:53:40<2665:34:27, 32.09s/it]training loss: 7.860e-03:   0%|          | 949/300001 [8:54:13<2677:49:31, 32.24s/it]training loss: 7.860e-03:   0%|          | 950/300001 [8:54:45<2678:45:15, 32.25s/it]training loss: 7.860e-03:   0%|          | 951/300001 [8:55:16<2648:47:35, 31.89s/it]training loss: 7.860e-03:   0%|          | 952/300001 [8:55:48<2649:22:13, 31.89s/it]training loss: 7.860e-03:   0%|          | 953/300001 [8:56:20<2649:37:51, 31.90s/it]training loss: 7.860e-03:   0%|          | 954/300001 [8:56:53<2680:36:44, 32.27s/it]training loss: 7.860e-03:   0%|          | 955/300001 [8:57:26<2692:36:08, 32.41s/it]training loss: 7.860e-03:   0%|          | 956/300001 [8:57:59<2703:10:58, 32.54s/it]training loss: 7.860e-03:   0%|          | 957/300001 [8:58:32<2725:10:13, 32.81s/it]training loss: 7.860e-03:   0%|          | 958/300001 [8:59:04<2705:52:21, 32.57s/it]training loss: 7.860e-03:   0%|          | 959/300001 [8:59:38<2745:11:20, 33.05s/it]training loss: 7.860e-03:   0%|          | 960/300001 [9:00:11<2735:32:54, 32.93s/it]training loss: 7.030e-03:   0%|          | 960/300001 [9:00:44<2735:32:54, 32.93s/it]training loss: 7.030e-03:   0%|          | 961/300001 [9:00:44<2734:08:09, 32.91s/it]training loss: 7.030e-03:   0%|          | 962/300001 [9:01:16<2719:50:44, 32.74s/it]training loss: 7.030e-03:   0%|          | 963/300001 [9:01:48<2695:53:09, 32.45s/it]training loss: 7.030e-03:   0%|          | 964/300001 [9:02:19<2662:45:39, 32.06s/it]training loss: 7.030e-03:   0%|          | 965/300001 [9:02:53<2699:40:34, 32.50s/it]training loss: 7.030e-03:   0%|          | 966/300001 [9:03:25<2704:54:57, 32.56s/it]training loss: 7.030e-03:   0%|          | 967/300001 [9:03:57<2681:32:44, 32.28s/it]training loss: 7.030e-03:   0%|          | 968/300001 [9:04:29<2681:27:14, 32.28s/it]training loss: 7.030e-03:   0%|          | 969/300001 [9:05:01<2674:03:36, 32.19s/it]training loss: 7.030e-03:   0%|          | 970/300001 [9:05:33<2659:36:38, 32.02s/it]training loss: 7.030e-03:   0%|          | 971/300001 [9:06:06<2677:50:52, 32.24s/it]training loss: 7.030e-03:   0%|          | 972/300001 [9:06:38<2679:28:41, 32.26s/it]training loss: 7.030e-03:   0%|          | 973/300001 [9:07:12<2717:41:07, 32.72s/it]training loss: 7.030e-03:   0%|          | 974/300001 [9:07:44<2719:10:47, 32.74s/it]training loss: 7.030e-03:   0%|          | 975/300001 [9:08:17<2702:44:59, 32.54s/it]training loss: 7.030e-03:   0%|          | 976/300001 [9:08:49<2709:30:57, 32.62s/it]training loss: 7.030e-03:   0%|          | 977/300001 [9:09:22<2704:35:05, 32.56s/it]training loss: 7.030e-03:   0%|          | 978/300001 [9:09:54<2706:39:43, 32.59s/it]training loss: 7.030e-03:   0%|          | 979/300001 [9:10:26<2685:18:39, 32.33s/it]training loss: 7.030e-03:   0%|          | 980/300001 [9:10:58<2665:26:52, 32.09s/it]training loss: 8.535e-03:   0%|          | 980/300001 [9:11:31<2665:26:52, 32.09s/it]training loss: 8.535e-03:   0%|          | 981/300001 [9:11:31<2691:06:47, 32.40s/it]training loss: 8.535e-03:   0%|          | 982/300001 [9:12:02<2668:13:21, 32.12s/it]training loss: 8.535e-03:   0%|          | 983/300001 [9:12:35<2694:17:55, 32.44s/it]training loss: 8.535e-03:   0%|          | 984/300001 [9:13:07<2660:09:49, 32.03s/it]training loss: 8.535e-03:   0%|          | 985/300001 [9:13:40<2691:19:28, 32.40s/it]training loss: 8.535e-03:   0%|          | 986/300001 [9:14:12<2698:02:31, 32.48s/it]training loss: 8.535e-03:   0%|          | 987/300001 [9:14:45<2701:55:08, 32.53s/it]training loss: 8.535e-03:   0%|          | 988/300001 [9:15:18<2701:38:37, 32.53s/it]training loss: 8.535e-03:   0%|          | 989/300001 [9:15:50<2690:15:24, 32.39s/it]training loss: 8.535e-03:   0%|          | 990/300001 [9:16:23<2711:08:57, 32.64s/it]training loss: 8.535e-03:   0%|          | 991/300001 [9:16:56<2711:12:41, 32.64s/it]training loss: 8.535e-03:   0%|          | 992/300001 [9:17:28<2706:47:39, 32.59s/it]training loss: 8.535e-03:   0%|          | 993/300001 [9:18:00<2696:50:41, 32.47s/it]training loss: 8.535e-03:   0%|          | 994/300001 [9:18:33<2696:49:41, 32.47s/it]training loss: 8.535e-03:   0%|          | 995/300001 [9:19:05<2684:42:36, 32.32s/it]training loss: 8.535e-03:   0%|          | 996/300001 [9:19:37<2689:48:50, 32.39s/it]training loss: 8.535e-03:   0%|          | 997/300001 [9:20:09<2686:24:07, 32.34s/it]training loss: 8.535e-03:   0%|          | 998/300001 [9:20:41<2660:16:16, 32.03s/it]training loss: 8.535e-03:   0%|          | 999/300001 [9:21:15<2703:26:03, 32.55s/it]training loss: 8.535e-03:   0%|          | 1000/300001 [9:21:47<2697:34:37, 32.48s/it]training loss: 6.867e-03:   0%|          | 1000/300001 [9:22:19<2697:34:37, 32.48s/it]training loss: 6.867e-03:   0%|          | 1001/300001 [9:22:23<2781:34:46, 33.49s/it]training loss: 6.867e-03:   0%|          | 1002/300001 [9:22:54<2726:12:29, 32.82s/it]training loss: 6.867e-03:   0%|          | 1003/300001 [9:23:27<2719:34:36, 32.74s/it]training loss: 6.867e-03:   0%|          | 1004/300001 [9:23:58<2693:22:09, 32.43s/it]training loss: 6.867e-03:   0%|          | 1005/300001 [9:24:29<2664:21:42, 32.08s/it]training loss: 6.867e-03:   0%|          | 1006/300001 [9:25:03<2699:06:17, 32.50s/it]training loss: 6.867e-03:   0%|          | 1007/300001 [9:25:35<2692:43:14, 32.42s/it]training loss: 6.867e-03:   0%|          | 1008/300001 [9:26:07<2680:03:27, 32.27s/it]training loss: 6.867e-03:   0%|          | 1009/300001 [9:26:39<2673:27:50, 32.19s/it]training loss: 6.867e-03:   0%|          | 1010/300001 [9:27:11<2663:54:05, 32.07s/it]training loss: 6.867e-03:   0%|          | 1011/300001 [9:27:44<2681:14:31, 32.28s/it]training loss: 6.867e-03:   0%|          | 1012/300001 [9:28:16<2693:59:06, 32.44s/it]training loss: 6.867e-03:   0%|          | 1013/300001 [9:28:49<2688:03:09, 32.37s/it]training loss: 6.867e-03:   0%|          | 1014/300001 [9:29:22<2702:06:20, 32.54s/it]training loss: 6.867e-03:   0%|          | 1015/300001 [9:29:54<2691:19:04, 32.41s/it]training loss: 6.867e-03:   0%|          | 1016/300001 [9:30:25<2671:11:17, 32.16s/it]training loss: 6.867e-03:   0%|          | 1017/300001 [9:30:58<2673:58:33, 32.20s/it]training loss: 6.867e-03:   0%|          | 1018/300001 [9:31:29<2663:11:44, 32.07s/it]training loss: 6.867e-03:   0%|          | 1019/300001 [9:32:02<2665:41:57, 32.10s/it]training loss: 6.867e-03:   0%|          | 1020/300001 [9:32:34<2670:25:18, 32.15s/it]training loss: 7.214e-03:   0%|          | 1020/300001 [9:33:06<2670:25:18, 32.15s/it]training loss: 7.214e-03:   0%|          | 1021/300001 [9:33:06<2680:01:43, 32.27s/it]training loss: 7.214e-03:   0%|          | 1022/300001 [9:33:38<2676:36:01, 32.23s/it]training loss: 7.214e-03:   0%|          | 1023/300001 [9:34:12<2696:52:07, 32.47s/it]training loss: 7.214e-03:   0%|          | 1024/300001 [9:34:44<2698:39:43, 32.49s/it]training loss: 7.214e-03:   0%|          | 1025/300001 [9:35:16<2695:10:58, 32.45s/it]training loss: 7.214e-03:   0%|          | 1026/300001 [9:35:49<2706:16:58, 32.59s/it]training loss: 7.214e-03:   0%|          | 1027/300001 [9:36:22<2699:56:45, 32.51s/it]training loss: 7.214e-03:   0%|          | 1028/300001 [9:36:54<2693:11:52, 32.43s/it]training loss: 7.214e-03:   0%|          | 1029/300001 [9:37:28<2735:26:50, 32.94s/it]training loss: 7.214e-03:   0%|          | 1030/300001 [9:38:00<2712:38:46, 32.66s/it]training loss: 7.214e-03:   0%|          | 1031/300001 [9:38:32<2707:17:48, 32.60s/it]training loss: 7.214e-03:   0%|          | 1032/300001 [9:39:06<2724:00:29, 32.80s/it]training loss: 7.214e-03:   0%|          | 1033/300001 [9:39:38<2705:06:55, 32.57s/it]training loss: 7.214e-03:   0%|          | 1034/300001 [9:40:12<2743:49:47, 33.04s/it]training loss: 7.214e-03:   0%|          | 1035/300001 [9:40:46<2778:27:34, 33.46s/it]training loss: 7.214e-03:   0%|          | 1036/300001 [9:41:18<2734:37:20, 32.93s/it]training loss: 7.214e-03:   0%|          | 1037/300001 [9:41:52<2751:58:44, 33.14s/it]training loss: 7.214e-03:   0%|          | 1038/300001 [9:42:25<2766:46:06, 33.32s/it]training loss: 7.214e-03:   0%|          | 1039/300001 [9:42:58<2756:30:41, 33.19s/it]training loss: 7.214e-03:   0%|          | 1040/300001 [9:43:30<2709:30:10, 32.63s/it]training loss: 6.844e-03:   0%|          | 1040/300001 [9:44:02<2709:30:10, 32.63s/it]training loss: 6.844e-03:   0%|          | 1041/300001 [9:44:02<2709:07:27, 32.62s/it]training loss: 6.844e-03:   0%|          | 1042/300001 [9:44:35<2715:58:23, 32.71s/it]training loss: 6.844e-03:   0%|          | 1043/300001 [9:45:09<2735:05:35, 32.94s/it]training loss: 6.844e-03:   0%|          | 1044/300001 [9:45:42<2744:31:18, 33.05s/it]training loss: 6.844e-03:   0%|          | 1045/300001 [9:46:14<2731:43:33, 32.90s/it]training loss: 6.844e-03:   0%|          | 1046/300001 [9:46:47<2720:34:40, 32.76s/it]training loss: 6.844e-03:   0%|          | 1047/300001 [9:47:18<2683:36:37, 32.32s/it]training loss: 6.844e-03:   0%|          | 1048/300001 [9:47:50<2680:52:30, 32.28s/it]training loss: 6.844e-03:   0%|          | 1049/300001 [9:48:22<2667:01:33, 32.12s/it]training loss: 6.844e-03:   0%|          | 1050/300001 [9:48:56<2702:11:47, 32.54s/it]training loss: 6.844e-03:   0%|          | 1051/300001 [9:49:28<2695:34:11, 32.46s/it]training loss: 6.844e-03:   0%|          | 1052/300001 [9:50:01<2722:52:11, 32.79s/it]training loss: 6.844e-03:   0%|          | 1053/300001 [9:50:34<2715:12:32, 32.70s/it]training loss: 6.844e-03:   0%|          | 1054/300001 [9:51:06<2694:06:58, 32.44s/it]training loss: 6.844e-03:   0%|          | 1055/300001 [9:51:38<2684:24:28, 32.33s/it]training loss: 6.844e-03:   0%|          | 1056/300001 [9:52:10<2682:43:02, 32.31s/it]training loss: 6.844e-03:   0%|          | 1057/300001 [9:52:43<2686:01:34, 32.35s/it]training loss: 6.844e-03:   0%|          | 1058/300001 [9:53:15<2697:42:48, 32.49s/it]training loss: 6.844e-03:   0%|          | 1059/300001 [9:53:48<2692:58:53, 32.43s/it]training loss: 6.844e-03:   0%|          | 1060/300001 [9:54:20<2700:23:10, 32.52s/it]training loss: 6.970e-03:   0%|          | 1060/300001 [9:54:52<2700:23:10, 32.52s/it]training loss: 6.970e-03:   0%|          | 1061/300001 [9:54:52<2672:46:11, 32.19s/it]training loss: 6.970e-03:   0%|          | 1062/300001 [9:55:25<2690:59:32, 32.41s/it]training loss: 6.970e-03:   0%|          | 1063/300001 [9:55:57<2693:00:00, 32.43s/it]training loss: 6.970e-03:   0%|          | 1064/300001 [9:56:30<2692:30:39, 32.43s/it]training loss: 6.970e-03:   0%|          | 1065/300001 [9:57:02<2682:03:24, 32.30s/it]training loss: 6.970e-03:   0%|          | 1066/300001 [9:57:35<2700:57:18, 32.53s/it]training loss: 6.970e-03:   0%|          | 1067/300001 [9:58:07<2706:53:54, 32.60s/it]training loss: 6.970e-03:   0%|          | 1068/300001 [9:58:41<2722:54:15, 32.79s/it]training loss: 6.970e-03:   0%|          | 1069/300001 [9:59:13<2714:24:34, 32.69s/it]training loss: 6.970e-03:   0%|          | 1070/300001 [9:59:46<2716:19:24, 32.71s/it]training loss: 6.970e-03:   0%|          | 1071/300001 [10:00:17<2685:17:04, 32.34s/it]training loss: 6.970e-03:   0%|          | 1072/300001 [10:00:50<2684:01:41, 32.32s/it]training loss: 6.970e-03:   0%|          | 1073/300001 [10:01:22<2686:40:11, 32.36s/it]training loss: 6.970e-03:   0%|          | 1074/300001 [10:01:53<2661:58:34, 32.06s/it]training loss: 6.970e-03:   0%|          | 1075/300001 [10:02:26<2668:51:00, 32.14s/it]training loss: 6.970e-03:   0%|          | 1076/300001 [10:02:58<2679:12:24, 32.27s/it]training loss: 6.970e-03:   0%|          | 1077/300001 [10:03:32<2702:29:03, 32.55s/it]training loss: 6.970e-03:   0%|          | 1078/300001 [10:04:05<2717:15:00, 32.72s/it]training loss: 6.970e-03:   0%|          | 1079/300001 [10:04:36<2677:07:48, 32.24s/it]training loss: 6.970e-03:   0%|          | 1080/300001 [10:05:08<2682:57:55, 32.31s/it]training loss: 6.521e-03:   0%|          | 1080/300001 [10:05:41<2682:57:55, 32.31s/it]training loss: 6.521e-03:   0%|          | 1081/300001 [10:05:41<2704:42:21, 32.57s/it]training loss: 6.521e-03:   0%|          | 1082/300001 [10:06:14<2703:13:14, 32.56s/it]training loss: 6.521e-03:   0%|          | 1083/300001 [10:06:46<2694:56:51, 32.46s/it]training loss: 6.521e-03:   0%|          | 1084/300001 [10:07:19<2704:20:44, 32.57s/it]training loss: 6.521e-03:   0%|          | 1085/300001 [10:07:52<2702:21:31, 32.55s/it]training loss: 6.521e-03:   0%|          | 1086/300001 [10:08:24<2704:01:51, 32.57s/it]training loss: 6.521e-03:   0%|          | 1087/300001 [10:08:55<2668:01:57, 32.13s/it]training loss: 6.521e-03:   0%|          | 1088/300001 [10:09:28<2678:52:42, 32.26s/it]training loss: 6.521e-03:   0%|          | 1089/300001 [10:10:01<2692:53:44, 32.43s/it]training loss: 6.521e-03:   0%|          | 1090/300001 [10:10:33<2699:15:12, 32.51s/it]training loss: 6.521e-03:   0%|          | 1091/300001 [10:11:06<2708:35:19, 32.62s/it]training loss: 6.521e-03:   0%|          | 1092/300001 [10:11:39<2705:04:47, 32.58s/it]training loss: 6.521e-03:   0%|          | 1093/300001 [10:12:11<2703:23:41, 32.56s/it]training loss: 6.521e-03:   0%|          | 1094/300001 [10:12:43<2693:41:28, 32.44s/it]training loss: 6.521e-03:   0%|          | 1095/300001 [10:13:16<2705:45:33, 32.59s/it]training loss: 6.521e-03:   0%|          | 1096/300001 [10:13:48<2691:11:35, 32.41s/it]training loss: 6.521e-03:   0%|          | 1097/300001 [10:14:21<2695:18:14, 32.46s/it]training loss: 6.521e-03:   0%|          | 1098/300001 [10:14:55<2724:19:10, 32.81s/it]training loss: 6.521e-03:   0%|          | 1099/300001 [10:15:17<2475:47:28, 29.82s/it]training loss: 6.521e-03:   0%|          | 1100/300001 [10:15:49<2523:44:14, 30.40s/it]training loss: 7.421e-03:   0%|          | 1100/300001 [10:16:21<2523:44:14, 30.40s/it]training loss: 7.421e-03:   0%|          | 1101/300001 [10:16:21<2558:20:11, 30.81s/it]training loss: 7.421e-03:   0%|          | 1102/300001 [10:16:54<2607:53:12, 31.41s/it]training loss: 7.421e-03:   0%|          | 1103/300001 [10:17:27<2651:03:02, 31.93s/it]training loss: 7.421e-03:   0%|          | 1104/300001 [10:18:00<2683:37:20, 32.32s/it]training loss: 7.421e-03:   0%|          | 1105/300001 [10:18:33<2694:31:45, 32.45s/it]training loss: 7.421e-03:   0%|          | 1106/300001 [10:19:05<2678:29:19, 32.26s/it]training loss: 7.421e-03:   0%|          | 1107/300001 [10:19:37<2675:36:15, 32.23s/it]training loss: 7.421e-03:   0%|          | 1108/300001 [10:20:08<2659:21:27, 32.03s/it]training loss: 7.421e-03:   0%|          | 1109/300001 [10:20:41<2663:56:07, 32.09s/it]training loss: 7.421e-03:   0%|          | 1110/300001 [10:21:14<2699:10:57, 32.51s/it]training loss: 7.421e-03:   0%|          | 1111/300001 [10:21:48<2731:57:37, 32.91s/it]training loss: 7.421e-03:   0%|          | 1112/300001 [10:22:21<2741:49:41, 33.02s/it]training loss: 7.421e-03:   0%|          | 1113/300001 [10:22:53<2707:23:15, 32.61s/it]training loss: 7.421e-03:   0%|          | 1114/300001 [10:23:25<2698:34:42, 32.50s/it]training loss: 7.421e-03:   0%|          | 1115/300001 [10:23:59<2731:47:13, 32.90s/it]training loss: 7.421e-03:   0%|          | 1116/300001 [10:24:32<2729:04:45, 32.87s/it]training loss: 7.421e-03:   0%|          | 1117/300001 [10:25:05<2750:47:33, 33.13s/it]training loss: 7.421e-03:   0%|          | 1118/300001 [10:25:38<2733:49:06, 32.93s/it]training loss: 7.421e-03:   0%|          | 1119/300001 [10:26:10<2718:43:19, 32.75s/it]training loss: 7.421e-03:   0%|          | 1120/300001 [10:26:42<2696:08:18, 32.47s/it]training loss: 6.365e-03:   0%|          | 1120/300001 [10:27:15<2696:08:18, 32.47s/it]training loss: 6.365e-03:   0%|          | 1121/300001 [10:27:15<2702:24:40, 32.55s/it]training loss: 6.365e-03:   0%|          | 1122/300001 [10:27:46<2671:59:46, 32.18s/it]training loss: 6.365e-03:   0%|          | 1123/300001 [10:28:19<2697:41:57, 32.49s/it]training loss: 6.365e-03:   0%|          | 1124/300001 [10:28:51<2680:14:47, 32.28s/it]training loss: 6.365e-03:   0%|          | 1125/300001 [10:29:24<2704:32:50, 32.58s/it]training loss: 6.365e-03:   0%|          | 1126/300001 [10:29:56<2685:59:41, 32.35s/it]training loss: 6.365e-03:   0%|          | 1127/300001 [10:30:29<2705:30:25, 32.59s/it]training loss: 6.365e-03:   0%|          | 1128/300001 [10:31:01<2692:39:53, 32.43s/it]training loss: 6.365e-03:   0%|          | 1129/300001 [10:31:35<2723:20:55, 32.80s/it]training loss: 6.365e-03:   0%|          | 1130/300001 [10:32:08<2732:37:40, 32.92s/it]training loss: 6.365e-03:   0%|          | 1131/300001 [10:32:40<2710:53:43, 32.65s/it]training loss: 6.365e-03:   0%|          | 1132/300001 [10:33:13<2715:27:29, 32.71s/it]training loss: 6.365e-03:   0%|          | 1133/300001 [10:33:45<2692:26:54, 32.43s/it]training loss: 6.365e-03:   0%|          | 1134/300001 [10:34:19<2723:55:43, 32.81s/it]training loss: 6.365e-03:   0%|          | 1135/300001 [10:34:51<2719:25:08, 32.76s/it]training loss: 6.365e-03:   0%|          | 1136/300001 [10:35:24<2725:44:09, 32.83s/it]training loss: 6.365e-03:   0%|          | 1137/300001 [10:35:56<2706:14:54, 32.60s/it]training loss: 6.365e-03:   0%|          | 1138/300001 [10:36:29<2702:56:22, 32.56s/it]training loss: 6.365e-03:   0%|          | 1139/300001 [10:37:02<2715:49:37, 32.71s/it]training loss: 6.365e-03:   0%|          | 1140/300001 [10:37:35<2712:59:02, 32.68s/it]training loss: 6.405e-03:   0%|          | 1140/300001 [10:38:07<2712:59:02, 32.68s/it]training loss: 6.405e-03:   0%|          | 1141/300001 [10:38:07<2703:57:58, 32.57s/it]training loss: 6.405e-03:   0%|          | 1142/300001 [10:38:39<2696:20:37, 32.48s/it]training loss: 6.405e-03:   0%|          | 1143/300001 [10:39:12<2713:04:00, 32.68s/it]training loss: 6.405e-03:   0%|          | 1144/300001 [10:39:44<2693:58:15, 32.45s/it]training loss: 6.405e-03:   0%|          | 1145/300001 [10:40:18<2722:26:14, 32.79s/it]training loss: 6.405e-03:   0%|          | 1146/300001 [10:40:50<2720:37:20, 32.77s/it]training loss: 6.405e-03:   0%|          | 1147/300001 [10:41:23<2726:19:42, 32.84s/it]training loss: 6.405e-03:   0%|          | 1148/300001 [10:41:56<2719:10:02, 32.76s/it]training loss: 6.405e-03:   0%|          | 1149/300001 [10:42:29<2713:44:48, 32.69s/it]training loss: 6.405e-03:   0%|          | 1150/300001 [10:43:01<2717:42:26, 32.74s/it]training loss: 6.405e-03:   0%|          | 1151/300001 [10:43:34<2703:01:00, 32.56s/it]training loss: 6.405e-03:   0%|          | 1152/300001 [10:44:07<2711:57:37, 32.67s/it]training loss: 6.405e-03:   0%|          | 1153/300001 [10:44:39<2696:47:55, 32.49s/it]training loss: 6.405e-03:   0%|          | 1154/300001 [10:45:11<2697:23:47, 32.49s/it]training loss: 6.405e-03:   0%|          | 1155/300001 [10:45:43<2682:03:49, 32.31s/it]training loss: 6.405e-03:   0%|          | 1156/300001 [10:46:15<2673:28:15, 32.21s/it]training loss: 6.405e-03:   0%|          | 1157/300001 [10:46:47<2671:41:14, 32.18s/it]training loss: 6.405e-03:   0%|          | 1158/300001 [10:47:19<2664:28:51, 32.10s/it]training loss: 6.405e-03:   0%|          | 1159/300001 [10:47:51<2667:48:21, 32.14s/it]training loss: 6.405e-03:   0%|          | 1160/300001 [10:48:24<2684:22:05, 32.34s/it]training loss: 6.427e-03:   0%|          | 1160/300001 [10:48:55<2684:22:05, 32.34s/it]training loss: 6.427e-03:   0%|          | 1161/300001 [10:48:55<2656:13:00, 32.00s/it]training loss: 6.427e-03:   0%|          | 1162/300001 [10:49:26<2633:53:41, 31.73s/it]training loss: 6.427e-03:   0%|          | 1163/300001 [10:49:58<2635:15:17, 31.75s/it]training loss: 6.427e-03:   0%|          | 1164/300001 [10:50:31<2666:24:41, 32.12s/it]training loss: 6.427e-03:   0%|          | 1165/300001 [10:51:04<2693:41:42, 32.45s/it]training loss: 6.427e-03:   0%|          | 1166/300001 [10:51:37<2699:22:46, 32.52s/it]training loss: 6.427e-03:   0%|          | 1167/300001 [10:52:10<2702:06:49, 32.55s/it]training loss: 6.427e-03:   0%|          | 1168/300001 [10:52:43<2730:48:06, 32.90s/it]training loss: 6.427e-03:   0%|          | 1169/300001 [10:53:17<2753:52:04, 33.18s/it]training loss: 6.427e-03:   0%|          | 1170/300001 [10:53:48<2706:37:45, 32.61s/it]training loss: 6.427e-03:   0%|          | 1171/300001 [10:54:21<2701:28:54, 32.54s/it]training loss: 6.427e-03:   0%|          | 1172/300001 [10:54:54<2713:19:43, 32.69s/it]training loss: 6.427e-03:   0%|          | 1173/300001 [10:55:26<2703:58:32, 32.57s/it]training loss: 6.427e-03:   0%|          | 1174/300001 [10:55:58<2680:38:37, 32.29s/it]training loss: 6.427e-03:   0%|          | 1175/300001 [10:56:29<2665:58:06, 32.12s/it]training loss: 6.427e-03:   0%|          | 1176/300001 [10:57:02<2674:53:23, 32.22s/it]training loss: 6.427e-03:   0%|          | 1177/300001 [10:57:34<2673:05:44, 32.20s/it]training loss: 6.427e-03:   0%|          | 1178/300001 [10:58:08<2711:43:40, 32.67s/it]training loss: 6.427e-03:   0%|          | 1179/300001 [10:58:41<2729:45:50, 32.89s/it]training loss: 6.427e-03:   0%|          | 1180/300001 [10:59:14<2729:16:00, 32.88s/it]training loss: 6.375e-03:   0%|          | 1180/300001 [10:59:45<2729:16:00, 32.88s/it]training loss: 6.375e-03:   0%|          | 1181/300001 [10:59:45<2688:33:01, 32.39s/it]training loss: 6.375e-03:   0%|          | 1182/300001 [11:00:18<2684:22:46, 32.34s/it]training loss: 6.375e-03:   0%|          | 1183/300001 [11:00:50<2677:13:53, 32.25s/it]training loss: 6.375e-03:   0%|          | 1184/300001 [11:01:22<2670:56:03, 32.18s/it]training loss: 6.375e-03:   0%|          | 1185/300001 [11:01:56<2718:24:09, 32.75s/it]training loss: 6.375e-03:   0%|          | 1186/300001 [11:02:27<2689:10:21, 32.40s/it]training loss: 6.375e-03:   0%|          | 1187/300001 [11:03:01<2723:36:45, 32.81s/it]training loss: 6.375e-03:   0%|          | 1188/300001 [11:03:33<2713:26:42, 32.69s/it]training loss: 6.375e-03:   0%|          | 1189/300001 [11:04:07<2729:08:36, 32.88s/it]training loss: 6.375e-03:   0%|          | 1190/300001 [11:04:40<2727:54:15, 32.87s/it]training loss: 6.375e-03:   0%|          | 1191/300001 [11:05:12<2712:01:31, 32.67s/it]training loss: 6.375e-03:   0%|          | 1192/300001 [11:05:45<2723:43:43, 32.82s/it]training loss: 6.375e-03:   0%|          | 1193/300001 [11:06:17<2712:41:05, 32.68s/it]training loss: 6.375e-03:   0%|          | 1194/300001 [11:06:50<2708:03:44, 32.63s/it]training loss: 6.375e-03:   0%|          | 1195/300001 [11:07:22<2685:57:38, 32.36s/it]training loss: 6.375e-03:   0%|          | 1196/300001 [11:07:55<2700:31:49, 32.54s/it]training loss: 6.375e-03:   0%|          | 1197/300001 [11:08:26<2674:48:43, 32.23s/it]training loss: 6.375e-03:   0%|          | 1198/300001 [11:08:59<2680:35:28, 32.30s/it]training loss: 6.375e-03:   0%|          | 1199/300001 [11:09:31<2672:36:54, 32.20s/it]training loss: 6.375e-03:   0%|          | 1200/300001 [11:10:04<2712:59:01, 32.69s/it]training loss: 6.515e-03:   0%|          | 1200/300001 [11:10:37<2712:59:01, 32.69s/it]training loss: 6.515e-03:   0%|          | 1201/300001 [11:10:37<2705:43:49, 32.60s/it]training loss: 6.515e-03:   0%|          | 1202/300001 [11:11:08<2678:53:22, 32.28s/it]training loss: 6.515e-03:   0%|          | 1203/300001 [11:11:42<2705:38:02, 32.60s/it]training loss: 6.515e-03:   0%|          | 1204/300001 [11:12:14<2705:00:42, 32.59s/it]training loss: 6.515e-03:   0%|          | 1205/300001 [11:12:47<2720:03:02, 32.77s/it]training loss: 6.515e-03:   0%|          | 1206/300001 [11:13:20<2722:05:54, 32.80s/it]training loss: 6.515e-03:   0%|          | 1207/300001 [11:13:52<2696:28:26, 32.49s/it]training loss: 6.515e-03:   0%|          | 1208/300001 [11:14:24<2680:45:23, 32.30s/it]training loss: 6.515e-03:   0%|          | 1209/300001 [11:14:57<2709:58:34, 32.65s/it]training loss: 6.515e-03:   0%|          | 1210/300001 [11:15:29<2696:55:54, 32.49s/it]training loss: 6.515e-03:   0%|          | 1211/300001 [11:16:02<2687:48:55, 32.38s/it]training loss: 6.515e-03:   0%|          | 1212/300001 [11:16:34<2682:10:53, 32.32s/it]training loss: 6.515e-03:   0%|          | 1213/300001 [11:17:06<2672:09:28, 32.20s/it]training loss: 6.515e-03:   0%|          | 1214/300001 [11:17:39<2711:43:33, 32.67s/it]training loss: 6.515e-03:   0%|          | 1215/300001 [11:18:12<2702:23:05, 32.56s/it]training loss: 6.515e-03:   0%|          | 1216/300001 [11:18:44<2694:17:18, 32.46s/it]training loss: 6.515e-03:   0%|          | 1217/300001 [11:19:15<2663:32:58, 32.09s/it]training loss: 6.515e-03:   0%|          | 1218/300001 [11:19:48<2678:08:46, 32.27s/it]training loss: 6.515e-03:   0%|          | 1219/300001 [11:20:20<2672:57:12, 32.21s/it]training loss: 6.515e-03:   0%|          | 1220/300001 [11:20:52<2671:46:59, 32.19s/it]training loss: 5.834e-03:   0%|          | 1220/300001 [11:21:25<2671:46:59, 32.19s/it]training loss: 5.834e-03:   0%|          | 1221/300001 [11:21:25<2701:43:33, 32.55s/it]training loss: 5.834e-03:   0%|          | 1222/300001 [11:21:58<2688:26:06, 32.39s/it]training loss: 5.834e-03:   0%|          | 1223/300001 [11:22:30<2687:52:53, 32.39s/it]training loss: 5.834e-03:   0%|          | 1224/300001 [11:23:02<2687:14:14, 32.38s/it]training loss: 5.834e-03:   0%|          | 1225/300001 [11:23:36<2709:48:54, 32.65s/it]training loss: 5.834e-03:   0%|          | 1226/300001 [11:24:09<2720:52:04, 32.78s/it]training loss: 5.834e-03:   0%|          | 1227/300001 [11:24:41<2703:17:59, 32.57s/it]training loss: 5.834e-03:   0%|          | 1228/300001 [11:25:13<2706:27:38, 32.61s/it]training loss: 5.834e-03:   0%|          | 1229/300001 [11:25:45<2687:23:40, 32.38s/it]training loss: 5.834e-03:   0%|          | 1230/300001 [11:26:18<2702:54:05, 32.57s/it]training loss: 5.834e-03:   0%|          | 1231/300001 [11:26:50<2692:36:07, 32.44s/it]training loss: 5.834e-03:   0%|          | 1232/300001 [11:27:24<2715:06:18, 32.72s/it]training loss: 5.834e-03:   0%|          | 1233/300001 [11:27:56<2696:13:28, 32.49s/it]training loss: 5.834e-03:   0%|          | 1234/300001 [11:28:28<2686:46:17, 32.37s/it]training loss: 5.834e-03:   0%|          | 1235/300001 [11:29:00<2673:32:43, 32.22s/it]training loss: 5.834e-03:   0%|          | 1236/300001 [11:29:32<2679:15:14, 32.28s/it]training loss: 5.834e-03:   0%|          | 1237/300001 [11:30:04<2664:14:16, 32.10s/it]training loss: 5.834e-03:   0%|          | 1238/300001 [11:30:37<2687:47:09, 32.39s/it]training loss: 5.834e-03:   0%|          | 1239/300001 [11:31:09<2676:37:17, 32.25s/it]training loss: 5.834e-03:   0%|          | 1240/300001 [11:31:41<2688:04:47, 32.39s/it]training loss: 7.140e-03:   0%|          | 1240/300001 [11:32:14<2688:04:47, 32.39s/it]training loss: 7.140e-03:   0%|          | 1241/300001 [11:32:14<2684:37:16, 32.35s/it]training loss: 7.140e-03:   0%|          | 1242/300001 [11:32:46<2670:35:16, 32.18s/it]training loss: 7.140e-03:   0%|          | 1243/300001 [11:33:19<2697:46:09, 32.51s/it]training loss: 7.140e-03:   0%|          | 1244/300001 [11:33:51<2695:06:10, 32.48s/it]training loss: 7.140e-03:   0%|          | 1245/300001 [11:34:23<2672:27:37, 32.20s/it]training loss: 7.140e-03:   0%|          | 1246/300001 [11:34:55<2674:48:07, 32.23s/it]training loss: 7.140e-03:   0%|          | 1247/300001 [11:35:28<2694:33:28, 32.47s/it]training loss: 7.140e-03:   0%|          | 1248/300001 [11:36:01<2701:55:15, 32.56s/it]training loss: 7.140e-03:   0%|          | 1249/300001 [11:36:35<2740:57:07, 33.03s/it]training loss: 7.140e-03:   0%|          | 1250/300001 [11:37:06<2688:35:18, 32.40s/it]training loss: 7.140e-03:   0%|          | 1251/300001 [11:37:39<2711:46:19, 32.68s/it]training loss: 7.140e-03:   0%|          | 1252/300001 [11:38:13<2730:47:17, 32.91s/it]training loss: 7.140e-03:   0%|          | 1253/300001 [11:38:45<2718:59:18, 32.76s/it]training loss: 7.140e-03:   0%|          | 1254/300001 [11:39:18<2722:07:05, 32.80s/it]training loss: 7.140e-03:   0%|          | 1255/300001 [11:39:50<2707:22:04, 32.62s/it]training loss: 7.140e-03:   0%|          | 1256/300001 [11:40:13<2455:43:45, 29.59s/it]training loss: 7.140e-03:   0%|          | 1257/300001 [11:40:45<2529:08:25, 30.48s/it]training loss: 7.140e-03:   0%|          | 1258/300001 [11:41:18<2582:09:39, 31.12s/it]training loss: 7.140e-03:   0%|          | 1259/300001 [11:41:51<2629:48:40, 31.69s/it]training loss: 7.140e-03:   0%|          | 1260/300001 [11:42:23<2637:47:04, 31.79s/it]training loss: 7.163e-03:   0%|          | 1260/300001 [11:42:56<2637:47:04, 31.79s/it]training loss: 7.163e-03:   0%|          | 1261/300001 [11:42:56<2675:43:25, 32.24s/it]training loss: 7.163e-03:   0%|          | 1262/300001 [11:43:27<2646:48:10, 31.90s/it]training loss: 7.163e-03:   0%|          | 1263/300001 [11:43:59<2650:26:49, 31.94s/it]training loss: 7.163e-03:   0%|          | 1264/300001 [11:44:31<2655:15:25, 32.00s/it]training loss: 7.163e-03:   0%|          | 1265/300001 [11:45:04<2672:09:42, 32.20s/it]training loss: 7.163e-03:   0%|          | 1266/300001 [11:45:37<2677:38:32, 32.27s/it]training loss: 7.163e-03:   0%|          | 1267/300001 [11:46:09<2679:51:12, 32.29s/it]training loss: 7.163e-03:   0%|          | 1268/300001 [11:46:42<2706:40:34, 32.62s/it]training loss: 7.163e-03:   0%|          | 1269/300001 [11:47:15<2708:24:49, 32.64s/it]training loss: 7.163e-03:   0%|          | 1270/300001 [11:47:48<2707:29:31, 32.63s/it]training loss: 7.163e-03:   0%|          | 1271/300001 [11:48:20<2699:38:34, 32.53s/it]training loss: 7.163e-03:   0%|          | 1272/300001 [11:48:53<2716:54:39, 32.74s/it]training loss: 7.163e-03:   0%|          | 1273/300001 [11:49:27<2739:52:27, 33.02s/it]training loss: 7.163e-03:   0%|          | 1274/300001 [11:49:58<2703:24:59, 32.58s/it]training loss: 7.163e-03:   0%|          | 1275/300001 [11:50:32<2729:06:32, 32.89s/it]training loss: 7.163e-03:   0%|          | 1276/300001 [11:51:04<2706:49:37, 32.62s/it]training loss: 7.163e-03:   0%|          | 1277/300001 [11:51:36<2698:07:29, 32.52s/it]training loss: 7.163e-03:   0%|          | 1278/300001 [11:52:09<2715:34:52, 32.73s/it]training loss: 7.163e-03:   0%|          | 1279/300001 [11:52:42<2715:09:00, 32.72s/it]training loss: 7.163e-03:   0%|          | 1280/300001 [11:53:14<2705:06:39, 32.60s/it]training loss: 6.475e-03:   0%|          | 1280/300001 [11:53:46<2705:06:39, 32.60s/it]training loss: 6.475e-03:   0%|          | 1281/300001 [11:53:46<2685:16:21, 32.36s/it]training loss: 6.475e-03:   0%|          | 1282/300001 [11:54:19<2685:19:47, 32.36s/it]training loss: 6.475e-03:   0%|          | 1283/300001 [11:54:50<2667:18:14, 32.15s/it]training loss: 6.475e-03:   0%|          | 1284/300001 [11:55:23<2671:42:19, 32.20s/it]training loss: 6.475e-03:   0%|          | 1285/300001 [11:55:54<2652:51:28, 31.97s/it]training loss: 6.475e-03:   0%|          | 1286/300001 [11:56:28<2689:38:30, 32.41s/it]training loss: 6.475e-03:   0%|          | 1287/300001 [11:57:00<2689:33:35, 32.41s/it]training loss: 6.475e-03:   0%|          | 1288/300001 [11:57:33<2713:28:56, 32.70s/it]training loss: 6.475e-03:   0%|          | 1289/300001 [11:58:06<2704:42:59, 32.60s/it]training loss: 6.475e-03:   0%|          | 1290/300001 [11:58:38<2692:55:43, 32.45s/it]training loss: 6.475e-03:   0%|          | 1291/300001 [11:59:10<2676:52:05, 32.26s/it]training loss: 6.475e-03:   0%|          | 1292/300001 [11:59:41<2663:22:26, 32.10s/it]training loss: 6.475e-03:   0%|          | 1293/300001 [12:00:15<2699:44:43, 32.54s/it]training loss: 6.475e-03:   0%|          | 1294/300001 [12:00:48<2721:59:12, 32.81s/it]training loss: 6.475e-03:   0%|          | 1295/300001 [12:01:21<2725:09:11, 32.84s/it]training loss: 6.475e-03:   0%|          | 1296/300001 [12:01:53<2706:28:23, 32.62s/it]training loss: 6.475e-03:   0%|          | 1297/300001 [12:02:26<2701:52:32, 32.56s/it]training loss: 6.475e-03:   0%|          | 1298/300001 [12:02:58<2694:20:29, 32.47s/it]training loss: 6.475e-03:   0%|          | 1299/300001 [12:03:30<2686:09:41, 32.37s/it]training loss: 6.475e-03:   0%|          | 1300/300001 [12:04:02<2680:25:44, 32.31s/it]training loss: 6.811e-03:   0%|          | 1300/300001 [12:04:35<2680:25:44, 32.31s/it]training loss: 6.811e-03:   0%|          | 1301/300001 [12:04:35<2685:28:16, 32.37s/it]training loss: 6.811e-03:   0%|          | 1302/300001 [12:05:07<2679:55:29, 32.30s/it]training loss: 6.811e-03:   0%|          | 1303/300001 [12:05:40<2706:50:04, 32.62s/it]training loss: 6.811e-03:   0%|          | 1304/300001 [12:06:13<2719:11:21, 32.77s/it]training loss: 6.811e-03:   0%|          | 1305/300001 [12:06:45<2691:36:09, 32.44s/it]training loss: 6.811e-03:   0%|          | 1306/300001 [12:07:18<2694:38:42, 32.48s/it]training loss: 6.811e-03:   0%|          | 1307/300001 [12:07:49<2675:09:43, 32.24s/it]training loss: 6.811e-03:   0%|          | 1308/300001 [12:08:22<2675:18:46, 32.24s/it]training loss: 6.811e-03:   0%|          | 1309/300001 [12:08:55<2707:20:07, 32.63s/it]training loss: 6.811e-03:   0%|          | 1310/300001 [12:09:27<2693:08:31, 32.46s/it]training loss: 6.811e-03:   0%|          | 1311/300001 [12:10:01<2719:59:17, 32.78s/it]training loss: 6.811e-03:   0%|          | 1312/300001 [12:10:33<2714:25:38, 32.72s/it]training loss: 6.811e-03:   0%|          | 1313/300001 [12:11:05<2696:11:30, 32.50s/it]training loss: 6.811e-03:   0%|          | 1314/300001 [12:11:38<2712:17:24, 32.69s/it]training loss: 6.811e-03:   0%|          | 1315/300001 [12:12:12<2723:49:59, 32.83s/it]training loss: 6.811e-03:   0%|          | 1316/300001 [12:12:44<2722:15:17, 32.81s/it]training loss: 6.811e-03:   0%|          | 1317/300001 [12:13:16<2700:54:51, 32.55s/it]training loss: 6.811e-03:   0%|          | 1318/300001 [12:13:49<2712:56:32, 32.70s/it]training loss: 6.811e-03:   0%|          | 1319/300001 [12:14:21<2679:29:48, 32.30s/it]training loss: 6.811e-03:   0%|          | 1320/300001 [12:14:53<2689:26:35, 32.42s/it]training loss: 6.714e-03:   0%|          | 1320/300001 [12:15:25<2689:26:35, 32.42s/it]training loss: 6.714e-03:   0%|          | 1321/300001 [12:15:25<2675:02:44, 32.24s/it]training loss: 6.714e-03:   0%|          | 1322/300001 [12:15:58<2686:46:10, 32.38s/it]training loss: 6.714e-03:   0%|          | 1323/300001 [12:16:30<2685:45:32, 32.37s/it]training loss: 6.714e-03:   0%|          | 1324/300001 [12:17:04<2722:34:01, 32.82s/it]training loss: 6.714e-03:   0%|          | 1325/300001 [12:17:36<2699:42:00, 32.54s/it]training loss: 6.714e-03:   0%|          | 1326/300001 [12:18:08<2695:38:17, 32.49s/it]training loss: 6.714e-03:   0%|          | 1327/300001 [12:18:42<2717:09:35, 32.75s/it]training loss: 6.714e-03:   0%|          | 1328/300001 [12:19:15<2719:58:17, 32.78s/it]training loss: 6.714e-03:   0%|          | 1329/300001 [12:19:46<2686:47:48, 32.38s/it]training loss: 6.714e-03:   0%|          | 1330/300001 [12:20:20<2714:42:34, 32.72s/it]training loss: 6.714e-03:   0%|          | 1331/300001 [12:20:52<2706:48:17, 32.63s/it]training loss: 6.714e-03:   0%|          | 1332/300001 [12:21:23<2675:32:16, 32.25s/it]training loss: 6.714e-03:   0%|          | 1333/300001 [12:21:56<2688:33:24, 32.41s/it]training loss: 6.714e-03:   0%|          | 1334/300001 [12:22:28<2673:59:14, 32.23s/it]training loss: 6.714e-03:   0%|          | 1335/300001 [12:23:00<2667:45:30, 32.16s/it]training loss: 6.714e-03:   0%|          | 1336/300001 [12:23:32<2668:49:30, 32.17s/it]training loss: 6.714e-03:   0%|          | 1337/300001 [12:24:03<2646:21:23, 31.90s/it]training loss: 6.714e-03:   0%|          | 1338/300001 [12:24:37<2682:44:49, 32.34s/it]training loss: 6.714e-03:   0%|          | 1339/300001 [12:25:08<2661:37:41, 32.08s/it]training loss: 6.714e-03:   0%|          | 1340/300001 [12:25:40<2660:25:52, 32.07s/it]training loss: 6.691e-03:   0%|          | 1340/300001 [12:26:13<2660:25:52, 32.07s/it]training loss: 6.691e-03:   0%|          | 1341/300001 [12:26:13<2681:32:46, 32.32s/it]training loss: 6.691e-03:   0%|          | 1342/300001 [12:26:47<2716:15:49, 32.74s/it]training loss: 6.691e-03:   0%|          | 1343/300001 [12:27:20<2726:50:46, 32.87s/it]training loss: 6.691e-03:   0%|          | 1344/300001 [12:27:54<2744:27:20, 33.08s/it]training loss: 6.691e-03:   0%|          | 1345/300001 [12:28:27<2738:55:12, 33.01s/it]training loss: 6.691e-03:   0%|          | 1346/300001 [12:28:59<2736:41:33, 32.99s/it]training loss: 6.691e-03:   0%|          | 1347/300001 [12:29:32<2725:56:08, 32.86s/it]training loss: 6.691e-03:   0%|          | 1348/300001 [12:30:04<2705:21:42, 32.61s/it]training loss: 6.691e-03:   0%|          | 1349/300001 [12:30:37<2701:42:49, 32.57s/it]training loss: 6.691e-03:   0%|          | 1350/300001 [12:31:10<2735:25:27, 32.97s/it]training loss: 6.691e-03:   0%|          | 1351/300001 [12:31:43<2729:51:18, 32.91s/it]training loss: 6.691e-03:   0%|          | 1352/300001 [12:32:16<2716:02:20, 32.74s/it]training loss: 6.691e-03:   0%|          | 1353/300001 [12:32:48<2717:00:02, 32.75s/it]training loss: 6.691e-03:   0%|          | 1354/300001 [12:33:21<2715:06:12, 32.73s/it]training loss: 6.691e-03:   0%|          | 1355/300001 [12:33:53<2695:46:55, 32.50s/it]training loss: 6.691e-03:   0%|          | 1356/300001 [12:34:27<2725:44:20, 32.86s/it]training loss: 6.691e-03:   0%|          | 1357/300001 [12:34:59<2706:04:40, 32.62s/it]training loss: 6.691e-03:   0%|          | 1358/300001 [12:35:31<2706:37:17, 32.63s/it]training loss: 6.691e-03:   0%|          | 1359/300001 [12:36:04<2703:22:32, 32.59s/it]training loss: 6.691e-03:   0%|          | 1360/300001 [12:36:36<2686:22:00, 32.38s/it]training loss: 7.604e-03:   0%|          | 1360/300001 [12:37:08<2686:22:00, 32.38s/it]training loss: 7.604e-03:   0%|          | 1361/300001 [12:37:08<2694:27:22, 32.48s/it]training loss: 7.604e-03:   0%|          | 1362/300001 [12:37:41<2705:22:02, 32.61s/it]training loss: 7.604e-03:   0%|          | 1363/300001 [12:38:14<2705:58:20, 32.62s/it]training loss: 7.604e-03:   0%|          | 1364/300001 [12:38:47<2702:18:36, 32.58s/it]training loss: 7.604e-03:   0%|          | 1365/300001 [12:39:19<2692:17:31, 32.46s/it]training loss: 7.604e-03:   0%|          | 1366/300001 [12:39:51<2695:45:06, 32.50s/it]training loss: 7.604e-03:   0%|          | 1367/300001 [12:40:24<2691:07:49, 32.44s/it]training loss: 7.604e-03:   0%|          | 1368/300001 [12:40:56<2701:41:24, 32.57s/it]training loss: 7.604e-03:   0%|          | 1369/300001 [12:41:29<2690:49:30, 32.44s/it]training loss: 7.604e-03:   0%|          | 1370/300001 [12:42:01<2679:35:33, 32.30s/it]training loss: 7.604e-03:   0%|          | 1371/300001 [12:42:34<2698:24:26, 32.53s/it]training loss: 7.604e-03:   0%|          | 1372/300001 [12:43:05<2673:12:04, 32.23s/it]training loss: 7.604e-03:   0%|          | 1373/300001 [12:43:37<2668:23:51, 32.17s/it]training loss: 7.604e-03:   0%|          | 1374/300001 [12:44:10<2688:19:08, 32.41s/it]training loss: 7.604e-03:   0%|          | 1375/300001 [12:44:42<2677:56:50, 32.28s/it]training loss: 7.604e-03:   0%|          | 1376/300001 [12:45:15<2690:33:06, 32.44s/it]training loss: 7.604e-03:   0%|          | 1377/300001 [12:45:47<2689:39:49, 32.42s/it]training loss: 7.604e-03:   0%|          | 1378/300001 [12:46:20<2699:20:26, 32.54s/it]training loss: 7.604e-03:   0%|          | 1379/300001 [12:46:53<2696:05:44, 32.50s/it]training loss: 7.604e-03:   0%|          | 1380/300001 [12:47:26<2715:10:11, 32.73s/it]training loss: 6.313e-03:   0%|          | 1380/300001 [12:47:58<2715:10:11, 32.73s/it]training loss: 6.313e-03:   0%|          | 1381/300001 [12:47:58<2703:26:57, 32.59s/it]training loss: 6.313e-03:   0%|          | 1382/300001 [12:48:29<2662:53:45, 32.10s/it]training loss: 6.313e-03:   0%|          | 1383/300001 [12:49:01<2654:26:50, 32.00s/it]training loss: 6.313e-03:   0%|          | 1384/300001 [12:49:34<2674:59:01, 32.25s/it]training loss: 6.313e-03:   0%|          | 1385/300001 [12:50:06<2673:57:11, 32.24s/it]training loss: 6.313e-03:   0%|          | 1386/300001 [12:50:39<2686:40:10, 32.39s/it]training loss: 6.313e-03:   0%|          | 1387/300001 [12:51:11<2681:54:09, 32.33s/it]training loss: 6.313e-03:   0%|          | 1388/300001 [12:51:43<2689:59:46, 32.43s/it]training loss: 6.313e-03:   0%|          | 1389/300001 [12:52:16<2680:45:50, 32.32s/it]training loss: 6.313e-03:   0%|          | 1390/300001 [12:52:47<2663:33:19, 32.11s/it]training loss: 6.313e-03:   0%|          | 1391/300001 [12:53:19<2658:00:31, 32.04s/it]training loss: 6.313e-03:   0%|          | 1392/300001 [12:53:52<2692:16:57, 32.46s/it]training loss: 6.313e-03:   0%|          | 1393/300001 [12:54:23<2654:14:52, 32.00s/it]training loss: 6.313e-03:   0%|          | 1394/300001 [12:54:55<2656:51:21, 32.03s/it]training loss: 6.313e-03:   0%|          | 1395/300001 [12:55:29<2684:47:30, 32.37s/it]training loss: 6.313e-03:   0%|          | 1396/300001 [12:56:01<2686:16:05, 32.39s/it]training loss: 6.313e-03:   0%|          | 1397/300001 [12:56:34<2707:50:11, 32.65s/it]training loss: 6.313e-03:   0%|          | 1398/300001 [12:57:07<2711:07:18, 32.69s/it]training loss: 6.313e-03:   0%|          | 1399/300001 [12:57:39<2691:28:49, 32.45s/it]training loss: 6.313e-03:   0%|          | 1400/300001 [12:58:13<2718:26:16, 32.77s/it]training loss: 5.844e-03:   0%|          | 1400/300001 [12:58:44<2718:26:16, 32.77s/it]training loss: 5.844e-03:   0%|          | 1401/300001 [12:58:45<2698:53:27, 32.54s/it]training loss: 5.844e-03:   0%|          | 1402/300001 [12:59:16<2684:36:25, 32.37s/it]training loss: 5.844e-03:   0%|          | 1403/300001 [12:59:49<2678:59:56, 32.30s/it]training loss: 5.844e-03:   0%|          | 1404/300001 [13:00:20<2662:22:56, 32.10s/it]training loss: 5.844e-03:   0%|          | 1405/300001 [13:00:53<2683:20:02, 32.35s/it]training loss: 5.844e-03:   0%|          | 1406/300001 [13:01:25<2668:10:16, 32.17s/it]training loss: 5.844e-03:   0%|          | 1407/300001 [13:01:57<2660:08:00, 32.07s/it]training loss: 5.844e-03:   0%|          | 1408/300001 [13:02:29<2668:56:15, 32.18s/it]training loss: 5.844e-03:   0%|          | 1409/300001 [13:03:02<2680:22:09, 32.32s/it]training loss: 5.844e-03:   0%|          | 1410/300001 [13:03:34<2673:43:26, 32.24s/it]training loss: 5.844e-03:   0%|          | 1411/300001 [13:04:07<2705:37:59, 32.62s/it]training loss: 5.844e-03:   0%|          | 1412/300001 [13:04:40<2705:49:52, 32.62s/it]training loss: 5.844e-03:   0%|          | 1413/300001 [13:05:02<2446:21:19, 29.50s/it]training loss: 5.844e-03:   0%|          | 1414/300001 [13:05:35<2531:44:30, 30.52s/it]training loss: 5.844e-03:   0%|          | 1415/300001 [13:06:08<2591:39:40, 31.25s/it]training loss: 5.844e-03:   0%|          | 1416/300001 [13:06:41<2634:45:38, 31.77s/it]training loss: 5.844e-03:   0%|          | 1417/300001 [13:07:13<2647:55:15, 31.93s/it]training loss: 5.844e-03:   0%|          | 1418/300001 [13:07:44<2612:46:33, 31.50s/it]training loss: 5.844e-03:   0%|          | 1419/300001 [13:08:17<2651:33:34, 31.97s/it]training loss: 5.844e-03:   0%|          | 1420/300001 [13:08:50<2666:09:27, 32.15s/it]training loss: 6.296e-03:   0%|          | 1420/300001 [13:09:21<2666:09:27, 32.15s/it]training loss: 6.296e-03:   0%|          | 1421/300001 [13:09:22<2667:16:41, 32.16s/it]training loss: 6.296e-03:   0%|          | 1422/300001 [13:09:53<2643:22:52, 31.87s/it]training loss: 6.296e-03:   0%|          | 1423/300001 [13:10:25<2657:51:53, 32.05s/it]training loss: 6.296e-03:   0%|          | 1424/300001 [13:10:58<2664:46:48, 32.13s/it]training loss: 6.296e-03:   0%|          | 1425/300001 [13:11:30<2665:54:46, 32.14s/it]training loss: 6.296e-03:   0%|          | 1426/300001 [13:12:03<2686:08:21, 32.39s/it]training loss: 6.296e-03:   0%|          | 1427/300001 [13:12:33<2635:38:40, 31.78s/it]training loss: 6.296e-03:   0%|          | 1428/300001 [13:13:05<2648:57:06, 31.94s/it]training loss: 6.296e-03:   0%|          | 1429/300001 [13:13:37<2627:10:02, 31.68s/it]training loss: 6.296e-03:   0%|          | 1430/300001 [13:14:10<2658:52:44, 32.06s/it]training loss: 6.296e-03:   0%|          | 1431/300001 [13:14:42<2679:56:07, 32.31s/it]training loss: 6.296e-03:   0%|          | 1432/300001 [13:15:14<2659:39:47, 32.07s/it]training loss: 6.296e-03:   0%|          | 1433/300001 [13:15:46<2649:39:19, 31.95s/it]training loss: 6.296e-03:   0%|          | 1434/300001 [13:16:17<2641:01:09, 31.84s/it]training loss: 6.296e-03:   0%|          | 1435/300001 [13:16:49<2630:48:47, 31.72s/it]training loss: 6.296e-03:   0%|          | 1436/300001 [13:17:21<2653:23:28, 31.99s/it]training loss: 6.296e-03:   0%|          | 1437/300001 [13:17:53<2636:45:16, 31.79s/it]training loss: 6.296e-03:   0%|          | 1438/300001 [13:18:25<2659:32:16, 32.07s/it]training loss: 6.296e-03:   0%|          | 1439/300001 [13:18:59<2694:38:27, 32.49s/it]training loss: 6.296e-03:   0%|          | 1440/300001 [13:19:31<2692:13:48, 32.46s/it]training loss: 6.822e-03:   0%|          | 1440/300001 [13:20:03<2692:13:48, 32.46s/it]training loss: 6.822e-03:   0%|          | 1441/300001 [13:20:03<2688:48:34, 32.42s/it]training loss: 6.822e-03:   0%|          | 1442/300001 [13:20:36<2701:40:00, 32.58s/it]training loss: 6.822e-03:   0%|          | 1443/300001 [13:21:08<2669:28:15, 32.19s/it]training loss: 6.822e-03:   0%|          | 1444/300001 [13:21:41<2692:28:20, 32.47s/it]training loss: 6.822e-03:   0%|          | 1445/300001 [13:22:13<2687:31:36, 32.41s/it]training loss: 6.822e-03:   0%|          | 1446/300001 [13:22:46<2693:37:19, 32.48s/it]training loss: 6.822e-03:   0%|          | 1447/300001 [13:23:18<2697:32:09, 32.53s/it]training loss: 6.822e-03:   0%|          | 1448/300001 [13:23:52<2724:13:07, 32.85s/it]training loss: 6.822e-03:   0%|          | 1449/300001 [13:24:24<2696:24:32, 32.51s/it]training loss: 6.822e-03:   0%|          | 1450/300001 [13:24:56<2684:21:13, 32.37s/it]training loss: 6.822e-03:   0%|          | 1451/300001 [13:25:29<2696:38:53, 32.52s/it]training loss: 6.822e-03:   0%|          | 1452/300001 [13:26:02<2710:19:21, 32.68s/it]training loss: 6.822e-03:   0%|          | 1453/300001 [13:26:34<2693:33:19, 32.48s/it]training loss: 6.822e-03:   0%|          | 1454/300001 [13:27:06<2685:35:08, 32.38s/it]training loss: 6.822e-03:   0%|          | 1455/300001 [13:27:38<2681:50:40, 32.34s/it]training loss: 6.822e-03:   0%|          | 1456/300001 [13:28:11<2687:19:55, 32.41s/it]training loss: 6.822e-03:   0%|          | 1457/300001 [13:28:44<2700:50:03, 32.57s/it]training loss: 6.822e-03:   0%|          | 1458/300001 [13:29:16<2699:22:02, 32.55s/it]training loss: 6.822e-03:   0%|          | 1459/300001 [13:29:49<2713:23:48, 32.72s/it]training loss: 6.822e-03:   0%|          | 1460/300001 [13:30:21<2694:18:39, 32.49s/it]training loss: 5.644e-03:   0%|          | 1460/300001 [13:30:53<2694:18:39, 32.49s/it]training loss: 5.644e-03:   0%|          | 1461/300001 [13:30:53<2681:01:27, 32.33s/it]training loss: 5.644e-03:   0%|          | 1462/300001 [13:31:27<2708:07:07, 32.66s/it]training loss: 5.644e-03:   0%|          | 1463/300001 [13:32:00<2726:02:29, 32.87s/it]training loss: 5.644e-03:   0%|          | 1464/300001 [13:32:32<2705:06:40, 32.62s/it]training loss: 5.644e-03:   0%|          | 1465/300001 [13:33:05<2706:53:23, 32.64s/it]training loss: 5.644e-03:   0%|          | 1466/300001 [13:33:37<2691:21:50, 32.45s/it]training loss: 5.644e-03:   0%|          | 1467/300001 [13:34:09<2701:28:21, 32.58s/it]training loss: 5.644e-03:   0%|          | 1468/300001 [13:34:42<2694:18:17, 32.49s/it]training loss: 5.644e-03:   0%|          | 1469/300001 [13:35:16<2728:31:20, 32.90s/it]training loss: 5.644e-03:   0%|          | 1470/300001 [13:35:48<2719:11:05, 32.79s/it]training loss: 5.644e-03:   0%|          | 1471/300001 [13:36:21<2709:18:16, 32.67s/it]training loss: 5.644e-03:   0%|          | 1472/300001 [13:36:52<2679:42:12, 32.31s/it]training loss: 5.644e-03:   0%|          | 1473/300001 [13:37:25<2694:22:54, 32.49s/it]training loss: 5.644e-03:   0%|          | 1474/300001 [13:37:56<2664:58:21, 32.14s/it]training loss: 5.644e-03:   0%|          | 1475/300001 [13:38:29<2670:14:45, 32.20s/it]training loss: 5.644e-03:   0%|          | 1476/300001 [13:38:59<2637:11:06, 31.80s/it]training loss: 5.644e-03:   0%|          | 1477/300001 [13:39:37<2767:34:46, 33.38s/it]training loss: 5.644e-03:   0%|          | 1478/300001 [13:40:07<2701:35:03, 32.58s/it]training loss: 5.644e-03:   0%|          | 1479/300001 [13:40:40<2712:14:28, 32.71s/it]training loss: 5.644e-03:   0%|          | 1480/300001 [13:41:12<2697:47:12, 32.53s/it]training loss: 6.769e-03:   0%|          | 1480/300001 [13:41:45<2697:47:12, 32.53s/it]training loss: 6.769e-03:   0%|          | 1481/300001 [13:41:45<2705:42:19, 32.63s/it]training loss: 6.769e-03:   0%|          | 1482/300001 [13:42:18<2700:44:20, 32.57s/it]training loss: 6.769e-03:   0%|          | 1483/300001 [13:42:51<2724:17:46, 32.85s/it]training loss: 6.769e-03:   0%|          | 1484/300001 [13:43:24<2717:26:36, 32.77s/it]training loss: 6.769e-03:   0%|          | 1485/300001 [13:43:55<2689:48:35, 32.44s/it]training loss: 6.769e-03:   0%|          | 1486/300001 [13:44:28<2694:15:47, 32.49s/it]training loss: 6.769e-03:   0%|          | 1487/300001 [13:45:01<2695:46:59, 32.51s/it]training loss: 6.769e-03:   0%|          | 1488/300001 [13:45:33<2694:39:09, 32.50s/it]training loss: 6.769e-03:   0%|          | 1489/300001 [13:46:06<2703:54:55, 32.61s/it]training loss: 6.769e-03:   0%|          | 1490/300001 [13:46:38<2689:43:34, 32.44s/it]training loss: 6.769e-03:   0%|          | 1491/300001 [13:47:11<2701:28:30, 32.58s/it]training loss: 6.769e-03:   0%|          | 1492/300001 [13:47:42<2668:13:43, 32.18s/it]training loss: 6.769e-03:   0%|          | 1493/300001 [13:48:14<2648:29:07, 31.94s/it]training loss: 6.769e-03:   0%|          | 1494/300001 [13:48:46<2658:55:20, 32.07s/it]training loss: 6.769e-03:   0%|          | 1495/300001 [13:49:18<2652:47:22, 31.99s/it]training loss: 6.769e-03:   0%|          | 1496/300001 [13:49:51<2679:19:30, 32.31s/it]training loss: 6.769e-03:   0%|          | 1497/300001 [13:50:22<2664:13:02, 32.13s/it]training loss: 6.769e-03:   0%|          | 1498/300001 [13:50:56<2692:25:30, 32.47s/it]training loss: 6.769e-03:   0%|          | 1499/300001 [13:51:29<2706:41:57, 32.64s/it]training loss: 6.769e-03:   0%|          | 1500/300001 [13:52:01<2701:10:51, 32.58s/it]training loss: 6.362e-03:   0%|          | 1500/300001 [13:52:34<2701:10:51, 32.58s/it]training loss: 6.362e-03:   1%|          | 1501/300001 [13:52:38<2803:15:48, 33.81s/it]training loss: 6.362e-03:   1%|          | 1502/300001 [13:53:11<2793:25:40, 33.69s/it]training loss: 6.362e-03:   1%|          | 1503/300001 [13:53:45<2784:02:09, 33.58s/it]training loss: 6.362e-03:   1%|          | 1504/300001 [13:54:16<2739:34:05, 33.04s/it]training loss: 6.362e-03:   1%|          | 1505/300001 [13:54:49<2730:54:13, 32.94s/it]training loss: 6.362e-03:   1%|          | 1506/300001 [13:55:22<2731:54:54, 32.95s/it]training loss: 6.362e-03:   1%|          | 1507/300001 [13:55:55<2741:17:47, 33.06s/it]training loss: 6.362e-03:   1%|          | 1508/300001 [13:56:28<2721:33:29, 32.82s/it]training loss: 6.362e-03:   1%|          | 1509/300001 [13:57:00<2704:06:15, 32.61s/it]training loss: 6.362e-03:   1%|          | 1510/300001 [13:57:32<2703:12:29, 32.60s/it]training loss: 6.362e-03:   1%|          | 1511/300001 [13:58:04<2687:31:47, 32.41s/it]training loss: 6.362e-03:   1%|          | 1512/300001 [13:58:38<2715:02:15, 32.75s/it]training loss: 6.362e-03:   1%|          | 1513/300001 [13:59:10<2707:02:37, 32.65s/it]training loss: 6.362e-03:   1%|          | 1514/300001 [13:59:44<2724:59:45, 32.87s/it]training loss: 6.362e-03:   1%|          | 1515/300001 [14:00:17<2731:46:36, 32.95s/it]training loss: 6.362e-03:   1%|          | 1516/300001 [14:00:50<2746:41:04, 33.13s/it]training loss: 6.362e-03:   1%|          | 1517/300001 [14:01:22<2707:36:23, 32.66s/it]training loss: 6.362e-03:   1%|          | 1518/300001 [14:01:54<2682:55:42, 32.36s/it]training loss: 6.362e-03:   1%|          | 1519/300001 [14:02:26<2691:52:25, 32.47s/it]training loss: 6.362e-03:   1%|          | 1520/300001 [14:02:58<2666:59:26, 32.17s/it]training loss: 6.393e-03:   1%|          | 1520/300001 [14:03:30<2666:59:26, 32.17s/it]training loss: 6.393e-03:   1%|          | 1521/300001 [14:03:30<2661:55:30, 32.11s/it]training loss: 6.393e-03:   1%|          | 1522/300001 [14:04:03<2685:40:19, 32.39s/it]training loss: 6.393e-03:   1%|          | 1523/300001 [14:04:35<2693:18:40, 32.48s/it]training loss: 6.393e-03:   1%|          | 1524/300001 [14:05:08<2686:22:59, 32.40s/it]training loss: 6.393e-03:   1%|          | 1525/300001 [14:05:40<2679:45:38, 32.32s/it]training loss: 6.393e-03:   1%|          | 1526/300001 [14:06:12<2668:38:31, 32.19s/it]training loss: 6.393e-03:   1%|          | 1527/300001 [14:06:45<2689:07:11, 32.43s/it]training loss: 6.393e-03:   1%|          | 1528/300001 [14:07:17<2696:24:04, 32.52s/it]training loss: 6.393e-03:   1%|          | 1529/300001 [14:07:50<2706:35:38, 32.65s/it]training loss: 6.393e-03:   1%|          | 1530/300001 [14:08:22<2694:05:33, 32.49s/it]training loss: 6.393e-03:   1%|          | 1531/300001 [14:08:55<2696:30:17, 32.52s/it]training loss: 6.393e-03:   1%|          | 1532/300001 [14:09:28<2697:58:03, 32.54s/it]training loss: 6.393e-03:   1%|          | 1533/300001 [14:10:00<2691:51:12, 32.47s/it]training loss: 6.393e-03:   1%|          | 1534/300001 [14:10:33<2717:51:09, 32.78s/it]training loss: 6.393e-03:   1%|          | 1535/300001 [14:11:05<2691:18:40, 32.46s/it]training loss: 6.393e-03:   1%|          | 1536/300001 [14:11:37<2678:34:19, 32.31s/it]training loss: 6.393e-03:   1%|          | 1537/300001 [14:12:08<2650:16:14, 31.97s/it]training loss: 6.393e-03:   1%|          | 1538/300001 [14:12:41<2679:30:20, 32.32s/it]training loss: 6.393e-03:   1%|          | 1539/300001 [14:13:13<2669:26:09, 32.20s/it]training loss: 6.393e-03:   1%|          | 1540/300001 [14:13:45<2664:22:54, 32.14s/it]training loss: 6.439e-03:   1%|          | 1540/300001 [14:14:16<2664:22:54, 32.14s/it]training loss: 6.439e-03:   1%|          | 1541/300001 [14:14:16<2637:08:04, 31.81s/it]training loss: 6.439e-03:   1%|          | 1542/300001 [14:14:48<2620:22:16, 31.61s/it]training loss: 6.439e-03:   1%|          | 1543/300001 [14:15:20<2631:41:10, 31.74s/it]training loss: 6.439e-03:   1%|          | 1544/300001 [14:15:52<2649:50:35, 31.96s/it]training loss: 6.439e-03:   1%|          | 1545/300001 [14:16:24<2656:29:10, 32.04s/it]training loss: 6.439e-03:   1%|          | 1546/300001 [14:16:58<2692:32:26, 32.48s/it]training loss: 6.439e-03:   1%|          | 1547/300001 [14:17:29<2671:29:47, 32.22s/it]training loss: 6.439e-03:   1%|          | 1548/300001 [14:18:02<2674:20:16, 32.26s/it]training loss: 6.439e-03:   1%|          | 1549/300001 [14:18:34<2669:56:36, 32.21s/it]training loss: 6.439e-03:   1%|          | 1550/300001 [14:19:07<2702:10:38, 32.59s/it]training loss: 6.439e-03:   1%|          | 1551/300001 [14:19:40<2702:26:51, 32.60s/it]training loss: 6.439e-03:   1%|          | 1552/300001 [14:20:12<2692:30:21, 32.48s/it]training loss: 6.439e-03:   1%|          | 1553/300001 [14:20:46<2714:19:58, 32.74s/it]training loss: 6.439e-03:   1%|          | 1554/300001 [14:21:18<2712:27:47, 32.72s/it]training loss: 6.439e-03:   1%|          | 1555/300001 [14:21:51<2726:57:21, 32.89s/it]training loss: 6.439e-03:   1%|          | 1556/300001 [14:22:25<2732:27:55, 32.96s/it]training loss: 6.439e-03:   1%|          | 1557/300001 [14:22:57<2727:44:34, 32.90s/it]training loss: 6.439e-03:   1%|          | 1558/300001 [14:23:29<2707:36:25, 32.66s/it]training loss: 6.439e-03:   1%|          | 1559/300001 [14:24:02<2702:39:53, 32.60s/it]training loss: 6.439e-03:   1%|          | 1560/300001 [14:24:35<2714:09:43, 32.74s/it]training loss: 6.638e-03:   1%|          | 1560/300001 [14:25:07<2714:09:43, 32.74s/it]training loss: 6.638e-03:   1%|          | 1561/300001 [14:25:07<2707:37:10, 32.66s/it]training loss: 6.638e-03:   1%|          | 1562/300001 [14:25:39<2681:38:49, 32.35s/it]training loss: 6.638e-03:   1%|          | 1563/300001 [14:26:12<2686:23:35, 32.41s/it]training loss: 6.638e-03:   1%|          | 1564/300001 [14:26:43<2672:26:12, 32.24s/it]training loss: 6.638e-03:   1%|          | 1565/300001 [14:27:16<2684:57:19, 32.39s/it]training loss: 6.638e-03:   1%|          | 1566/300001 [14:27:48<2665:39:15, 32.16s/it]training loss: 6.638e-03:   1%|          | 1567/300001 [14:28:20<2662:27:30, 32.12s/it]training loss: 6.638e-03:   1%|          | 1568/300001 [14:28:52<2661:33:43, 32.11s/it]training loss: 6.638e-03:   1%|          | 1569/300001 [14:29:23<2635:05:48, 31.79s/it]training loss: 6.638e-03:   1%|          | 1570/300001 [14:29:46<2408:51:23, 29.06s/it]training loss: 6.638e-03:   1%|          | 1571/300001 [14:30:17<2467:04:01, 29.76s/it]training loss: 6.638e-03:   1%|          | 1572/300001 [14:30:50<2546:55:27, 30.72s/it]training loss: 6.638e-03:   1%|          | 1573/300001 [14:31:22<2574:13:17, 31.05s/it]training loss: 6.638e-03:   1%|          | 1574/300001 [14:31:53<2587:54:53, 31.22s/it]training loss: 6.638e-03:   1%|          | 1575/300001 [14:32:27<2641:48:15, 31.87s/it]training loss: 6.638e-03:   1%|          | 1576/300001 [14:32:59<2660:55:45, 32.10s/it]training loss: 6.638e-03:   1%|          | 1577/300001 [14:33:32<2673:24:38, 32.25s/it]training loss: 6.638e-03:   1%|          | 1578/300001 [14:34:04<2675:46:29, 32.28s/it]training loss: 6.638e-03:   1%|          | 1579/300001 [14:34:36<2662:54:32, 32.12s/it]training loss: 6.638e-03:   1%|          | 1580/300001 [14:35:08<2661:29:56, 32.11s/it]training loss: 5.934e-03:   1%|          | 1580/300001 [14:35:40<2661:29:56, 32.11s/it]training loss: 5.934e-03:   1%|          | 1581/300001 [14:35:40<2657:18:07, 32.06s/it]training loss: 5.934e-03:   1%|          | 1582/300001 [14:36:12<2658:01:56, 32.07s/it]training loss: 5.934e-03:   1%|          | 1583/300001 [14:36:44<2651:35:12, 31.99s/it]training loss: 5.934e-03:   1%|          | 1584/300001 [14:37:17<2676:53:02, 32.29s/it]training loss: 5.934e-03:   1%|          | 1585/300001 [14:37:49<2665:30:40, 32.16s/it]training loss: 5.934e-03:   1%|          | 1586/300001 [14:38:21<2662:37:55, 32.12s/it]training loss: 5.934e-03:   1%|          | 1587/300001 [14:38:53<2668:37:26, 32.19s/it]training loss: 5.934e-03:   1%|          | 1588/300001 [14:39:26<2668:16:01, 32.19s/it]training loss: 5.934e-03:   1%|          | 1589/300001 [14:39:57<2650:21:35, 31.97s/it]training loss: 5.934e-03:   1%|          | 1590/300001 [14:40:30<2683:34:15, 32.37s/it]training loss: 5.934e-03:   1%|          | 1591/300001 [14:41:03<2680:32:38, 32.34s/it]training loss: 5.934e-03:   1%|          | 1592/300001 [14:41:34<2668:40:31, 32.19s/it]training loss: 5.934e-03:   1%|          | 1593/300001 [14:42:06<2660:59:36, 32.10s/it]training loss: 5.934e-03:   1%|          | 1594/300001 [14:42:40<2698:39:39, 32.56s/it]training loss: 5.934e-03:   1%|          | 1595/300001 [14:43:12<2691:23:20, 32.47s/it]training loss: 5.934e-03:   1%|          | 1596/300001 [14:43:44<2664:45:56, 32.15s/it]training loss: 5.934e-03:   1%|          | 1597/300001 [14:44:15<2658:00:51, 32.07s/it]training loss: 5.934e-03:   1%|          | 1598/300001 [14:44:50<2707:04:34, 32.66s/it]training loss: 5.934e-03:   1%|          | 1599/300001 [14:45:21<2683:46:45, 32.38s/it]training loss: 5.934e-03:   1%|          | 1600/300001 [14:45:53<2668:17:41, 32.19s/it]training loss: 6.752e-03:   1%|          | 1600/300001 [14:46:25<2668:17:41, 32.19s/it]training loss: 6.752e-03:   1%|          | 1601/300001 [14:46:25<2664:48:18, 32.15s/it]training loss: 6.752e-03:   1%|          | 1602/300001 [14:46:57<2655:10:54, 32.03s/it]training loss: 6.752e-03:   1%|          | 1603/300001 [14:47:30<2680:24:52, 32.34s/it]training loss: 6.752e-03:   1%|          | 1604/300001 [14:48:01<2641:56:28, 31.87s/it]training loss: 6.752e-03:   1%|          | 1605/300001 [14:48:32<2635:15:09, 31.79s/it]training loss: 6.752e-03:   1%|          | 1606/300001 [14:49:05<2658:13:19, 32.07s/it]training loss: 6.752e-03:   1%|          | 1607/300001 [14:49:37<2652:15:22, 32.00s/it]training loss: 6.752e-03:   1%|          | 1608/300001 [14:50:10<2670:41:17, 32.22s/it]training loss: 6.752e-03:   1%|          | 1609/300001 [14:50:42<2681:52:24, 32.36s/it]training loss: 6.752e-03:   1%|          | 1610/300001 [14:51:16<2706:39:27, 32.66s/it]training loss: 6.752e-03:   1%|          | 1611/300001 [14:51:47<2678:33:46, 32.32s/it]training loss: 6.752e-03:   1%|          | 1612/300001 [14:52:20<2683:31:37, 32.38s/it]training loss: 6.752e-03:   1%|          | 1613/300001 [14:52:51<2668:55:58, 32.20s/it]training loss: 6.752e-03:   1%|          | 1614/300001 [14:53:23<2654:34:00, 32.03s/it]training loss: 6.752e-03:   1%|          | 1615/300001 [14:53:56<2680:15:06, 32.34s/it]training loss: 6.752e-03:   1%|          | 1616/300001 [14:54:29<2705:33:29, 32.64s/it]training loss: 6.752e-03:   1%|          | 1617/300001 [14:55:02<2706:46:56, 32.66s/it]training loss: 6.752e-03:   1%|          | 1618/300001 [14:55:35<2719:16:54, 32.81s/it]training loss: 6.752e-03:   1%|          | 1619/300001 [14:56:07<2702:34:00, 32.61s/it]training loss: 6.752e-03:   1%|          | 1620/300001 [14:56:40<2701:37:56, 32.60s/it]training loss: 6.198e-03:   1%|          | 1620/300001 [14:57:12<2701:37:56, 32.60s/it]training loss: 6.198e-03:   1%|          | 1621/300001 [14:57:12<2694:10:36, 32.51s/it]training loss: 6.198e-03:   1%|          | 1622/300001 [14:57:44<2685:58:58, 32.41s/it]training loss: 6.198e-03:   1%|          | 1623/300001 [14:58:17<2696:58:12, 32.54s/it]training loss: 6.198e-03:   1%|          | 1624/300001 [14:58:49<2684:24:54, 32.39s/it]training loss: 6.198e-03:   1%|          | 1625/300001 [14:59:23<2725:39:25, 32.89s/it]training loss: 6.198e-03:   1%|          | 1626/300001 [14:59:56<2722:16:34, 32.85s/it]training loss: 6.198e-03:   1%|          | 1627/300001 [15:00:29<2732:58:39, 32.97s/it]training loss: 6.198e-03:   1%|          | 1628/300001 [15:01:03<2739:02:42, 33.05s/it]training loss: 6.198e-03:   1%|          | 1629/300001 [15:01:34<2699:45:22, 32.57s/it]training loss: 6.198e-03:   1%|          | 1630/300001 [15:02:06<2685:35:13, 32.40s/it]training loss: 6.198e-03:   1%|          | 1631/300001 [15:02:38<2673:17:06, 32.25s/it]training loss: 6.198e-03:   1%|          | 1632/300001 [15:03:10<2665:51:27, 32.17s/it]training loss: 6.198e-03:   1%|          | 1633/300001 [15:03:43<2681:18:22, 32.35s/it]training loss: 6.198e-03:   1%|          | 1634/300001 [15:04:15<2679:45:39, 32.33s/it]training loss: 6.198e-03:   1%|          | 1635/300001 [15:04:48<2693:50:02, 32.50s/it]training loss: 6.198e-03:   1%|          | 1636/300001 [15:05:21<2705:24:48, 32.64s/it]training loss: 6.198e-03:   1%|          | 1637/300001 [15:05:54<2720:07:34, 32.82s/it]training loss: 6.198e-03:   1%|          | 1638/300001 [15:06:27<2711:16:55, 32.71s/it]training loss: 6.198e-03:   1%|          | 1639/300001 [15:06:59<2699:37:04, 32.57s/it]training loss: 6.198e-03:   1%|          | 1640/300001 [15:07:33<2738:05:40, 33.04s/it]training loss: 6.128e-03:   1%|          | 1640/300001 [15:08:05<2738:05:40, 33.04s/it]training loss: 6.128e-03:   1%|          | 1641/300001 [15:08:05<2711:57:46, 32.72s/it]training loss: 6.128e-03:   1%|          | 1642/300001 [15:08:37<2700:36:14, 32.59s/it]training loss: 6.128e-03:   1%|          | 1643/300001 [15:09:08<2662:40:05, 32.13s/it]training loss: 6.128e-03:   1%|          | 1644/300001 [15:09:41<2665:03:37, 32.16s/it]training loss: 6.128e-03:   1%|          | 1645/300001 [15:10:13<2683:38:24, 32.38s/it]training loss: 6.128e-03:   1%|          | 1646/300001 [15:10:47<2706:27:27, 32.66s/it]training loss: 6.128e-03:   1%|          | 1647/300001 [15:11:21<2749:47:00, 33.18s/it]training loss: 6.128e-03:   1%|          | 1648/300001 [15:11:54<2749:25:19, 33.18s/it]training loss: 6.128e-03:   1%|          | 1649/300001 [15:12:26<2707:09:07, 32.67s/it]training loss: 6.128e-03:   1%|          | 1650/300001 [15:12:58<2706:41:31, 32.66s/it]training loss: 6.128e-03:   1%|          | 1651/300001 [15:13:31<2706:18:05, 32.66s/it]training loss: 6.128e-03:   1%|          | 1652/300001 [15:14:02<2665:38:07, 32.16s/it]training loss: 6.128e-03:   1%|          | 1653/300001 [15:14:35<2685:01:25, 32.40s/it]training loss: 6.128e-03:   1%|          | 1654/300001 [15:15:07<2668:54:51, 32.20s/it]training loss: 6.128e-03:   1%|          | 1655/300001 [15:15:38<2648:04:20, 31.95s/it]training loss: 6.128e-03:   1%|          | 1656/300001 [15:16:10<2643:34:34, 31.90s/it]training loss: 6.128e-03:   1%|          | 1657/300001 [15:16:44<2686:38:48, 32.42s/it]training loss: 6.128e-03:   1%|          | 1658/300001 [15:17:15<2669:26:21, 32.21s/it]training loss: 6.128e-03:   1%|          | 1659/300001 [15:17:47<2666:36:32, 32.18s/it]training loss: 6.128e-03:   1%|          | 1660/300001 [15:18:20<2678:58:52, 32.33s/it]training loss: 6.565e-03:   1%|          | 1660/300001 [15:18:52<2678:58:52, 32.33s/it]training loss: 6.565e-03:   1%|          | 1661/300001 [15:18:52<2670:00:15, 32.22s/it]training loss: 6.565e-03:   1%|          | 1662/300001 [15:19:25<2678:08:33, 32.32s/it]training loss: 6.565e-03:   1%|          | 1663/300001 [15:19:57<2683:17:04, 32.38s/it]training loss: 6.565e-03:   1%|          | 1664/300001 [15:20:29<2666:24:42, 32.18s/it]training loss: 6.565e-03:   1%|          | 1665/300001 [15:21:00<2652:22:35, 32.01s/it]training loss: 6.565e-03:   1%|          | 1666/300001 [15:21:32<2649:10:20, 31.97s/it]training loss: 6.565e-03:   1%|          | 1667/300001 [15:22:04<2649:33:14, 31.97s/it]training loss: 6.565e-03:   1%|          | 1668/300001 [15:22:37<2667:53:59, 32.19s/it]training loss: 6.565e-03:   1%|          | 1669/300001 [15:23:09<2665:13:36, 32.16s/it]training loss: 6.565e-03:   1%|          | 1670/300001 [15:23:42<2685:59:39, 32.41s/it]training loss: 6.565e-03:   1%|          | 1671/300001 [15:24:14<2680:58:39, 32.35s/it]training loss: 6.565e-03:   1%|          | 1672/300001 [15:24:47<2686:19:13, 32.42s/it]training loss: 6.565e-03:   1%|          | 1673/300001 [15:25:19<2674:18:04, 32.27s/it]training loss: 6.565e-03:   1%|          | 1674/300001 [15:25:52<2706:53:12, 32.66s/it]training loss: 6.565e-03:   1%|          | 1675/300001 [15:26:25<2703:25:08, 32.62s/it]training loss: 6.565e-03:   1%|          | 1676/300001 [15:26:56<2672:57:32, 32.26s/it]training loss: 6.565e-03:   1%|          | 1677/300001 [15:27:29<2673:02:39, 32.26s/it]training loss: 6.565e-03:   1%|          | 1678/300001 [15:28:01<2670:31:56, 32.23s/it]training loss: 6.565e-03:   1%|          | 1679/300001 [15:28:33<2681:07:42, 32.35s/it]training loss: 6.565e-03:   1%|          | 1680/300001 [15:29:06<2701:02:40, 32.59s/it]training loss: 6.493e-03:   1%|          | 1680/300001 [15:29:40<2701:02:40, 32.59s/it]training loss: 6.493e-03:   1%|          | 1681/300001 [15:29:40<2724:30:30, 32.88s/it]training loss: 6.493e-03:   1%|          | 1682/300001 [15:30:13<2717:10:01, 32.79s/it]training loss: 6.493e-03:   1%|          | 1683/300001 [15:30:45<2712:39:19, 32.74s/it]training loss: 6.493e-03:   1%|          | 1684/300001 [15:31:20<2751:39:08, 33.21s/it]training loss: 6.493e-03:   1%|          | 1685/300001 [15:31:53<2751:57:44, 33.21s/it]training loss: 6.493e-03:   1%|          | 1686/300001 [15:32:25<2733:41:28, 32.99s/it]training loss: 6.493e-03:   1%|          | 1687/300001 [15:32:58<2724:26:12, 32.88s/it]training loss: 6.493e-03:   1%|          | 1688/300001 [15:33:29<2679:31:40, 32.34s/it]training loss: 6.493e-03:   1%|          | 1689/300001 [15:34:02<2688:22:21, 32.44s/it]training loss: 6.493e-03:   1%|          | 1690/300001 [15:34:33<2658:47:13, 32.09s/it]training loss: 6.493e-03:   1%|          | 1691/300001 [15:35:05<2652:56:59, 32.02s/it]training loss: 6.493e-03:   1%|          | 1692/300001 [15:35:37<2661:38:35, 32.12s/it]training loss: 6.493e-03:   1%|          | 1693/300001 [15:36:10<2681:33:40, 32.36s/it]training loss: 6.493e-03:   1%|          | 1694/300001 [15:36:42<2684:31:34, 32.40s/it]training loss: 6.493e-03:   1%|          | 1695/300001 [15:37:14<2659:34:43, 32.10s/it]training loss: 6.493e-03:   1%|          | 1696/300001 [15:37:47<2686:19:52, 32.42s/it]training loss: 6.493e-03:   1%|          | 1697/300001 [15:38:19<2679:41:25, 32.34s/it]training loss: 6.493e-03:   1%|          | 1698/300001 [15:38:51<2660:53:14, 32.11s/it]training loss: 6.493e-03:   1%|          | 1699/300001 [15:39:23<2655:41:13, 32.05s/it]training loss: 6.493e-03:   1%|          | 1700/300001 [15:39:56<2676:53:11, 32.31s/it]training loss: 5.503e-03:   1%|          | 1700/300001 [15:40:29<2676:53:11, 32.31s/it]training loss: 5.503e-03:   1%|          | 1701/300001 [15:40:29<2702:02:27, 32.61s/it]training loss: 5.503e-03:   1%|          | 1702/300001 [15:41:01<2694:36:10, 32.52s/it]training loss: 5.503e-03:   1%|          | 1703/300001 [15:41:33<2685:10:18, 32.41s/it]training loss: 5.503e-03:   1%|          | 1704/300001 [15:42:05<2675:24:48, 32.29s/it]training loss: 5.503e-03:   1%|          | 1705/300001 [15:42:38<2683:51:30, 32.39s/it]training loss: 5.503e-03:   1%|          | 1706/300001 [15:43:10<2678:37:14, 32.33s/it]training loss: 5.503e-03:   1%|          | 1707/300001 [15:43:42<2670:17:22, 32.23s/it]training loss: 5.503e-03:   1%|          | 1708/300001 [15:44:15<2674:39:37, 32.28s/it]training loss: 5.503e-03:   1%|          | 1709/300001 [15:44:45<2633:15:34, 31.78s/it]training loss: 5.503e-03:   1%|          | 1710/300001 [15:45:17<2629:16:23, 31.73s/it]training loss: 5.503e-03:   1%|          | 1711/300001 [15:45:51<2691:57:29, 32.49s/it]training loss: 5.503e-03:   1%|          | 1712/300001 [15:46:23<2680:39:34, 32.35s/it]training loss: 5.503e-03:   1%|          | 1713/300001 [15:46:56<2692:14:47, 32.49s/it]training loss: 5.503e-03:   1%|          | 1714/300001 [15:47:28<2689:23:12, 32.46s/it]training loss: 5.503e-03:   1%|          | 1715/300001 [15:48:00<2676:52:51, 32.31s/it]training loss: 5.503e-03:   1%|          | 1716/300001 [15:48:32<2674:15:33, 32.28s/it]training loss: 5.503e-03:   1%|          | 1717/300001 [15:49:04<2667:40:18, 32.20s/it]training loss: 5.503e-03:   1%|          | 1718/300001 [15:49:37<2666:53:21, 32.19s/it]training loss: 5.503e-03:   1%|          | 1719/300001 [15:50:10<2693:45:13, 32.51s/it]training loss: 5.503e-03:   1%|          | 1720/300001 [15:50:43<2709:00:36, 32.70s/it]training loss: 7.025e-03:   1%|          | 1720/300001 [15:51:16<2709:00:36, 32.70s/it]training loss: 7.025e-03:   1%|          | 1721/300001 [15:51:16<2709:15:15, 32.70s/it]training loss: 7.025e-03:   1%|          | 1722/300001 [15:51:48<2708:42:13, 32.69s/it]training loss: 7.025e-03:   1%|          | 1723/300001 [15:52:21<2715:51:17, 32.78s/it]training loss: 7.025e-03:   1%|          | 1724/300001 [15:52:53<2696:41:29, 32.55s/it]training loss: 7.025e-03:   1%|          | 1725/300001 [15:53:26<2697:26:05, 32.56s/it]training loss: 7.025e-03:   1%|          | 1726/300001 [15:53:58<2683:19:59, 32.39s/it]training loss: 7.025e-03:   1%|          | 1727/300001 [15:54:22<2464:12:48, 29.74s/it]training loss: 7.025e-03:   1%|          | 1728/300001 [15:54:53<2505:57:53, 30.25s/it]training loss: 7.025e-03:   1%|          | 1729/300001 [15:55:25<2555:25:41, 30.84s/it]training loss: 7.025e-03:   1%|          | 1730/300001 [15:55:59<2627:37:04, 31.71s/it]training loss: 7.025e-03:   1%|          | 1731/300001 [15:56:31<2632:17:01, 31.77s/it]training loss: 7.025e-03:   1%|          | 1732/300001 [15:57:03<2652:20:56, 32.01s/it]training loss: 7.025e-03:   1%|          | 1733/300001 [15:57:36<2655:59:24, 32.06s/it]training loss: 7.025e-03:   1%|          | 1734/300001 [15:58:08<2669:58:57, 32.23s/it]training loss: 7.025e-03:   1%|          | 1735/300001 [15:58:40<2670:17:47, 32.23s/it]training loss: 7.025e-03:   1%|          | 1736/300001 [15:59:13<2668:49:09, 32.21s/it]training loss: 7.025e-03:   1%|          | 1737/300001 [15:59:45<2676:44:07, 32.31s/it]training loss: 7.025e-03:   1%|          | 1738/300001 [16:00:19<2708:23:58, 32.69s/it]training loss: 7.025e-03:   1%|          | 1739/300001 [16:00:50<2685:20:16, 32.41s/it]training loss: 7.025e-03:   1%|          | 1740/300001 [16:01:23<2689:11:52, 32.46s/it]training loss: 5.643e-03:   1%|          | 1740/300001 [16:01:56<2689:11:52, 32.46s/it]training loss: 5.643e-03:   1%|          | 1741/300001 [16:01:56<2700:04:10, 32.59s/it]training loss: 5.643e-03:   1%|          | 1742/300001 [16:02:29<2703:29:42, 32.63s/it]training loss: 5.643e-03:   1%|          | 1743/300001 [16:03:01<2691:08:24, 32.48s/it]training loss: 5.643e-03:   1%|          | 1744/300001 [16:03:33<2690:19:53, 32.47s/it]training loss: 5.643e-03:   1%|          | 1745/300001 [16:04:05<2673:35:46, 32.27s/it]training loss: 5.643e-03:   1%|          | 1746/300001 [16:04:37<2663:06:40, 32.14s/it]training loss: 5.643e-03:   1%|          | 1747/300001 [16:05:09<2654:06:28, 32.04s/it]training loss: 5.643e-03:   1%|          | 1748/300001 [16:05:42<2674:44:02, 32.28s/it]training loss: 5.643e-03:   1%|          | 1749/300001 [16:06:14<2686:36:14, 32.43s/it]training loss: 5.643e-03:   1%|          | 1750/300001 [16:06:47<2681:56:56, 32.37s/it]training loss: 5.643e-03:   1%|          | 1751/300001 [16:07:19<2676:54:34, 32.31s/it]training loss: 5.643e-03:   1%|          | 1752/300001 [16:07:51<2668:59:54, 32.22s/it]training loss: 5.643e-03:   1%|          | 1753/300001 [16:08:23<2667:45:18, 32.20s/it]training loss: 5.643e-03:   1%|          | 1754/300001 [16:08:55<2668:47:34, 32.21s/it]training loss: 5.643e-03:   1%|          | 1755/300001 [16:09:28<2675:28:00, 32.29s/it]training loss: 5.643e-03:   1%|          | 1756/300001 [16:09:59<2657:25:43, 32.08s/it]training loss: 5.643e-03:   1%|          | 1757/300001 [16:10:31<2656:28:47, 32.07s/it]training loss: 5.643e-03:   1%|          | 1758/300001 [16:11:05<2710:25:01, 32.72s/it]training loss: 5.643e-03:   1%|          | 1759/300001 [16:11:38<2715:40:09, 32.78s/it]training loss: 5.643e-03:   1%|          | 1760/300001 [16:12:10<2696:56:43, 32.55s/it]training loss: 6.215e-03:   1%|          | 1760/300001 [16:12:44<2696:56:43, 32.55s/it]training loss: 6.215e-03:   1%|          | 1761/300001 [16:12:44<2715:42:35, 32.78s/it]training loss: 6.215e-03:   1%|          | 1762/300001 [16:13:16<2707:29:28, 32.68s/it]training loss: 6.215e-03:   1%|          | 1763/300001 [16:13:49<2714:49:13, 32.77s/it]training loss: 6.215e-03:   1%|          | 1764/300001 [16:14:21<2695:54:27, 32.54s/it]training loss: 6.215e-03:   1%|          | 1765/300001 [16:14:54<2702:41:23, 32.62s/it]training loss: 6.215e-03:   1%|          | 1766/300001 [16:15:26<2692:53:22, 32.51s/it]training loss: 6.215e-03:   1%|          | 1767/300001 [16:15:58<2672:42:28, 32.26s/it]training loss: 6.215e-03:   1%|          | 1768/300001 [16:16:30<2669:59:18, 32.23s/it]training loss: 6.215e-03:   1%|          | 1769/300001 [16:17:03<2679:51:53, 32.35s/it]training loss: 6.215e-03:   1%|          | 1770/300001 [16:17:35<2677:29:40, 32.32s/it]training loss: 6.215e-03:   1%|          | 1771/300001 [16:18:08<2686:41:59, 32.43s/it]training loss: 6.215e-03:   1%|          | 1772/300001 [16:18:40<2684:10:55, 32.40s/it]training loss: 6.215e-03:   1%|          | 1773/300001 [16:19:13<2708:14:55, 32.69s/it]training loss: 6.215e-03:   1%|          | 1774/300001 [16:19:45<2690:44:32, 32.48s/it]training loss: 6.215e-03:   1%|          | 1775/300001 [16:20:18<2702:21:45, 32.62s/it]training loss: 6.215e-03:   1%|          | 1776/300001 [16:20:51<2713:38:41, 32.76s/it]training loss: 6.215e-03:   1%|          | 1777/300001 [16:21:25<2730:54:51, 32.97s/it]training loss: 6.215e-03:   1%|          | 1778/300001 [16:21:59<2752:52:03, 33.23s/it]training loss: 6.215e-03:   1%|          | 1779/300001 [16:22:29<2684:54:01, 32.41s/it]training loss: 6.215e-03:   1%|          | 1780/300001 [16:23:02<2695:42:19, 32.54s/it]training loss: 6.240e-03:   1%|          | 1780/300001 [16:23:34<2695:42:19, 32.54s/it]training loss: 6.240e-03:   1%|          | 1781/300001 [16:23:34<2687:37:22, 32.44s/it]training loss: 6.240e-03:   1%|          | 1782/300001 [16:24:07<2697:26:23, 32.56s/it]training loss: 6.240e-03:   1%|          | 1783/300001 [16:24:39<2686:50:10, 32.43s/it]training loss: 6.240e-03:   1%|          | 1784/300001 [16:25:11<2667:57:32, 32.21s/it]training loss: 6.240e-03:   1%|          | 1785/300001 [16:25:45<2709:09:59, 32.70s/it]training loss: 6.240e-03:   1%|          | 1786/300001 [16:26:17<2705:01:56, 32.65s/it]training loss: 6.240e-03:   1%|          | 1787/300001 [16:26:49<2691:02:52, 32.49s/it]training loss: 6.240e-03:   1%|          | 1788/300001 [16:27:22<2705:27:03, 32.66s/it]training loss: 6.240e-03:   1%|          | 1789/300001 [16:27:55<2694:14:33, 32.52s/it]training loss: 6.240e-03:   1%|          | 1790/300001 [16:28:27<2698:31:46, 32.58s/it]training loss: 6.240e-03:   1%|          | 1791/300001 [16:29:00<2706:00:34, 32.67s/it]training loss: 6.240e-03:   1%|          | 1792/300001 [16:29:34<2723:20:36, 32.88s/it]training loss: 6.240e-03:   1%|          | 1793/300001 [16:30:06<2709:06:54, 32.70s/it]training loss: 6.240e-03:   1%|          | 1794/300001 [16:30:37<2681:46:43, 32.37s/it]training loss: 6.240e-03:   1%|          | 1795/300001 [16:31:10<2681:39:53, 32.37s/it]training loss: 6.240e-03:   1%|          | 1796/300001 [16:31:42<2680:41:00, 32.36s/it]training loss: 6.240e-03:   1%|          | 1797/300001 [16:32:15<2699:36:11, 32.59s/it]training loss: 6.240e-03:   1%|          | 1798/300001 [16:32:47<2667:35:21, 32.20s/it]training loss: 6.240e-03:   1%|          | 1799/300001 [16:33:18<2659:13:58, 32.10s/it]training loss: 6.240e-03:   1%|          | 1800/300001 [16:33:50<2649:45:18, 31.99s/it]training loss: 5.854e-03:   1%|          | 1800/300001 [16:34:22<2649:45:18, 31.99s/it]training loss: 5.854e-03:   1%|          | 1801/300001 [16:34:22<2656:01:28, 32.06s/it]training loss: 5.854e-03:   1%|          | 1802/300001 [16:34:54<2648:43:31, 31.98s/it]training loss: 5.854e-03:   1%|          | 1803/300001 [16:35:26<2646:48:40, 31.95s/it]training loss: 5.854e-03:   1%|          | 1804/300001 [16:36:00<2696:16:02, 32.55s/it]training loss: 5.854e-03:   1%|          | 1805/300001 [16:36:33<2709:51:40, 32.72s/it]training loss: 5.854e-03:   1%|          | 1806/300001 [16:37:05<2692:59:21, 32.51s/it]training loss: 5.854e-03:   1%|          | 1807/300001 [16:37:38<2695:11:19, 32.54s/it]training loss: 5.854e-03:   1%|          | 1808/300001 [16:38:11<2713:48:38, 32.76s/it]training loss: 5.854e-03:   1%|          | 1809/300001 [16:38:43<2687:01:18, 32.44s/it]training loss: 5.854e-03:   1%|          | 1810/300001 [16:39:16<2701:22:38, 32.61s/it]training loss: 5.854e-03:   1%|          | 1811/300001 [16:39:48<2684:06:31, 32.40s/it]training loss: 5.854e-03:   1%|          | 1812/300001 [16:40:21<2701:20:12, 32.61s/it]training loss: 5.854e-03:   1%|          | 1813/300001 [16:40:54<2707:43:28, 32.69s/it]training loss: 5.854e-03:   1%|          | 1814/300001 [16:41:25<2679:00:18, 32.34s/it]training loss: 5.854e-03:   1%|          | 1815/300001 [16:41:57<2677:57:38, 32.33s/it]training loss: 5.854e-03:   1%|          | 1816/300001 [16:42:31<2699:23:39, 32.59s/it]training loss: 5.854e-03:   1%|          | 1817/300001 [16:43:03<2687:18:06, 32.44s/it]training loss: 5.854e-03:   1%|          | 1818/300001 [16:43:36<2698:21:09, 32.58s/it]training loss: 5.854e-03:   1%|          | 1819/300001 [16:44:09<2717:06:55, 32.80s/it]training loss: 5.854e-03:   1%|          | 1820/300001 [16:44:42<2729:34:37, 32.95s/it]training loss: 7.059e-03:   1%|          | 1820/300001 [16:45:15<2729:34:37, 32.95s/it]training loss: 7.059e-03:   1%|          | 1821/300001 [16:45:15<2721:27:56, 32.86s/it]training loss: 7.059e-03:   1%|          | 1822/300001 [16:45:47<2703:12:31, 32.64s/it]training loss: 7.059e-03:   1%|          | 1823/300001 [16:46:20<2709:37:50, 32.71s/it]training loss: 7.059e-03:   1%|          | 1824/300001 [16:46:53<2723:40:31, 32.88s/it]training loss: 7.059e-03:   1%|          | 1825/300001 [16:47:26<2718:49:22, 32.83s/it]training loss: 7.059e-03:   1%|          | 1826/300001 [16:47:58<2701:13:47, 32.61s/it]training loss: 7.059e-03:   1%|          | 1827/300001 [16:48:31<2709:47:48, 32.72s/it]training loss: 7.059e-03:   1%|          | 1828/300001 [16:49:03<2689:06:24, 32.47s/it]training loss: 7.059e-03:   1%|          | 1829/300001 [16:49:34<2665:19:36, 32.18s/it]training loss: 7.059e-03:   1%|          | 1830/300001 [16:50:06<2653:38:49, 32.04s/it]training loss: 7.059e-03:   1%|          | 1831/300001 [16:50:39<2678:16:30, 32.34s/it]training loss: 7.059e-03:   1%|          | 1832/300001 [16:51:10<2647:57:48, 31.97s/it]training loss: 7.059e-03:   1%|          | 1833/300001 [16:51:42<2645:22:49, 31.94s/it]training loss: 7.059e-03:   1%|          | 1834/300001 [16:52:15<2677:01:33, 32.32s/it]training loss: 7.059e-03:   1%|          | 1835/300001 [16:52:49<2722:07:13, 32.87s/it]training loss: 7.059e-03:   1%|          | 1836/300001 [16:53:22<2702:12:02, 32.63s/it]training loss: 7.059e-03:   1%|          | 1837/300001 [16:53:54<2693:05:01, 32.52s/it]training loss: 7.059e-03:   1%|          | 1838/300001 [16:54:27<2700:14:24, 32.60s/it]training loss: 7.059e-03:   1%|          | 1839/300001 [16:54:59<2707:17:39, 32.69s/it]training loss: 7.059e-03:   1%|          | 1840/300001 [16:55:31<2678:39:13, 32.34s/it]training loss: 5.940e-03:   1%|          | 1840/300001 [16:56:03<2678:39:13, 32.34s/it]training loss: 5.940e-03:   1%|          | 1841/300001 [16:56:04<2683:30:34, 32.40s/it]training loss: 5.940e-03:   1%|          | 1842/300001 [16:56:36<2685:04:43, 32.42s/it]training loss: 5.940e-03:   1%|          | 1843/300001 [16:57:08<2681:16:55, 32.37s/it]training loss: 5.940e-03:   1%|          | 1844/300001 [16:57:41<2690:36:27, 32.49s/it]training loss: 5.940e-03:   1%|          | 1845/300001 [16:58:15<2717:09:02, 32.81s/it]training loss: 5.940e-03:   1%|          | 1846/300001 [16:58:47<2706:16:30, 32.68s/it]training loss: 5.940e-03:   1%|          | 1847/300001 [16:59:18<2673:40:36, 32.28s/it]training loss: 5.940e-03:   1%|          | 1848/300001 [16:59:51<2689:37:44, 32.48s/it]training loss: 5.940e-03:   1%|          | 1849/300001 [17:00:24<2687:34:53, 32.45s/it]training loss: 5.940e-03:   1%|          | 1850/300001 [17:00:57<2716:12:23, 32.80s/it]training loss: 5.940e-03:   1%|          | 1851/300001 [17:01:30<2717:07:37, 32.81s/it]training loss: 5.940e-03:   1%|          | 1852/300001 [17:02:03<2713:57:47, 32.77s/it]training loss: 5.940e-03:   1%|          | 1853/300001 [17:02:37<2742:01:53, 33.11s/it]training loss: 5.940e-03:   1%|          | 1854/300001 [17:03:10<2752:13:39, 33.23s/it]training loss: 5.940e-03:   1%|          | 1855/300001 [17:03:43<2741:02:27, 33.10s/it]training loss: 5.940e-03:   1%|          | 1856/300001 [17:04:14<2689:35:41, 32.48s/it]training loss: 5.940e-03:   1%|          | 1857/300001 [17:04:46<2671:29:14, 32.26s/it]training loss: 5.940e-03:   1%|          | 1858/300001 [17:05:18<2664:09:32, 32.17s/it]training loss: 5.940e-03:   1%|          | 1859/300001 [17:05:50<2673:33:44, 32.28s/it]training loss: 5.940e-03:   1%|          | 1860/300001 [17:06:23<2676:37:55, 32.32s/it]training loss: 6.189e-03:   1%|          | 1860/300001 [17:06:56<2676:37:55, 32.32s/it]training loss: 6.189e-03:   1%|          | 1861/300001 [17:06:56<2703:08:38, 32.64s/it]training loss: 6.189e-03:   1%|          | 1862/300001 [17:07:28<2675:14:14, 32.30s/it]training loss: 6.189e-03:   1%|          | 1863/300001 [17:08:00<2677:02:50, 32.33s/it]training loss: 6.189e-03:   1%|          | 1864/300001 [17:08:33<2707:14:32, 32.69s/it]training loss: 6.189e-03:   1%|          | 1865/300001 [17:09:06<2698:02:56, 32.58s/it]training loss: 6.189e-03:   1%|          | 1866/300001 [17:09:39<2702:16:35, 32.63s/it]training loss: 6.189e-03:   1%|          | 1867/300001 [17:10:11<2698:04:04, 32.58s/it]training loss: 6.189e-03:   1%|          | 1868/300001 [17:10:44<2699:52:38, 32.60s/it]training loss: 6.189e-03:   1%|          | 1869/300001 [17:11:15<2677:48:16, 32.33s/it]training loss: 6.189e-03:   1%|          | 1870/300001 [17:11:48<2677:19:09, 32.33s/it]training loss: 6.189e-03:   1%|          | 1871/300001 [17:12:20<2680:38:25, 32.37s/it]training loss: 6.189e-03:   1%|          | 1872/300001 [17:12:52<2679:26:23, 32.36s/it]training loss: 6.189e-03:   1%|          | 1873/300001 [17:13:24<2661:45:48, 32.14s/it]training loss: 6.189e-03:   1%|          | 1874/300001 [17:13:58<2695:58:09, 32.55s/it]training loss: 6.189e-03:   1%|          | 1875/300001 [17:14:30<2687:25:15, 32.45s/it]training loss: 6.189e-03:   1%|          | 1876/300001 [17:15:02<2673:25:18, 32.28s/it]training loss: 6.189e-03:   1%|          | 1877/300001 [17:15:34<2674:41:20, 32.30s/it]training loss: 6.189e-03:   1%|          | 1878/300001 [17:16:06<2664:28:57, 32.18s/it]training loss: 6.189e-03:   1%|          | 1879/300001 [17:16:38<2668:11:25, 32.22s/it]training loss: 6.189e-03:   1%|          | 1880/300001 [17:17:10<2661:30:16, 32.14s/it]training loss: 6.091e-03:   1%|          | 1880/300001 [17:17:44<2661:30:16, 32.14s/it]training loss: 6.091e-03:   1%|          | 1881/300001 [17:17:44<2711:09:11, 32.74s/it]training loss: 6.091e-03:   1%|          | 1882/300001 [17:18:17<2712:19:12, 32.75s/it]training loss: 6.091e-03:   1%|          | 1883/300001 [17:18:48<2675:05:35, 32.30s/it]training loss: 6.091e-03:   1%|          | 1884/300001 [17:19:12<2451:52:28, 29.61s/it]training loss: 6.091e-03:   1%|          | 1885/300001 [17:19:44<2511:42:17, 30.33s/it]training loss: 6.091e-03:   1%|          | 1886/300001 [17:20:14<2514:09:43, 30.36s/it]training loss: 6.091e-03:   1%|          | 1887/300001 [17:20:48<2589:10:30, 31.27s/it]training loss: 6.091e-03:   1%|          | 1888/300001 [17:21:19<2605:01:30, 31.46s/it]training loss: 6.091e-03:   1%|          | 1889/300001 [17:21:51<2603:32:04, 31.44s/it]training loss: 6.091e-03:   1%|          | 1890/300001 [17:22:24<2638:16:55, 31.86s/it]training loss: 6.091e-03:   1%|          | 1891/300001 [17:22:58<2688:49:11, 32.47s/it]training loss: 6.091e-03:   1%|          | 1892/300001 [17:23:31<2717:35:20, 32.82s/it]training loss: 6.091e-03:   1%|          | 1893/300001 [17:24:04<2721:45:46, 32.87s/it]training loss: 6.091e-03:   1%|          | 1894/300001 [17:24:37<2727:36:45, 32.94s/it]training loss: 6.091e-03:   1%|          | 1895/300001 [17:25:10<2714:06:15, 32.78s/it]training loss: 6.091e-03:   1%|          | 1896/300001 [17:25:42<2699:48:56, 32.60s/it]training loss: 6.091e-03:   1%|          | 1897/300001 [17:26:15<2699:27:37, 32.60s/it]training loss: 6.091e-03:   1%|          | 1898/300001 [17:26:48<2723:05:48, 32.89s/it]training loss: 6.091e-03:   1%|          | 1899/300001 [17:27:20<2698:33:11, 32.59s/it]training loss: 6.091e-03:   1%|          | 1900/300001 [17:27:52<2681:22:08, 32.38s/it]training loss: 6.106e-03:   1%|          | 1900/300001 [17:28:26<2681:22:08, 32.38s/it]training loss: 6.106e-03:   1%|          | 1901/300001 [17:28:26<2723:41:46, 32.89s/it]training loss: 6.106e-03:   1%|          | 1902/300001 [17:28:58<2694:34:21, 32.54s/it]training loss: 6.106e-03:   1%|          | 1903/300001 [17:29:30<2699:50:58, 32.60s/it]training loss: 6.106e-03:   1%|          | 1904/300001 [17:30:03<2691:26:51, 32.50s/it]training loss: 6.106e-03:   1%|          | 1905/300001 [17:30:34<2659:21:51, 32.12s/it]training loss: 6.106e-03:   1%|          | 1906/300001 [17:31:07<2683:42:58, 32.41s/it]training loss: 6.106e-03:   1%|          | 1907/300001 [17:31:39<2669:58:06, 32.24s/it]training loss: 6.106e-03:   1%|          | 1908/300001 [17:32:11<2662:24:28, 32.15s/it]training loss: 6.106e-03:   1%|          | 1909/300001 [17:32:43<2671:28:22, 32.26s/it]training loss: 6.106e-03:   1%|          | 1910/300001 [17:33:16<2670:02:17, 32.25s/it]training loss: 6.106e-03:   1%|          | 1911/300001 [17:33:48<2679:46:28, 32.36s/it]training loss: 6.106e-03:   1%|          | 1912/300001 [17:34:21<2679:29:04, 32.36s/it]training loss: 6.106e-03:   1%|          | 1913/300001 [17:34:54<2713:34:39, 32.77s/it]training loss: 6.106e-03:   1%|          | 1914/300001 [17:35:27<2704:30:23, 32.66s/it]training loss: 6.106e-03:   1%|          | 1915/300001 [17:35:58<2664:54:28, 32.18s/it]training loss: 6.106e-03:   1%|          | 1916/300001 [17:36:28<2623:36:38, 31.69s/it]training loss: 6.106e-03:   1%|          | 1917/300001 [17:37:01<2656:23:46, 32.08s/it]training loss: 6.106e-03:   1%|          | 1918/300001 [17:37:34<2673:38:15, 32.29s/it]training loss: 6.106e-03:   1%|          | 1919/300001 [17:38:06<2669:06:30, 32.24s/it]training loss: 6.106e-03:   1%|          | 1920/300001 [17:38:38<2657:34:08, 32.10s/it]training loss: 7.258e-03:   1%|          | 1920/300001 [17:39:11<2657:34:08, 32.10s/it]training loss: 7.258e-03:   1%|          | 1921/300001 [17:39:12<2695:39:12, 32.56s/it]training loss: 7.258e-03:   1%|          | 1922/300001 [17:39:44<2692:01:04, 32.51s/it]training loss: 7.258e-03:   1%|          | 1923/300001 [17:40:16<2686:21:19, 32.44s/it]training loss: 7.258e-03:   1%|          | 1924/300001 [17:40:48<2676:08:43, 32.32s/it]training loss: 7.258e-03:   1%|          | 1925/300001 [17:41:21<2688:14:31, 32.47s/it]training loss: 7.258e-03:   1%|          | 1926/300001 [17:41:54<2695:47:31, 32.56s/it]training loss: 7.258e-03:   1%|          | 1927/300001 [17:42:25<2667:23:53, 32.22s/it]training loss: 7.258e-03:   1%|          | 1928/300001 [17:42:58<2681:47:29, 32.39s/it]training loss: 7.258e-03:   1%|          | 1929/300001 [17:43:31<2700:02:11, 32.61s/it]training loss: 7.258e-03:   1%|          | 1930/300001 [17:44:04<2711:12:30, 32.75s/it]training loss: 7.258e-03:   1%|          | 1931/300001 [17:44:37<2719:35:53, 32.85s/it]training loss: 7.258e-03:   1%|          | 1932/300001 [17:45:10<2703:02:50, 32.65s/it]training loss: 7.258e-03:   1%|          | 1933/300001 [17:45:43<2724:54:44, 32.91s/it]training loss: 7.258e-03:   1%|          | 1934/300001 [17:46:17<2739:17:41, 33.08s/it]training loss: 7.258e-03:   1%|          | 1935/300001 [17:46:48<2711:28:11, 32.75s/it]training loss: 7.258e-03:   1%|          | 1936/300001 [17:47:20<2678:05:26, 32.35s/it]training loss: 7.258e-03:   1%|          | 1937/300001 [17:47:53<2693:17:19, 32.53s/it]training loss: 7.258e-03:   1%|          | 1938/300001 [17:48:25<2688:07:06, 32.47s/it]training loss: 7.258e-03:   1%|          | 1939/300001 [17:48:57<2677:52:55, 32.34s/it]training loss: 7.258e-03:   1%|          | 1940/300001 [17:49:29<2668:40:06, 32.23s/it]training loss: 6.406e-03:   1%|          | 1940/300001 [17:50:01<2668:40:06, 32.23s/it]training loss: 6.406e-03:   1%|          | 1941/300001 [17:50:01<2656:55:24, 32.09s/it]training loss: 6.406e-03:   1%|          | 1942/300001 [17:50:34<2672:18:51, 32.28s/it]training loss: 6.406e-03:   1%|          | 1943/300001 [17:51:05<2639:59:26, 31.89s/it]training loss: 6.406e-03:   1%|          | 1944/300001 [17:51:37<2651:00:54, 32.02s/it]training loss: 6.406e-03:   1%|          | 1945/300001 [17:52:10<2674:12:41, 32.30s/it]training loss: 6.406e-03:   1%|          | 1946/300001 [17:52:42<2666:41:27, 32.21s/it]training loss: 6.406e-03:   1%|          | 1947/300001 [17:53:14<2663:11:25, 32.17s/it]training loss: 6.406e-03:   1%|          | 1948/300001 [17:53:46<2654:10:02, 32.06s/it]training loss: 6.406e-03:   1%|          | 1949/300001 [17:54:18<2654:10:44, 32.06s/it]training loss: 6.406e-03:   1%|          | 1950/300001 [17:54:50<2657:33:43, 32.10s/it]training loss: 6.406e-03:   1%|          | 1951/300001 [17:55:23<2677:16:52, 32.34s/it]training loss: 6.406e-03:   1%|          | 1952/300001 [17:55:55<2667:21:11, 32.22s/it]training loss: 6.406e-03:   1%|          | 1953/300001 [17:56:27<2668:23:42, 32.23s/it]training loss: 6.406e-03:   1%|          | 1954/300001 [17:56:59<2661:18:16, 32.14s/it]training loss: 6.406e-03:   1%|          | 1955/300001 [17:57:32<2674:59:19, 32.31s/it]training loss: 6.406e-03:   1%|          | 1956/300001 [17:58:04<2671:08:34, 32.26s/it]training loss: 6.406e-03:   1%|          | 1957/300001 [17:58:37<2678:32:15, 32.35s/it]training loss: 6.406e-03:   1%|          | 1958/300001 [17:59:09<2692:05:40, 32.52s/it]training loss: 6.406e-03:   1%|          | 1959/300001 [17:59:41<2676:31:00, 32.33s/it]training loss: 6.406e-03:   1%|          | 1960/300001 [18:00:14<2695:46:54, 32.56s/it]training loss: 5.800e-03:   1%|          | 1960/300001 [18:00:47<2695:46:54, 32.56s/it]training loss: 5.800e-03:   1%|          | 1961/300001 [18:00:47<2689:25:00, 32.49s/it]training loss: 5.800e-03:   1%|          | 1962/300001 [18:01:19<2682:30:27, 32.40s/it]training loss: 5.800e-03:   1%|          | 1963/300001 [18:01:50<2654:44:01, 32.07s/it]training loss: 5.800e-03:   1%|          | 1964/300001 [18:02:23<2683:45:34, 32.42s/it]training loss: 5.800e-03:   1%|          | 1965/300001 [18:02:57<2703:09:51, 32.65s/it]training loss: 5.800e-03:   1%|          | 1966/300001 [18:03:30<2710:33:27, 32.74s/it]training loss: 5.800e-03:   1%|          | 1967/300001 [18:04:01<2684:44:37, 32.43s/it]training loss: 5.800e-03:   1%|          | 1968/300001 [18:04:33<2672:24:04, 32.28s/it]training loss: 5.800e-03:   1%|          | 1969/300001 [18:05:06<2680:17:31, 32.38s/it]training loss: 5.800e-03:   1%|          | 1970/300001 [18:05:38<2671:24:54, 32.27s/it]training loss: 5.800e-03:   1%|          | 1971/300001 [18:06:10<2678:52:32, 32.36s/it]training loss: 5.800e-03:   1%|          | 1972/300001 [18:06:44<2704:54:48, 32.67s/it]training loss: 5.800e-03:   1%|          | 1973/300001 [18:07:16<2682:45:23, 32.41s/it]training loss: 5.800e-03:   1%|          | 1974/300001 [18:07:49<2707:31:19, 32.71s/it]training loss: 5.800e-03:   1%|          | 1975/300001 [18:08:21<2690:34:42, 32.50s/it]training loss: 5.800e-03:   1%|          | 1976/300001 [18:08:54<2691:20:48, 32.51s/it]training loss: 5.800e-03:   1%|          | 1977/300001 [18:09:25<2655:59:48, 32.08s/it]training loss: 5.800e-03:   1%|          | 1978/300001 [18:09:57<2650:45:37, 32.02s/it]training loss: 5.800e-03:   1%|          | 1979/300001 [18:10:28<2648:45:38, 32.00s/it]training loss: 5.800e-03:   1%|          | 1980/300001 [18:11:00<2648:52:20, 32.00s/it]training loss: 6.414e-03:   1%|          | 1980/300001 [18:11:32<2648:52:20, 32.00s/it]training loss: 6.414e-03:   1%|          | 1981/300001 [18:11:32<2645:28:06, 31.96s/it]training loss: 6.414e-03:   1%|          | 1982/300001 [18:12:04<2638:02:29, 31.87s/it]training loss: 6.414e-03:   1%|          | 1983/300001 [18:12:36<2653:03:33, 32.05s/it]training loss: 6.414e-03:   1%|          | 1984/300001 [18:13:08<2641:52:58, 31.91s/it]training loss: 6.414e-03:   1%|          | 1985/300001 [18:13:39<2621:18:58, 31.67s/it]training loss: 6.414e-03:   1%|          | 1986/300001 [18:14:13<2667:57:50, 32.23s/it]training loss: 6.414e-03:   1%|          | 1987/300001 [18:14:45<2677:09:28, 32.34s/it]training loss: 6.414e-03:   1%|          | 1988/300001 [18:15:18<2696:39:31, 32.58s/it]training loss: 6.414e-03:   1%|          | 1989/300001 [18:15:51<2692:32:51, 32.53s/it]training loss: 6.414e-03:   1%|          | 1990/300001 [18:16:24<2720:17:51, 32.86s/it]training loss: 6.414e-03:   1%|          | 1991/300001 [18:16:57<2724:13:26, 32.91s/it]training loss: 6.414e-03:   1%|          | 1992/300001 [18:17:30<2703:40:15, 32.66s/it]training loss: 6.414e-03:   1%|          | 1993/300001 [18:18:03<2717:46:32, 32.83s/it]training loss: 6.414e-03:   1%|          | 1994/300001 [18:18:35<2709:59:43, 32.74s/it]training loss: 6.414e-03:   1%|          | 1995/300001 [18:19:08<2702:59:52, 32.65s/it]training loss: 6.414e-03:   1%|          | 1996/300001 [18:19:39<2659:31:34, 32.13s/it]training loss: 6.414e-03:   1%|          | 1997/300001 [18:20:11<2669:29:28, 32.25s/it]training loss: 6.414e-03:   1%|          | 1998/300001 [18:20:43<2666:17:57, 32.21s/it]training loss: 6.414e-03:   1%|          | 1999/300001 [18:21:15<2663:23:49, 32.18s/it]training loss: 6.414e-03:   1%|          | 2000/300001 [18:21:49<2696:13:08, 32.57s/it]training loss: 6.062e-03:   1%|          | 2000/300001 [18:22:22<2696:13:08, 32.57s/it]training loss: 6.062e-03:   1%|          | 2001/300001 [18:22:25<2789:59:09, 33.70s/it]training loss: 6.062e-03:   1%|          | 2002/300001 [18:22:57<2750:24:50, 33.23s/it]training loss: 6.062e-03:   1%|          | 2003/300001 [18:23:30<2736:40:33, 33.06s/it]training loss: 6.062e-03:   1%|          | 2004/300001 [18:24:03<2722:38:30, 32.89s/it]training loss: 6.062e-03:   1%|          | 2005/300001 [18:24:35<2720:24:24, 32.86s/it]training loss: 6.062e-03:   1%|          | 2006/300001 [18:25:08<2724:38:00, 32.92s/it]training loss: 6.062e-03:   1%|          | 2007/300001 [18:25:42<2735:41:45, 33.05s/it]training loss: 6.062e-03:   1%|          | 2008/300001 [18:26:13<2696:35:20, 32.58s/it]training loss: 6.062e-03:   1%|          | 2009/300001 [18:26:44<2650:57:49, 32.03s/it]training loss: 6.062e-03:   1%|          | 2010/300001 [18:27:15<2633:07:54, 31.81s/it]training loss: 6.062e-03:   1%|          | 2011/300001 [18:27:47<2641:43:28, 31.91s/it]training loss: 6.062e-03:   1%|          | 2012/300001 [18:28:20<2660:22:18, 32.14s/it]training loss: 6.062e-03:   1%|          | 2013/300001 [18:28:53<2679:44:10, 32.37s/it]training loss: 6.062e-03:   1%|          | 2014/300001 [18:29:24<2657:05:36, 32.10s/it]training loss: 6.062e-03:   1%|          | 2015/300001 [18:29:58<2684:39:24, 32.43s/it]training loss: 6.062e-03:   1%|          | 2016/300001 [18:30:29<2658:53:01, 32.12s/it]training loss: 6.062e-03:   1%|          | 2017/300001 [18:31:01<2659:04:05, 32.12s/it]training loss: 6.062e-03:   1%|          | 2018/300001 [18:31:33<2639:53:01, 31.89s/it]training loss: 6.062e-03:   1%|          | 2019/300001 [18:32:05<2655:35:43, 32.08s/it]training loss: 6.062e-03:   1%|          | 2020/300001 [18:32:36<2628:03:50, 31.75s/it]training loss: 6.122e-03:   1%|          | 2020/300001 [18:33:09<2628:03:50, 31.75s/it]training loss: 6.122e-03:   1%|          | 2021/300001 [18:33:09<2653:41:02, 32.06s/it]training loss: 6.122e-03:   1%|          | 2022/300001 [18:33:41<2668:34:39, 32.24s/it]training loss: 6.122e-03:   1%|          | 2023/300001 [18:34:13<2653:35:12, 32.06s/it]training loss: 6.122e-03:   1%|          | 2024/300001 [18:34:46<2668:23:44, 32.24s/it]training loss: 6.122e-03:   1%|          | 2025/300001 [18:35:18<2663:43:46, 32.18s/it]training loss: 6.122e-03:   1%|          | 2026/300001 [18:35:51<2696:58:08, 32.58s/it]training loss: 6.122e-03:   1%|          | 2027/300001 [18:36:23<2685:07:17, 32.44s/it]training loss: 6.122e-03:   1%|          | 2028/300001 [18:36:57<2708:11:54, 32.72s/it]training loss: 6.122e-03:   1%|          | 2029/300001 [18:37:30<2728:13:58, 32.96s/it]training loss: 6.122e-03:   1%|          | 2030/300001 [18:38:04<2737:13:07, 33.07s/it]training loss: 6.122e-03:   1%|          | 2031/300001 [18:38:36<2730:49:47, 32.99s/it]training loss: 6.122e-03:   1%|          | 2032/300001 [18:39:09<2719:21:34, 32.85s/it]training loss: 6.122e-03:   1%|          | 2033/300001 [18:39:42<2711:38:54, 32.76s/it]training loss: 6.122e-03:   1%|          | 2034/300001 [18:40:13<2675:09:54, 32.32s/it]training loss: 6.122e-03:   1%|          | 2035/300001 [18:40:45<2680:06:10, 32.38s/it]training loss: 6.122e-03:   1%|          | 2036/300001 [18:41:18<2676:23:32, 32.34s/it]training loss: 6.122e-03:   1%|          | 2037/300001 [18:41:51<2701:20:57, 32.64s/it]training loss: 6.122e-03:   1%|          | 2038/300001 [18:42:22<2667:34:03, 32.23s/it]training loss: 6.122e-03:   1%|          | 2039/300001 [18:42:53<2634:54:19, 31.84s/it]training loss: 6.122e-03:   1%|          | 2040/300001 [18:43:25<2630:28:04, 31.78s/it]training loss: 6.607e-03:   1%|          | 2040/300001 [18:43:48<2630:28:04, 31.78s/it]training loss: 6.607e-03:   1%|          | 2041/300001 [18:43:48<2407:36:48, 29.09s/it]training loss: 6.607e-03:   1%|          | 2042/300001 [18:44:19<2468:17:44, 29.82s/it]training loss: 6.607e-03:   1%|          | 2043/300001 [18:44:52<2545:52:13, 30.76s/it]training loss: 6.607e-03:   1%|          | 2044/300001 [18:45:23<2547:33:15, 30.78s/it]training loss: 6.607e-03:   1%|          | 2045/300001 [18:45:55<2589:59:44, 31.29s/it]training loss: 6.607e-03:   1%|          | 2046/300001 [18:46:29<2636:15:13, 31.85s/it]training loss: 6.607e-03:   1%|          | 2047/300001 [18:47:01<2656:47:54, 32.10s/it]training loss: 6.607e-03:   1%|          | 2048/300001 [18:47:34<2674:19:01, 32.31s/it]training loss: 6.607e-03:   1%|          | 2049/300001 [18:48:07<2682:48:39, 32.42s/it]training loss: 6.607e-03:   1%|          | 2050/300001 [18:48:38<2665:08:19, 32.20s/it]training loss: 6.607e-03:   1%|          | 2051/300001 [18:49:11<2667:00:38, 32.22s/it]training loss: 6.607e-03:   1%|          | 2052/300001 [18:49:43<2669:12:47, 32.25s/it]training loss: 6.607e-03:   1%|          | 2053/300001 [18:50:15<2673:51:36, 32.31s/it]training loss: 6.607e-03:   1%|          | 2054/300001 [18:50:48<2690:30:03, 32.51s/it]training loss: 6.607e-03:   1%|          | 2055/300001 [18:51:21<2703:37:06, 32.67s/it]training loss: 6.607e-03:   1%|          | 2056/300001 [18:51:55<2719:55:17, 32.86s/it]training loss: 6.607e-03:   1%|          | 2057/300001 [18:52:27<2702:37:42, 32.66s/it]training loss: 6.607e-03:   1%|          | 2058/300001 [18:53:00<2722:06:17, 32.89s/it]training loss: 6.607e-03:   1%|          | 2059/300001 [18:53:34<2728:39:40, 32.97s/it]training loss: 6.607e-03:   1%|          | 2060/300001 [18:54:05<2699:51:56, 32.62s/it]training loss: 6.460e-03:   1%|          | 2060/300001 [18:54:38<2699:51:56, 32.62s/it]training loss: 6.460e-03:   1%|          | 2061/300001 [18:54:38<2699:01:23, 32.61s/it]training loss: 6.460e-03:   1%|          | 2062/300001 [18:55:10<2678:41:42, 32.37s/it]training loss: 6.460e-03:   1%|          | 2063/300001 [18:55:42<2676:39:41, 32.34s/it]training loss: 6.460e-03:   1%|          | 2064/300001 [18:56:13<2651:25:37, 32.04s/it]training loss: 6.460e-03:   1%|          | 2065/300001 [18:56:46<2660:28:52, 32.15s/it]training loss: 6.460e-03:   1%|          | 2066/300001 [18:57:18<2663:12:57, 32.18s/it]training loss: 6.460e-03:   1%|          | 2067/300001 [18:57:50<2659:49:27, 32.14s/it]training loss: 6.460e-03:   1%|          | 2068/300001 [18:58:22<2664:21:23, 32.19s/it]training loss: 6.460e-03:   1%|          | 2069/300001 [18:58:55<2665:07:34, 32.20s/it]training loss: 6.460e-03:   1%|          | 2070/300001 [18:59:28<2687:01:52, 32.47s/it]training loss: 6.460e-03:   1%|          | 2071/300001 [19:00:00<2671:48:21, 32.28s/it]training loss: 6.460e-03:   1%|          | 2072/300001 [19:00:33<2696:12:20, 32.58s/it]training loss: 6.460e-03:   1%|          | 2073/300001 [19:01:04<2673:01:35, 32.30s/it]training loss: 6.460e-03:   1%|          | 2074/300001 [19:01:38<2701:28:18, 32.64s/it]training loss: 6.460e-03:   1%|          | 2075/300001 [19:02:11<2706:45:47, 32.71s/it]training loss: 6.460e-03:   1%|          | 2076/300001 [19:02:43<2702:34:38, 32.66s/it]training loss: 6.460e-03:   1%|          | 2077/300001 [19:03:16<2714:18:19, 32.80s/it]training loss: 6.460e-03:   1%|          | 2078/300001 [19:03:49<2718:23:38, 32.85s/it]training loss: 6.460e-03:   1%|          | 2079/300001 [19:04:20<2667:34:28, 32.23s/it]training loss: 6.460e-03:   1%|          | 2080/300001 [19:04:53<2678:16:01, 32.36s/it]training loss: 6.204e-03:   1%|          | 2080/300001 [19:05:26<2678:16:01, 32.36s/it]training loss: 6.204e-03:   1%|          | 2081/300001 [19:05:26<2702:29:26, 32.66s/it]training loss: 6.204e-03:   1%|          | 2082/300001 [19:05:59<2712:49:38, 32.78s/it]training loss: 6.204e-03:   1%|          | 2083/300001 [19:06:30<2668:14:07, 32.24s/it]training loss: 6.204e-03:   1%|          | 2084/300001 [19:07:04<2701:29:34, 32.64s/it]training loss: 6.204e-03:   1%|          | 2085/300001 [19:07:36<2679:08:27, 32.37s/it]training loss: 6.204e-03:   1%|          | 2086/300001 [19:08:08<2686:37:48, 32.47s/it]training loss: 6.204e-03:   1%|          | 2087/300001 [19:08:41<2698:23:33, 32.61s/it]training loss: 6.204e-03:   1%|          | 2088/300001 [19:09:14<2697:21:59, 32.60s/it]training loss: 6.204e-03:   1%|          | 2089/300001 [19:09:46<2676:45:37, 32.35s/it]training loss: 6.204e-03:   1%|          | 2090/300001 [19:10:17<2644:08:30, 31.95s/it]training loss: 6.204e-03:   1%|          | 2091/300001 [19:10:48<2628:38:06, 31.76s/it]training loss: 6.204e-03:   1%|          | 2092/300001 [19:11:20<2643:01:15, 31.94s/it]training loss: 6.204e-03:   1%|          | 2093/300001 [19:11:52<2641:38:27, 31.92s/it]training loss: 6.204e-03:   1%|          | 2094/300001 [19:12:23<2621:55:39, 31.68s/it]training loss: 6.204e-03:   1%|          | 2095/300001 [19:12:57<2663:58:44, 32.19s/it]training loss: 6.204e-03:   1%|          | 2096/300001 [19:13:29<2677:25:27, 32.36s/it]training loss: 6.204e-03:   1%|          | 2097/300001 [19:14:01<2666:26:57, 32.22s/it]training loss: 6.204e-03:   1%|          | 2098/300001 [19:14:34<2672:21:43, 32.29s/it]training loss: 6.204e-03:   1%|          | 2099/300001 [19:15:05<2652:41:19, 32.06s/it]training loss: 6.204e-03:   1%|          | 2100/300001 [19:15:37<2649:58:39, 32.02s/it]training loss: 5.775e-03:   1%|          | 2100/300001 [19:16:08<2649:58:39, 32.02s/it]training loss: 5.775e-03:   1%|          | 2101/300001 [19:16:09<2634:21:32, 31.84s/it]training loss: 5.775e-03:   1%|          | 2102/300001 [19:16:41<2650:18:34, 32.03s/it]training loss: 5.775e-03:   1%|          | 2103/300001 [19:17:14<2670:03:16, 32.27s/it]training loss: 5.775e-03:   1%|          | 2104/300001 [19:17:47<2679:45:59, 32.38s/it]training loss: 5.775e-03:   1%|          | 2105/300001 [19:18:20<2694:14:35, 32.56s/it]training loss: 5.775e-03:   1%|          | 2106/300001 [19:18:52<2681:56:53, 32.41s/it]training loss: 5.775e-03:   1%|          | 2107/300001 [19:19:23<2658:12:36, 32.12s/it]training loss: 5.775e-03:   1%|          | 2108/300001 [19:19:54<2642:02:58, 31.93s/it]training loss: 5.775e-03:   1%|          | 2109/300001 [19:20:27<2653:40:04, 32.07s/it]training loss: 5.775e-03:   1%|          | 2110/300001 [19:20:59<2655:10:49, 32.09s/it]training loss: 5.775e-03:   1%|          | 2111/300001 [19:21:31<2647:15:04, 31.99s/it]training loss: 5.775e-03:   1%|          | 2112/300001 [19:22:04<2676:00:55, 32.34s/it]training loss: 5.775e-03:   1%|          | 2113/300001 [19:22:35<2644:54:48, 31.96s/it]training loss: 5.775e-03:   1%|          | 2114/300001 [19:23:07<2640:59:33, 31.92s/it]training loss: 5.775e-03:   1%|          | 2115/300001 [19:23:39<2649:29:11, 32.02s/it]training loss: 5.775e-03:   1%|          | 2116/300001 [19:24:11<2648:21:07, 32.01s/it]training loss: 5.775e-03:   1%|          | 2117/300001 [19:24:43<2657:31:46, 32.12s/it]training loss: 5.775e-03:   1%|          | 2118/300001 [19:25:16<2677:26:23, 32.36s/it]training loss: 5.775e-03:   1%|          | 2119/300001 [19:25:49<2694:01:43, 32.56s/it]training loss: 5.775e-03:   1%|          | 2120/300001 [19:26:23<2719:36:11, 32.87s/it]training loss: 5.881e-03:   1%|          | 2120/300001 [19:26:55<2719:36:11, 32.87s/it]training loss: 5.881e-03:   1%|          | 2121/300001 [19:26:55<2691:15:41, 32.52s/it]training loss: 5.881e-03:   1%|          | 2122/300001 [19:27:28<2711:50:43, 32.77s/it]training loss: 5.881e-03:   1%|          | 2123/300001 [19:28:01<2715:30:40, 32.82s/it]training loss: 5.881e-03:   1%|          | 2124/300001 [19:28:34<2731:21:54, 33.01s/it]training loss: 5.881e-03:   1%|          | 2125/300001 [19:29:06<2700:23:28, 32.64s/it]training loss: 5.881e-03:   1%|          | 2126/300001 [19:29:39<2712:16:06, 32.78s/it]training loss: 5.881e-03:   1%|          | 2127/300001 [19:30:13<2723:39:40, 32.92s/it]training loss: 5.881e-03:   1%|          | 2128/300001 [19:30:45<2723:44:09, 32.92s/it]training loss: 5.881e-03:   1%|          | 2129/300001 [19:31:18<2716:52:01, 32.84s/it]training loss: 5.881e-03:   1%|          | 2130/300001 [19:31:51<2711:43:44, 32.77s/it]training loss: 5.881e-03:   1%|          | 2131/300001 [19:32:23<2710:27:35, 32.76s/it]training loss: 5.881e-03:   1%|          | 2132/300001 [19:32:55<2687:51:49, 32.49s/it]training loss: 5.881e-03:   1%|          | 2133/300001 [19:33:28<2693:53:05, 32.56s/it]training loss: 5.881e-03:   1%|          | 2134/300001 [19:34:00<2681:15:06, 32.41s/it]training loss: 5.881e-03:   1%|          | 2135/300001 [19:34:32<2668:15:45, 32.25s/it]training loss: 5.881e-03:   1%|          | 2136/300001 [19:35:04<2667:57:45, 32.25s/it]training loss: 5.881e-03:   1%|          | 2137/300001 [19:35:37<2684:03:56, 32.44s/it]training loss: 5.881e-03:   1%|          | 2138/300001 [19:36:09<2675:26:24, 32.34s/it]training loss: 5.881e-03:   1%|          | 2139/300001 [19:36:42<2681:22:48, 32.41s/it]training loss: 5.881e-03:   1%|          | 2140/300001 [19:37:14<2670:30:13, 32.28s/it]training loss: 5.752e-03:   1%|          | 2140/300001 [19:37:46<2670:30:13, 32.28s/it]training loss: 5.752e-03:   1%|          | 2141/300001 [19:37:46<2662:11:57, 32.18s/it]training loss: 5.752e-03:   1%|          | 2142/300001 [19:38:17<2647:37:03, 32.00s/it]training loss: 5.752e-03:   1%|          | 2143/300001 [19:38:49<2650:46:27, 32.04s/it]training loss: 5.752e-03:   1%|          | 2144/300001 [19:39:23<2694:51:55, 32.57s/it]training loss: 5.752e-03:   1%|          | 2145/300001 [19:39:55<2675:01:46, 32.33s/it]training loss: 5.752e-03:   1%|          | 2146/300001 [19:40:28<2680:09:18, 32.39s/it]training loss: 5.752e-03:   1%|          | 2147/300001 [19:41:00<2678:21:02, 32.37s/it]training loss: 5.752e-03:   1%|          | 2148/300001 [19:41:34<2717:12:31, 32.84s/it]training loss: 5.752e-03:   1%|          | 2149/300001 [19:42:06<2690:34:25, 32.52s/it]training loss: 5.752e-03:   1%|          | 2150/300001 [19:42:38<2682:27:33, 32.42s/it]training loss: 5.752e-03:   1%|          | 2151/300001 [19:43:09<2661:27:57, 32.17s/it]training loss: 5.752e-03:   1%|          | 2152/300001 [19:43:41<2660:49:31, 32.16s/it]training loss: 5.752e-03:   1%|          | 2153/300001 [19:44:14<2674:32:57, 32.33s/it]training loss: 5.752e-03:   1%|          | 2154/300001 [19:44:46<2661:00:41, 32.16s/it]training loss: 5.752e-03:   1%|          | 2155/300001 [19:45:19<2685:44:00, 32.46s/it]training loss: 5.752e-03:   1%|          | 2156/300001 [19:45:53<2710:46:01, 32.76s/it]training loss: 5.752e-03:   1%|          | 2157/300001 [19:46:25<2693:12:23, 32.55s/it]training loss: 5.752e-03:   1%|          | 2158/300001 [19:46:58<2702:08:23, 32.66s/it]training loss: 5.752e-03:   1%|          | 2159/300001 [19:47:29<2661:45:08, 32.17s/it]training loss: 5.752e-03:   1%|          | 2160/300001 [19:48:00<2642:34:26, 31.94s/it]training loss: 5.455e-03:   1%|          | 2160/300001 [19:48:33<2642:34:26, 31.94s/it]training loss: 5.455e-03:   1%|          | 2161/300001 [19:48:33<2664:02:09, 32.20s/it]training loss: 5.455e-03:   1%|          | 2162/300001 [19:49:04<2643:56:17, 31.96s/it]training loss: 5.455e-03:   1%|          | 2163/300001 [19:49:37<2662:38:39, 32.18s/it]training loss: 5.455e-03:   1%|          | 2164/300001 [19:50:10<2681:06:44, 32.41s/it]training loss: 5.455e-03:   1%|          | 2165/300001 [19:50:41<2660:58:43, 32.16s/it]training loss: 5.455e-03:   1%|          | 2166/300001 [19:51:14<2660:31:10, 32.16s/it]training loss: 5.455e-03:   1%|          | 2167/300001 [19:51:47<2691:28:42, 32.53s/it]training loss: 5.455e-03:   1%|          | 2168/300001 [19:52:19<2677:10:43, 32.36s/it]training loss: 5.455e-03:   1%|          | 2169/300001 [19:52:51<2667:22:02, 32.24s/it]training loss: 5.455e-03:   1%|          | 2170/300001 [19:53:23<2663:51:21, 32.20s/it]training loss: 5.455e-03:   1%|          | 2171/300001 [19:53:55<2646:27:37, 31.99s/it]training loss: 5.455e-03:   1%|          | 2172/300001 [19:54:26<2637:33:40, 31.88s/it]training loss: 5.455e-03:   1%|          | 2173/300001 [19:54:59<2664:40:38, 32.21s/it]training loss: 5.455e-03:   1%|          | 2174/300001 [19:55:33<2703:49:59, 32.68s/it]training loss: 5.455e-03:   1%|          | 2175/300001 [19:56:05<2691:59:39, 32.54s/it]training loss: 5.455e-03:   1%|          | 2176/300001 [19:56:37<2679:54:24, 32.39s/it]training loss: 5.455e-03:   1%|          | 2177/300001 [19:57:10<2690:21:23, 32.52s/it]training loss: 5.455e-03:   1%|          | 2178/300001 [19:57:41<2662:28:36, 32.18s/it]training loss: 5.455e-03:   1%|          | 2179/300001 [19:58:13<2652:01:51, 32.06s/it]training loss: 5.455e-03:   1%|          | 2180/300001 [19:58:46<2667:35:23, 32.25s/it]training loss: 6.315e-03:   1%|          | 2180/300001 [19:59:18<2667:35:23, 32.25s/it]training loss: 6.315e-03:   1%|          | 2181/300001 [19:59:18<2665:54:24, 32.23s/it]training loss: 6.315e-03:   1%|          | 2182/300001 [19:59:49<2645:39:36, 31.98s/it]training loss: 6.315e-03:   1%|          | 2183/300001 [20:00:22<2659:21:27, 32.15s/it]training loss: 6.315e-03:   1%|          | 2184/300001 [20:00:55<2684:09:50, 32.45s/it]training loss: 6.315e-03:   1%|          | 2185/300001 [20:01:29<2717:50:52, 32.85s/it]training loss: 6.315e-03:   1%|          | 2186/300001 [20:02:01<2700:40:45, 32.65s/it]training loss: 6.315e-03:   1%|          | 2187/300001 [20:02:33<2682:25:11, 32.43s/it]training loss: 6.315e-03:   1%|          | 2188/300001 [20:03:05<2661:38:50, 32.17s/it]training loss: 6.315e-03:   1%|          | 2189/300001 [20:03:36<2654:07:06, 32.08s/it]training loss: 6.315e-03:   1%|          | 2190/300001 [20:04:11<2706:46:49, 32.72s/it]training loss: 6.315e-03:   1%|          | 2191/300001 [20:04:43<2709:23:25, 32.75s/it]training loss: 6.315e-03:   1%|          | 2192/300001 [20:05:16<2710:27:53, 32.76s/it]training loss: 6.315e-03:   1%|          | 2193/300001 [20:05:50<2737:30:36, 33.09s/it]training loss: 6.315e-03:   1%|          | 2194/300001 [20:06:23<2744:26:55, 33.18s/it]training loss: 6.315e-03:   1%|          | 2195/300001 [20:06:58<2766:08:04, 33.44s/it]training loss: 6.315e-03:   1%|          | 2196/300001 [20:07:30<2735:08:40, 33.06s/it]training loss: 6.315e-03:   1%|          | 2197/300001 [20:08:03<2739:48:51, 33.12s/it]training loss: 6.315e-03:   1%|          | 2198/300001 [20:08:26<2494:35:12, 30.16s/it]training loss: 6.315e-03:   1%|          | 2199/300001 [20:08:59<2560:02:10, 30.95s/it]training loss: 6.315e-03:   1%|          | 2200/300001 [20:09:33<2638:57:20, 31.90s/it]training loss: 8.075e-03:   1%|          | 2200/300001 [20:10:06<2638:57:20, 31.90s/it]training loss: 8.075e-03:   1%|          | 2201/300001 [20:10:06<2670:10:23, 32.28s/it]training loss: 8.075e-03:   1%|          | 2202/300001 [20:10:38<2666:47:52, 32.24s/it]training loss: 8.075e-03:   1%|          | 2203/300001 [20:11:12<2688:43:08, 32.50s/it]training loss: 8.075e-03:   1%|          | 2204/300001 [20:11:45<2705:02:13, 32.70s/it]training loss: 8.075e-03:   1%|          | 2205/300001 [20:12:16<2671:11:28, 32.29s/it]training loss: 8.075e-03:   1%|          | 2206/300001 [20:12:49<2678:49:23, 32.38s/it]training loss: 8.075e-03:   1%|          | 2207/300001 [20:13:21<2680:59:51, 32.41s/it]training loss: 8.075e-03:   1%|          | 2208/300001 [20:13:52<2649:42:04, 32.03s/it]training loss: 8.075e-03:   1%|          | 2209/300001 [20:14:24<2637:32:37, 31.89s/it]training loss: 8.075e-03:   1%|          | 2210/300001 [20:14:57<2660:47:27, 32.17s/it]training loss: 8.075e-03:   1%|          | 2211/300001 [20:15:29<2671:00:57, 32.29s/it]training loss: 8.075e-03:   1%|          | 2212/300001 [20:16:02<2683:05:05, 32.44s/it]training loss: 8.075e-03:   1%|          | 2213/300001 [20:16:35<2701:02:34, 32.65s/it]training loss: 8.075e-03:   1%|          | 2214/300001 [20:17:09<2720:16:02, 32.89s/it]training loss: 8.075e-03:   1%|          | 2215/300001 [20:17:41<2713:49:43, 32.81s/it]training loss: 8.075e-03:   1%|          | 2216/300001 [20:18:13<2679:19:25, 32.39s/it]training loss: 8.075e-03:   1%|          | 2217/300001 [20:18:45<2679:28:19, 32.39s/it]training loss: 8.075e-03:   1%|          | 2218/300001 [20:19:18<2683:11:20, 32.44s/it]training loss: 8.075e-03:   1%|          | 2219/300001 [20:19:49<2667:29:32, 32.25s/it]training loss: 8.075e-03:   1%|          | 2220/300001 [20:20:22<2678:23:34, 32.38s/it]training loss: 6.981e-03:   1%|          | 2220/300001 [20:20:54<2678:23:34, 32.38s/it]training loss: 6.981e-03:   1%|          | 2221/300001 [20:20:54<2670:04:52, 32.28s/it]training loss: 6.981e-03:   1%|          | 2222/300001 [20:21:27<2678:32:54, 32.38s/it]training loss: 6.981e-03:   1%|          | 2223/300001 [20:21:59<2671:19:01, 32.30s/it]training loss: 6.981e-03:   1%|          | 2224/300001 [20:22:31<2675:09:42, 32.34s/it]training loss: 6.981e-03:   1%|          | 2225/300001 [20:23:02<2643:58:31, 31.96s/it]training loss: 6.981e-03:   1%|          | 2226/300001 [20:23:35<2663:31:11, 32.20s/it]training loss: 6.981e-03:   1%|          | 2227/300001 [20:24:08<2674:34:17, 32.33s/it]training loss: 6.981e-03:   1%|          | 2228/300001 [20:24:40<2660:09:13, 32.16s/it]training loss: 6.981e-03:   1%|          | 2229/300001 [20:25:13<2693:58:39, 32.57s/it]training loss: 6.981e-03:   1%|          | 2230/300001 [20:25:46<2709:35:59, 32.76s/it]training loss: 6.981e-03:   1%|          | 2231/300001 [20:26:19<2712:41:48, 32.80s/it]training loss: 6.981e-03:   1%|          | 2232/300001 [20:26:52<2703:07:22, 32.68s/it]training loss: 6.981e-03:   1%|          | 2233/300001 [20:27:25<2717:19:52, 32.85s/it]training loss: 6.981e-03:   1%|          | 2234/300001 [20:27:56<2687:00:13, 32.49s/it]training loss: 6.981e-03:   1%|          | 2235/300001 [20:28:29<2683:09:50, 32.44s/it]training loss: 6.981e-03:   1%|          | 2236/300001 [20:29:00<2652:07:49, 32.06s/it]training loss: 6.981e-03:   1%|          | 2237/300001 [20:29:33<2671:11:48, 32.30s/it]training loss: 6.981e-03:   1%|          | 2238/300001 [20:30:05<2677:11:58, 32.37s/it]training loss: 6.981e-03:   1%|          | 2239/300001 [20:30:39<2698:14:32, 32.62s/it]training loss: 6.981e-03:   1%|          | 2240/300001 [20:31:10<2667:49:42, 32.25s/it]training loss: 8.543e-03:   1%|          | 2240/300001 [20:31:42<2667:49:42, 32.25s/it]training loss: 8.543e-03:   1%|          | 2241/300001 [20:31:42<2663:34:30, 32.20s/it]training loss: 8.543e-03:   1%|          | 2242/300001 [20:32:15<2680:38:08, 32.41s/it]training loss: 8.543e-03:   1%|          | 2243/300001 [20:32:49<2712:52:49, 32.80s/it]training loss: 8.543e-03:   1%|          | 2244/300001 [20:33:22<2720:35:05, 32.89s/it]training loss: 8.543e-03:   1%|          | 2245/300001 [20:33:54<2715:50:55, 32.84s/it]training loss: 8.543e-03:   1%|          | 2246/300001 [20:34:27<2715:30:22, 32.83s/it]training loss: 8.543e-03:   1%|          | 2247/300001 [20:35:00<2720:24:29, 32.89s/it]training loss: 8.543e-03:   1%|          | 2248/300001 [20:35:34<2730:33:30, 33.01s/it]training loss: 8.543e-03:   1%|          | 2249/300001 [20:36:06<2726:28:37, 32.96s/it]training loss: 8.543e-03:   1%|          | 2250/300001 [20:36:38<2700:57:39, 32.66s/it]training loss: 8.543e-03:   1%|          | 2251/300001 [20:37:11<2705:30:16, 32.71s/it]training loss: 8.543e-03:   1%|          | 2252/300001 [20:37:45<2727:12:00, 32.97s/it]training loss: 8.543e-03:   1%|          | 2253/300001 [20:38:17<2705:33:04, 32.71s/it]training loss: 8.543e-03:   1%|          | 2254/300001 [20:38:50<2710:57:49, 32.78s/it]training loss: 8.543e-03:   1%|          | 2255/300001 [20:39:24<2737:34:15, 33.10s/it]training loss: 8.543e-03:   1%|          | 2256/300001 [20:39:56<2729:05:30, 33.00s/it]training loss: 8.543e-03:   1%|          | 2257/300001 [20:40:28<2696:36:31, 32.60s/it]training loss: 8.543e-03:   1%|          | 2258/300001 [20:41:01<2696:30:59, 32.60s/it]training loss: 8.543e-03:   1%|          | 2259/300001 [20:41:33<2691:36:28, 32.54s/it]training loss: 8.543e-03:   1%|          | 2260/300001 [20:42:06<2705:24:36, 32.71s/it]training loss: 7.698e-03:   1%|          | 2260/300001 [20:42:38<2705:24:36, 32.71s/it]training loss: 7.698e-03:   1%|          | 2261/300001 [20:42:38<2691:49:22, 32.55s/it]training loss: 7.698e-03:   1%|          | 2262/300001 [20:43:11<2705:23:17, 32.71s/it]training loss: 7.698e-03:   1%|          | 2263/300001 [20:43:43<2686:34:14, 32.48s/it]training loss: 7.698e-03:   1%|          | 2264/300001 [20:44:15<2676:10:34, 32.36s/it]training loss: 7.698e-03:   1%|          | 2265/300001 [20:44:48<2674:31:42, 32.34s/it]training loss: 7.698e-03:   1%|          | 2266/300001 [20:45:20<2674:23:36, 32.34s/it]training loss: 7.698e-03:   1%|          | 2267/300001 [20:45:53<2691:18:44, 32.54s/it]training loss: 7.698e-03:   1%|          | 2268/300001 [20:46:26<2691:17:11, 32.54s/it]training loss: 7.698e-03:   1%|          | 2269/300001 [20:46:58<2687:08:39, 32.49s/it]training loss: 7.698e-03:   1%|          | 2270/300001 [20:47:31<2689:23:03, 32.52s/it]training loss: 7.698e-03:   1%|          | 2271/300001 [20:48:02<2662:21:29, 32.19s/it]training loss: 7.698e-03:   1%|          | 2272/300001 [20:48:35<2692:58:39, 32.56s/it]training loss: 7.698e-03:   1%|          | 2273/300001 [20:49:07<2662:42:31, 32.20s/it]training loss: 7.698e-03:   1%|          | 2274/300001 [20:49:39<2665:23:49, 32.23s/it]training loss: 7.698e-03:   1%|          | 2275/300001 [20:50:12<2674:02:24, 32.33s/it]training loss: 7.698e-03:   1%|          | 2276/300001 [20:50:44<2682:31:38, 32.44s/it]training loss: 7.698e-03:   1%|          | 2277/300001 [20:51:16<2663:31:41, 32.21s/it]training loss: 7.698e-03:   1%|          | 2278/300001 [20:51:49<2670:12:21, 32.29s/it]training loss: 7.698e-03:   1%|          | 2279/300001 [20:52:21<2666:14:27, 32.24s/it]training loss: 7.698e-03:   1%|          | 2280/300001 [20:52:53<2664:17:15, 32.22s/it]training loss: 5.841e-03:   1%|          | 2280/300001 [20:53:25<2664:17:15, 32.22s/it]training loss: 5.841e-03:   1%|          | 2281/300001 [20:53:25<2656:23:17, 32.12s/it]training loss: 5.841e-03:   1%|          | 2282/300001 [20:53:56<2637:33:00, 31.89s/it]training loss: 5.841e-03:   1%|          | 2283/300001 [20:54:28<2649:57:21, 32.04s/it]training loss: 5.841e-03:   1%|          | 2284/300001 [20:55:02<2678:16:30, 32.39s/it]training loss: 5.841e-03:   1%|          | 2285/300001 [20:55:34<2685:19:24, 32.47s/it]training loss: 5.841e-03:   1%|          | 2286/300001 [20:56:06<2673:26:22, 32.33s/it]training loss: 5.841e-03:   1%|          | 2287/300001 [20:56:39<2684:35:33, 32.46s/it]training loss: 5.841e-03:   1%|          | 2288/300001 [20:57:12<2683:40:16, 32.45s/it]training loss: 5.841e-03:   1%|          | 2289/300001 [20:57:43<2659:39:56, 32.16s/it]training loss: 5.841e-03:   1%|          | 2290/300001 [20:58:15<2662:46:02, 32.20s/it]training loss: 5.841e-03:   1%|          | 2291/300001 [20:58:48<2671:51:44, 32.31s/it]training loss: 5.841e-03:   1%|          | 2292/300001 [20:59:20<2663:26:56, 32.21s/it]training loss: 5.841e-03:   1%|          | 2293/300001 [20:59:52<2664:44:11, 32.22s/it]training loss: 5.841e-03:   1%|          | 2294/300001 [21:00:24<2663:45:22, 32.21s/it]training loss: 5.841e-03:   1%|          | 2295/300001 [21:00:56<2659:52:03, 32.16s/it]training loss: 5.841e-03:   1%|          | 2296/300001 [21:01:28<2649:52:21, 32.04s/it]training loss: 5.841e-03:   1%|          | 2297/300001 [21:02:02<2694:04:30, 32.58s/it]training loss: 5.841e-03:   1%|          | 2298/300001 [21:02:35<2703:03:16, 32.69s/it]training loss: 5.841e-03:   1%|          | 2299/300001 [21:03:06<2668:32:16, 32.27s/it]training loss: 5.841e-03:   1%|          | 2300/300001 [21:03:39<2684:48:42, 32.47s/it]training loss: 5.919e-03:   1%|          | 2300/300001 [21:04:12<2684:48:42, 32.47s/it]training loss: 5.919e-03:   1%|          | 2301/300001 [21:04:12<2701:00:11, 32.66s/it]training loss: 5.919e-03:   1%|          | 2302/300001 [21:04:43<2662:20:39, 32.20s/it]training loss: 5.919e-03:   1%|          | 2303/300001 [21:05:16<2681:04:03, 32.42s/it]training loss: 5.919e-03:   1%|          | 2304/300001 [21:05:49<2689:55:31, 32.53s/it]training loss: 5.919e-03:   1%|          | 2305/300001 [21:06:21<2685:33:01, 32.48s/it]training loss: 5.919e-03:   1%|          | 2306/300001 [21:06:54<2700:49:07, 32.66s/it]training loss: 5.919e-03:   1%|          | 2307/300001 [21:07:26<2665:26:03, 32.23s/it]training loss: 5.919e-03:   1%|          | 2308/300001 [21:07:59<2689:52:03, 32.53s/it]training loss: 5.919e-03:   1%|          | 2309/300001 [21:08:32<2701:38:41, 32.67s/it]training loss: 5.919e-03:   1%|          | 2310/300001 [21:09:04<2675:09:15, 32.35s/it]training loss: 5.919e-03:   1%|          | 2311/300001 [21:09:35<2663:22:01, 32.21s/it]training loss: 5.919e-03:   1%|          | 2312/300001 [21:10:08<2664:04:25, 32.22s/it]training loss: 5.919e-03:   1%|          | 2313/300001 [21:10:40<2660:47:44, 32.18s/it]training loss: 5.919e-03:   1%|          | 2314/300001 [21:11:11<2642:19:59, 31.95s/it]training loss: 5.919e-03:   1%|          | 2315/300001 [21:11:44<2662:12:52, 32.19s/it]training loss: 5.919e-03:   1%|          | 2316/300001 [21:12:16<2656:56:24, 32.13s/it]training loss: 5.919e-03:   1%|          | 2317/300001 [21:12:46<2603:37:19, 31.49s/it]training loss: 5.919e-03:   1%|          | 2318/300001 [21:13:18<2630:48:58, 31.82s/it]training loss: 5.919e-03:   1%|          | 2319/300001 [21:13:51<2643:59:57, 31.98s/it]training loss: 5.919e-03:   1%|          | 2320/300001 [21:14:23<2649:49:43, 32.05s/it]training loss: 6.288e-03:   1%|          | 2320/300001 [21:14:56<2649:49:43, 32.05s/it]training loss: 6.288e-03:   1%|          | 2321/300001 [21:14:56<2669:22:06, 32.28s/it]training loss: 6.288e-03:   1%|          | 2322/300001 [21:15:28<2667:10:20, 32.26s/it]training loss: 6.288e-03:   1%|          | 2323/300001 [21:16:01<2690:55:20, 32.54s/it]training loss: 6.288e-03:   1%|          | 2324/300001 [21:16:34<2688:12:46, 32.51s/it]training loss: 6.288e-03:   1%|          | 2325/300001 [21:17:06<2692:35:13, 32.56s/it]training loss: 6.288e-03:   1%|          | 2326/300001 [21:17:38<2666:01:53, 32.24s/it]training loss: 6.288e-03:   1%|          | 2327/300001 [21:18:11<2687:06:50, 32.50s/it]training loss: 6.288e-03:   1%|          | 2328/300001 [21:18:43<2672:15:49, 32.32s/it]training loss: 6.288e-03:   1%|          | 2329/300001 [21:19:15<2665:02:23, 32.23s/it]training loss: 6.288e-03:   1%|          | 2330/300001 [21:19:47<2668:08:07, 32.27s/it]training loss: 6.288e-03:   1%|          | 2331/300001 [21:20:20<2675:40:26, 32.36s/it]training loss: 6.288e-03:   1%|          | 2332/300001 [21:20:52<2672:31:38, 32.32s/it]training loss: 6.288e-03:   1%|          | 2333/300001 [21:21:25<2688:56:15, 32.52s/it]training loss: 6.288e-03:   1%|          | 2334/300001 [21:21:56<2660:58:46, 32.18s/it]training loss: 6.288e-03:   1%|          | 2335/300001 [21:22:29<2670:09:53, 32.29s/it]training loss: 6.288e-03:   1%|          | 2336/300001 [21:23:01<2653:51:55, 32.10s/it]training loss: 6.288e-03:   1%|          | 2337/300001 [21:23:33<2653:13:59, 32.09s/it]training loss: 6.288e-03:   1%|          | 2338/300001 [21:24:06<2673:59:41, 32.34s/it]training loss: 6.288e-03:   1%|          | 2339/300001 [21:24:37<2638:34:03, 31.91s/it]training loss: 6.288e-03:   1%|          | 2340/300001 [21:25:10<2665:05:28, 32.23s/it]training loss: 5.364e-03:   1%|          | 2340/300001 [21:25:42<2665:05:28, 32.23s/it]training loss: 5.364e-03:   1%|          | 2341/300001 [21:25:42<2662:31:21, 32.20s/it]training loss: 5.364e-03:   1%|          | 2342/300001 [21:26:12<2624:24:48, 31.74s/it]training loss: 5.364e-03:   1%|          | 2343/300001 [21:26:44<2628:25:21, 31.79s/it]training loss: 5.364e-03:   1%|          | 2344/300001 [21:27:17<2664:42:54, 32.23s/it]training loss: 5.364e-03:   1%|          | 2345/300001 [21:27:50<2661:42:18, 32.19s/it]training loss: 5.364e-03:   1%|          | 2346/300001 [21:28:23<2689:20:06, 32.53s/it]training loss: 5.364e-03:   1%|          | 2347/300001 [21:28:57<2719:28:09, 32.89s/it]training loss: 5.364e-03:   1%|          | 2348/300001 [21:29:29<2706:09:55, 32.73s/it]training loss: 5.364e-03:   1%|          | 2349/300001 [21:30:03<2727:26:26, 32.99s/it]training loss: 5.364e-03:   1%|          | 2350/300001 [21:30:36<2730:54:00, 33.03s/it]training loss: 5.364e-03:   1%|          | 2351/300001 [21:31:09<2726:31:09, 32.98s/it]training loss: 5.364e-03:   1%|          | 2352/300001 [21:31:41<2703:35:49, 32.70s/it]training loss: 5.364e-03:   1%|          | 2353/300001 [21:32:12<2678:33:23, 32.40s/it]training loss: 5.364e-03:   1%|          | 2354/300001 [21:32:44<2648:59:24, 32.04s/it]training loss: 5.364e-03:   1%|          | 2355/300001 [21:33:06<2422:36:59, 29.30s/it]training loss: 5.364e-03:   1%|          | 2356/300001 [21:33:39<2513:58:42, 30.41s/it]training loss: 5.364e-03:   1%|          | 2357/300001 [21:34:11<2552:40:44, 30.87s/it]training loss: 5.364e-03:   1%|          | 2358/300001 [21:34:43<2566:03:35, 31.04s/it]training loss: 5.364e-03:   1%|          | 2359/300001 [21:35:16<2628:00:46, 31.79s/it]training loss: 5.364e-03:   1%|          | 2360/300001 [21:35:49<2651:23:25, 32.07s/it]training loss: 5.904e-03:   1%|          | 2360/300001 [21:36:21<2651:23:25, 32.07s/it]training loss: 5.904e-03:   1%|          | 2361/300001 [21:36:21<2650:14:08, 32.05s/it]training loss: 5.904e-03:   1%|          | 2362/300001 [21:36:53<2650:33:24, 32.06s/it]training loss: 5.904e-03:   1%|          | 2363/300001 [21:37:26<2670:20:15, 32.30s/it]training loss: 5.904e-03:   1%|          | 2364/300001 [21:37:59<2696:22:37, 32.61s/it]training loss: 5.904e-03:   1%|          | 2365/300001 [21:38:33<2716:08:39, 32.85s/it]training loss: 5.904e-03:   1%|          | 2366/300001 [21:39:06<2719:58:46, 32.90s/it]training loss: 5.904e-03:   1%|          | 2367/300001 [21:39:39<2722:43:20, 32.93s/it]training loss: 5.904e-03:   1%|          | 2368/300001 [21:40:11<2708:38:15, 32.76s/it]training loss: 5.904e-03:   1%|          | 2369/300001 [21:40:45<2725:20:08, 32.96s/it]training loss: 5.904e-03:   1%|          | 2370/300001 [21:41:18<2742:46:56, 33.18s/it]training loss: 5.904e-03:   1%|          | 2371/300001 [21:41:50<2703:30:01, 32.70s/it]training loss: 5.904e-03:   1%|          | 2372/300001 [21:42:23<2711:56:20, 32.80s/it]training loss: 5.904e-03:   1%|          | 2373/300001 [21:42:54<2676:35:31, 32.38s/it]training loss: 5.904e-03:   1%|          | 2374/300001 [21:43:27<2678:03:14, 32.39s/it]training loss: 5.904e-03:   1%|          | 2375/300001 [21:44:00<2689:51:04, 32.54s/it]training loss: 5.904e-03:   1%|          | 2376/300001 [21:44:31<2660:40:02, 32.18s/it]training loss: 5.904e-03:   1%|          | 2377/300001 [21:45:03<2662:07:50, 32.20s/it]training loss: 5.904e-03:   1%|          | 2378/300001 [21:45:35<2663:57:27, 32.22s/it]training loss: 5.904e-03:   1%|          | 2379/300001 [21:46:08<2673:53:16, 32.34s/it]training loss: 5.904e-03:   1%|          | 2380/300001 [21:46:41<2687:39:34, 32.51s/it]training loss: 6.271e-03:   1%|          | 2380/300001 [21:47:15<2687:39:34, 32.51s/it]training loss: 6.271e-03:   1%|          | 2381/300001 [21:47:15<2732:24:20, 33.05s/it]training loss: 6.271e-03:   1%|          | 2382/300001 [21:47:47<2691:30:11, 32.56s/it]training loss: 6.271e-03:   1%|          | 2383/300001 [21:48:18<2665:53:44, 32.25s/it]training loss: 6.271e-03:   1%|          | 2384/300001 [21:48:50<2660:44:47, 32.18s/it]training loss: 6.271e-03:   1%|          | 2385/300001 [21:49:22<2656:05:26, 32.13s/it]training loss: 6.271e-03:   1%|          | 2386/300001 [21:49:55<2669:15:08, 32.29s/it]training loss: 6.271e-03:   1%|          | 2387/300001 [21:50:27<2673:30:30, 32.34s/it]training loss: 6.271e-03:   1%|          | 2388/300001 [21:50:59<2659:03:16, 32.16s/it]training loss: 6.271e-03:   1%|          | 2389/300001 [21:51:30<2635:20:33, 31.88s/it]training loss: 6.271e-03:   1%|          | 2390/300001 [21:52:03<2652:48:56, 32.09s/it]training loss: 6.271e-03:   1%|          | 2391/300001 [21:52:35<2664:20:56, 32.23s/it]training loss: 6.271e-03:   1%|          | 2392/300001 [21:53:07<2651:08:32, 32.07s/it]training loss: 6.271e-03:   1%|          | 2393/300001 [21:53:40<2660:48:35, 32.19s/it]training loss: 6.271e-03:   1%|          | 2394/300001 [21:54:12<2671:42:48, 32.32s/it]training loss: 6.271e-03:   1%|          | 2395/300001 [21:54:45<2674:36:26, 32.35s/it]training loss: 6.271e-03:   1%|          | 2396/300001 [21:55:17<2677:50:18, 32.39s/it]training loss: 6.271e-03:   1%|          | 2397/300001 [21:55:50<2682:49:52, 32.45s/it]training loss: 6.271e-03:   1%|          | 2398/300001 [21:56:22<2671:38:33, 32.32s/it]training loss: 6.271e-03:   1%|          | 2399/300001 [21:56:54<2673:32:24, 32.34s/it]training loss: 6.271e-03:   1%|          | 2400/300001 [21:57:26<2656:21:13, 32.13s/it]training loss: 5.810e-03:   1%|          | 2400/300001 [21:57:57<2656:21:13, 32.13s/it]training loss: 5.810e-03:   1%|          | 2401/300001 [21:57:57<2642:34:08, 31.97s/it]training loss: 5.810e-03:   1%|          | 2402/300001 [21:58:30<2664:51:31, 32.24s/it]training loss: 5.810e-03:   1%|          | 2403/300001 [21:59:02<2654:26:16, 32.11s/it]training loss: 5.810e-03:   1%|          | 2404/300001 [21:59:35<2673:45:39, 32.34s/it]training loss: 5.810e-03:   1%|          | 2405/300001 [22:00:06<2649:15:15, 32.05s/it]training loss: 5.810e-03:   1%|          | 2406/300001 [22:00:38<2630:55:22, 31.83s/it]training loss: 5.810e-03:   1%|          | 2407/300001 [22:01:10<2647:59:55, 32.03s/it]training loss: 5.810e-03:   1%|          | 2408/300001 [22:01:43<2659:10:14, 32.17s/it]training loss: 5.810e-03:   1%|          | 2409/300001 [22:02:15<2675:41:25, 32.37s/it]training loss: 5.810e-03:   1%|          | 2410/300001 [22:02:48<2685:31:49, 32.49s/it]training loss: 5.810e-03:   1%|          | 2411/300001 [22:03:20<2675:58:15, 32.37s/it]training loss: 5.810e-03:   1%|          | 2412/300001 [22:03:52<2668:20:48, 32.28s/it]training loss: 5.810e-03:   1%|          | 2413/300001 [22:04:25<2673:48:10, 32.35s/it]training loss: 5.810e-03:   1%|          | 2414/300001 [22:04:57<2668:52:56, 32.29s/it]training loss: 5.810e-03:   1%|          | 2415/300001 [22:05:28<2647:22:31, 32.03s/it]training loss: 5.810e-03:   1%|          | 2416/300001 [22:06:01<2649:44:40, 32.05s/it]training loss: 5.810e-03:   1%|          | 2417/300001 [22:06:32<2640:14:29, 31.94s/it]training loss: 5.810e-03:   1%|          | 2418/300001 [22:07:04<2643:32:48, 31.98s/it]training loss: 5.810e-03:   1%|          | 2419/300001 [22:07:36<2644:19:09, 31.99s/it]training loss: 5.810e-03:   1%|          | 2420/300001 [22:08:08<2626:16:33, 31.77s/it]training loss: 6.402e-03:   1%|          | 2420/300001 [22:08:40<2626:16:33, 31.77s/it]training loss: 6.402e-03:   1%|          | 2421/300001 [22:08:40<2651:29:59, 32.08s/it]training loss: 6.402e-03:   1%|          | 2422/300001 [22:09:12<2652:17:42, 32.09s/it]training loss: 6.402e-03:   1%|          | 2423/300001 [22:09:44<2648:23:32, 32.04s/it]training loss: 6.402e-03:   1%|          | 2424/300001 [22:10:17<2651:58:57, 32.08s/it]training loss: 6.402e-03:   1%|          | 2425/300001 [22:10:49<2655:05:10, 32.12s/it]training loss: 6.402e-03:   1%|          | 2426/300001 [22:11:20<2640:38:01, 31.95s/it]training loss: 6.402e-03:   1%|          | 2427/300001 [22:11:53<2649:38:52, 32.05s/it]training loss: 6.402e-03:   1%|          | 2428/300001 [22:12:24<2639:19:30, 31.93s/it]training loss: 6.402e-03:   1%|          | 2429/300001 [22:12:57<2656:17:12, 32.14s/it]training loss: 6.402e-03:   1%|          | 2430/300001 [22:13:28<2642:29:58, 31.97s/it]training loss: 6.402e-03:   1%|          | 2431/300001 [22:14:01<2660:41:59, 32.19s/it]training loss: 6.402e-03:   1%|          | 2432/300001 [22:14:34<2687:08:12, 32.51s/it]training loss: 6.402e-03:   1%|          | 2433/300001 [22:15:06<2662:50:05, 32.22s/it]training loss: 6.402e-03:   1%|          | 2434/300001 [22:15:38<2670:08:43, 32.30s/it]training loss: 6.402e-03:   1%|          | 2435/300001 [22:16:12<2698:55:14, 32.65s/it]training loss: 6.402e-03:   1%|          | 2436/300001 [22:16:44<2689:52:21, 32.54s/it]training loss: 6.402e-03:   1%|          | 2437/300001 [22:17:17<2700:10:07, 32.67s/it]training loss: 6.402e-03:   1%|          | 2438/300001 [22:17:49<2689:59:35, 32.54s/it]training loss: 6.402e-03:   1%|          | 2439/300001 [22:18:21<2671:20:22, 32.32s/it]training loss: 6.402e-03:   1%|          | 2440/300001 [22:18:54<2672:28:52, 32.33s/it]training loss: 6.365e-03:   1%|          | 2440/300001 [22:19:27<2672:28:52, 32.33s/it]training loss: 6.365e-03:   1%|          | 2441/300001 [22:19:27<2710:39:43, 32.79s/it]training loss: 6.365e-03:   1%|          | 2442/300001 [22:20:00<2703:25:34, 32.71s/it]training loss: 6.365e-03:   1%|          | 2443/300001 [22:20:31<2669:36:37, 32.30s/it]training loss: 6.365e-03:   1%|          | 2444/300001 [22:21:04<2679:21:17, 32.42s/it]training loss: 6.365e-03:   1%|          | 2445/300001 [22:21:36<2677:57:45, 32.40s/it]training loss: 6.365e-03:   1%|          | 2446/300001 [22:22:08<2669:00:30, 32.29s/it]training loss: 6.365e-03:   1%|          | 2447/300001 [22:22:41<2679:08:14, 32.41s/it]training loss: 6.365e-03:   1%|          | 2448/300001 [22:23:13<2656:50:24, 32.14s/it]training loss: 6.365e-03:   1%|          | 2449/300001 [22:23:45<2665:37:43, 32.25s/it]training loss: 6.365e-03:   1%|          | 2450/300001 [22:24:17<2663:29:31, 32.22s/it]training loss: 6.365e-03:   1%|          | 2451/300001 [22:24:49<2660:54:42, 32.19s/it]training loss: 6.365e-03:   1%|          | 2452/300001 [22:25:22<2673:02:33, 32.34s/it]training loss: 6.365e-03:   1%|          | 2453/300001 [22:25:54<2653:05:17, 32.10s/it]training loss: 6.365e-03:   1%|          | 2454/300001 [22:26:27<2675:27:04, 32.37s/it]training loss: 6.365e-03:   1%|          | 2455/300001 [22:26:58<2651:45:42, 32.08s/it]training loss: 6.365e-03:   1%|          | 2456/300001 [22:27:30<2645:52:04, 32.01s/it]training loss: 6.365e-03:   1%|          | 2457/300001 [22:28:02<2655:23:52, 32.13s/it]training loss: 6.365e-03:   1%|          | 2458/300001 [22:28:33<2619:39:39, 31.70s/it]training loss: 6.365e-03:   1%|          | 2459/300001 [22:29:04<2614:38:11, 31.63s/it]training loss: 6.365e-03:   1%|          | 2460/300001 [22:29:37<2626:33:13, 31.78s/it]training loss: 5.168e-03:   1%|          | 2460/300001 [22:30:09<2626:33:13, 31.78s/it]training loss: 5.168e-03:   1%|          | 2461/300001 [22:30:10<2655:06:57, 32.12s/it]training loss: 5.168e-03:   1%|          | 2462/300001 [22:30:41<2633:35:01, 31.86s/it]training loss: 5.168e-03:   1%|          | 2463/300001 [22:31:12<2628:43:46, 31.81s/it]training loss: 5.168e-03:   1%|          | 2464/300001 [22:31:45<2638:56:33, 31.93s/it]training loss: 5.168e-03:   1%|          | 2465/300001 [22:32:18<2675:44:54, 32.37s/it]training loss: 5.168e-03:   1%|          | 2466/300001 [22:32:51<2679:40:01, 32.42s/it]training loss: 5.168e-03:   1%|          | 2467/300001 [22:33:23<2676:53:47, 32.39s/it]training loss: 5.168e-03:   1%|          | 2468/300001 [22:33:55<2673:40:13, 32.35s/it]training loss: 5.168e-03:   1%|          | 2469/300001 [22:34:27<2659:16:08, 32.18s/it]training loss: 5.168e-03:   1%|          | 2470/300001 [22:35:00<2688:56:38, 32.54s/it]training loss: 5.168e-03:   1%|          | 2471/300001 [22:35:33<2703:09:03, 32.71s/it]training loss: 5.168e-03:   1%|          | 2472/300001 [22:36:06<2696:43:38, 32.63s/it]training loss: 5.168e-03:   1%|          | 2473/300001 [22:36:38<2690:21:08, 32.55s/it]training loss: 5.168e-03:   1%|          | 2474/300001 [22:37:12<2712:27:02, 32.82s/it]training loss: 5.168e-03:   1%|          | 2475/300001 [22:37:44<2704:39:47, 32.73s/it]training loss: 5.168e-03:   1%|          | 2476/300001 [22:38:18<2719:08:39, 32.90s/it]training loss: 5.168e-03:   1%|          | 2477/300001 [22:38:50<2715:38:52, 32.86s/it]training loss: 5.168e-03:   1%|          | 2478/300001 [22:39:24<2725:32:42, 32.98s/it]training loss: 5.168e-03:   1%|          | 2479/300001 [22:39:57<2725:51:57, 32.98s/it]training loss: 5.168e-03:   1%|          | 2480/300001 [22:40:30<2727:15:50, 33.00s/it]training loss: 5.435e-03:   1%|          | 2480/300001 [22:41:02<2727:15:50, 33.00s/it]training loss: 5.435e-03:   1%|          | 2481/300001 [22:41:02<2706:56:38, 32.75s/it]training loss: 5.435e-03:   1%|          | 2482/300001 [22:41:34<2698:01:13, 32.65s/it]training loss: 5.435e-03:   1%|          | 2483/300001 [22:42:05<2663:58:31, 32.23s/it]training loss: 5.435e-03:   1%|          | 2484/300001 [22:42:39<2691:45:06, 32.57s/it]training loss: 5.435e-03:   1%|          | 2485/300001 [22:43:11<2680:20:54, 32.43s/it]training loss: 5.435e-03:   1%|          | 2486/300001 [22:43:44<2702:46:51, 32.70s/it]training loss: 5.435e-03:   1%|          | 2487/300001 [22:44:17<2714:55:21, 32.85s/it]training loss: 5.435e-03:   1%|          | 2488/300001 [22:44:49<2692:14:16, 32.58s/it]training loss: 5.435e-03:   1%|          | 2489/300001 [22:45:22<2702:28:43, 32.70s/it]training loss: 5.435e-03:   1%|          | 2490/300001 [22:45:54<2669:21:29, 32.30s/it]training loss: 5.435e-03:   1%|          | 2491/300001 [22:46:26<2675:20:46, 32.37s/it]training loss: 5.435e-03:   1%|          | 2492/300001 [22:46:58<2656:10:07, 32.14s/it]training loss: 5.435e-03:   1%|          | 2493/300001 [22:47:30<2661:28:27, 32.21s/it]training loss: 5.435e-03:   1%|          | 2494/300001 [22:48:02<2663:36:02, 32.23s/it]training loss: 5.435e-03:   1%|          | 2495/300001 [22:48:35<2672:58:59, 32.34s/it]training loss: 5.435e-03:   1%|          | 2496/300001 [22:49:08<2675:10:41, 32.37s/it]training loss: 5.435e-03:   1%|          | 2497/300001 [22:49:38<2634:44:45, 31.88s/it]training loss: 5.435e-03:   1%|          | 2498/300001 [22:50:11<2653:38:09, 32.11s/it]training loss: 5.435e-03:   1%|          | 2499/300001 [22:50:44<2675:17:41, 32.37s/it]training loss: 5.435e-03:   1%|          | 2500/300001 [22:51:16<2663:38:36, 32.23s/it]training loss: 5.766e-03:   1%|          | 2500/300001 [22:51:47<2663:38:36, 32.23s/it]training loss: 5.766e-03:   1%|          | 2501/300001 [22:51:52<2756:27:15, 33.36s/it]training loss: 5.766e-03:   1%|          | 2502/300001 [22:52:24<2721:35:50, 32.93s/it]training loss: 5.766e-03:   1%|          | 2503/300001 [22:52:57<2720:02:55, 32.92s/it]training loss: 5.766e-03:   1%|          | 2504/300001 [22:53:29<2701:15:15, 32.69s/it]training loss: 5.766e-03:   1%|          | 2505/300001 [22:54:00<2665:45:48, 32.26s/it]training loss: 5.766e-03:   1%|          | 2506/300001 [22:54:32<2650:13:53, 32.07s/it]training loss: 5.766e-03:   1%|          | 2507/300001 [22:55:03<2632:14:40, 31.85s/it]training loss: 5.766e-03:   1%|          | 2508/300001 [22:55:35<2641:20:58, 31.96s/it]training loss: 5.766e-03:   1%|          | 2509/300001 [22:56:07<2647:31:42, 32.04s/it]training loss: 5.766e-03:   1%|          | 2510/300001 [22:56:39<2625:59:24, 31.78s/it]training loss: 5.766e-03:   1%|          | 2511/300001 [22:57:11<2638:34:31, 31.93s/it]training loss: 5.766e-03:   1%|          | 2512/300001 [22:57:34<2420:27:56, 29.29s/it]training loss: 5.766e-03:   1%|          | 2513/300001 [22:58:07<2511:56:59, 30.40s/it]training loss: 5.766e-03:   1%|          | 2514/300001 [22:58:39<2549:01:25, 30.85s/it]slurmstepd: error: *** JOB 9913564 ON gpu016 CANCELLED AT 2026-05-15T15:34:01 DUE TO TIME LIMIT ***
diff --git a/slurm/logs/pidm_darcy_cocogen_9913564.out b/slurm/logs/pidm_darcy_cocogen_9913564.out
new file mode 100644
index 0000000..4b80c77
--- /dev/null
+++ b/slurm/logs/pidm_darcy_cocogen_9913564.out
@@ -0,0 +1 @@
+Number of trainable parameters: 10386482
diff --git a/slurm/logs/pidm_darcy_diffusion_9913375.err b/slurm/logs/pidm_darcy_diffusion_9913375.err
new file mode 100644
index 0000000..d6624e8
--- /dev/null
+++ b/slurm/logs/pidm_darcy_diffusion_9913375.err
@@ -0,0 +1,6 @@
+  0%|          | 0/300001 [00:00<?, ?it/s]training loss: 3.326e+00:   0%|          | 0/300001 [00:32<?, ?it/s]training loss: 3.326e+00:   0%|          | 1/300001 [03:41<18496:18:51, 221.96s/it]/cm/local/apps/slurm/var/spool/job9913375/slurm_script: line 29: 1984154 Killed                  python -c "
+import os
+code = open('main.py').read().replace(\"name = 'run_1'\", \"name = '\" + os.environ['PIDM_RUN_NAME'] + \"'\")
+exec(compile(code, 'main.py', 'exec'))
+"
+slurmstepd: error: Detected 1 oom-kill event(s) in StepId=9913375.batch. Some of your processes may have been killed by the cgroup out-of-memory handler.
diff --git a/slurm/logs/pidm_darcy_diffusion_9913375.out b/slurm/logs/pidm_darcy_diffusion_9913375.out
new file mode 100644
index 0000000..4b80c77
--- /dev/null
+++ b/slurm/logs/pidm_darcy_diffusion_9913375.out
@@ -0,0 +1 @@
+Number of trainable parameters: 10386482
diff --git a/slurm/logs/pidm_darcy_diffusion_9913543.err b/slurm/logs/pidm_darcy_diffusion_9913543.err
new file mode 100644
index 0000000..6525e7a
--- /dev/null
+++ b/slurm/logs/pidm_darcy_diffusion_9913543.err
@@ -0,0 +1 @@
+  0%|          | 0/300001 [00:00<?, ?it/s]training loss: 3.473e+00:   0%|          | 0/300001 [00:32<?, ?it/s]training loss: 3.473e+00:   0%|          | 1/300001 [02:54<14573:13:51, 174.88s/it]training loss: 3.473e+00:   0%|          | 2/300001 [03:27<7596:57:35, 91.16s/it]  training loss: 3.473e+00:   0%|          | 3/300001 [04:00<5378:56:40, 64.55s/it]training loss: 3.473e+00:   0%|          | 4/300001 [04:33<4333:37:26, 52.00s/it]training loss: 3.473e+00:   0%|          | 5/300001 [05:05<3756:21:21, 45.08s/it]training loss: 3.473e+00:   0%|          | 6/300001 [05:38<3399:59:20, 40.80s/it]training loss: 3.473e+00:   0%|          | 7/300001 [06:10<3162:58:36, 37.96s/it]training loss: 3.473e+00:   0%|          | 8/300001 [06:42<3013:07:15, 36.16s/it]training loss: 3.473e+00:   0%|          | 9/300001 [07:15<2929:17:03, 35.15s/it]training loss: 3.473e+00:   0%|          | 10/300001 [07:49<2888:02:46, 34.66s/it]training loss: 3.473e+00:   0%|          | 11/300001 [08:22<2844:46:33, 34.14s/it]training loss: 3.473e+00:   0%|          | 12/300001 [08:56<2837:44:46, 34.05s/it]training loss: 3.473e+00:   0%|          | 13/300001 [09:29<2814:37:50, 33.78s/it]training loss: 3.473e+00:   0%|          | 14/300001 [10:02<2794:26:25, 33.53s/it]training loss: 3.473e+00:   0%|          | 15/300001 [10:34<2762:06:16, 33.15s/it]training loss: 3.473e+00:   0%|          | 16/300001 [11:06<2746:25:29, 32.96s/it]training loss: 3.473e+00:   0%|          | 17/300001 [11:39<2737:32:28, 32.85s/it]training loss: 3.473e+00:   0%|          | 18/300001 [12:12<2741:40:47, 32.90s/it]training loss: 3.473e+00:   0%|          | 19/300001 [12:44<2709:24:28, 32.51s/it]training loss: 3.473e+00:   0%|          | 20/300001 [13:16<2709:05:20, 32.51s/it]training loss: 1.847e-01:   0%|          | 20/300001 [13:48<2709:05:20, 32.51s/it]training loss: 1.847e-01:   0%|          | 21/300001 [13:48<2682:52:05, 32.20s/it]training loss: 1.847e-01:   0%|          | 22/300001 [14:19<2670:02:07, 32.04s/it]training loss: 1.847e-01:   0%|          | 23/300001 [14:51<2669:26:21, 32.04s/it]training loss: 1.847e-01:   0%|          | 24/300001 [15:23<2656:22:09, 31.88s/it]training loss: 1.847e-01:   0%|          | 25/300001 [15:57<2699:37:03, 32.40s/it]training loss: 1.847e-01:   0%|          | 26/300001 [16:29<2707:58:53, 32.50s/it]training loss: 1.847e-01:   0%|          | 27/300001 [17:02<2715:54:55, 32.59s/it]training loss: 1.847e-01:   0%|          | 28/300001 [17:34<2697:27:16, 32.37s/it]training loss: 1.847e-01:   0%|          | 29/300001 [18:05<2659:45:17, 31.92s/it]training loss: 1.847e-01:   0%|          | 30/300001 [18:38<2701:53:45, 32.43s/it]training loss: 1.847e-01:   0%|          | 31/300001 [19:09<2658:04:31, 31.90s/it]training loss: 1.847e-01:   0%|          | 32/300001 [19:41<2651:48:09, 31.82s/it]training loss: 1.847e-01:   0%|          | 33/300001 [20:13<2665:55:38, 31.99s/it]training loss: 1.847e-01:   0%|          | 34/300001 [20:45<2654:52:18, 31.86s/it]training loss: 1.847e-01:   0%|          | 35/300001 [21:17<2659:48:52, 31.92s/it]training loss: 1.847e-01:   0%|          | 36/300001 [21:50<2690:08:33, 32.29s/it]training loss: 1.847e-01:   0%|          | 37/300001 [22:23<2699:25:28, 32.40s/it]training loss: 1.847e-01:   0%|          | 38/300001 [22:54<2679:20:05, 32.16s/it]training loss: 1.847e-01:   0%|          | 39/300001 [23:27<2695:37:09, 32.35s/it]training loss: 1.847e-01:   0%|          | 40/300001 [24:00<2715:27:35, 32.59s/it]training loss: 7.231e-02:   0%|          | 40/300001 [24:31<2715:27:35, 32.59s/it]training loss: 7.231e-02:   0%|          | 41/300001 [24:32<2687:29:23, 32.25s/it]training loss: 7.231e-02:   0%|          | 42/300001 [25:03<2671:08:39, 32.06s/it]training loss: 7.231e-02:   0%|          | 43/300001 [25:36<2687:23:53, 32.25s/it]training loss: 7.231e-02:   0%|          | 44/300001 [26:08<2692:31:28, 32.31s/it]training loss: 7.231e-02:   0%|          | 45/300001 [26:42<2725:08:17, 32.71s/it]training loss: 7.231e-02:   0%|          | 46/300001 [27:14<2709:38:37, 32.52s/it]training loss: 7.231e-02:   0%|          | 47/300001 [27:46<2701:47:22, 32.43s/it]training loss: 7.231e-02:   0%|          | 48/300001 [28:19<2700:07:56, 32.41s/it]training loss: 7.231e-02:   0%|          | 49/300001 [28:52<2721:34:47, 32.66s/it]training loss: 7.231e-02:   0%|          | 50/300001 [29:25<2725:55:06, 32.72s/it]training loss: 7.231e-02:   0%|          | 51/300001 [29:58<2751:22:54, 33.02s/it]training loss: 7.231e-02:   0%|          | 52/300001 [30:31<2741:51:16, 32.91s/it]training loss: 7.231e-02:   0%|          | 53/300001 [31:02<2694:38:15, 32.34s/it]training loss: 7.231e-02:   0%|          | 54/300001 [31:34<2688:59:58, 32.27s/it]training loss: 7.231e-02:   0%|          | 55/300001 [32:07<2698:17:20, 32.39s/it]training loss: 7.231e-02:   0%|          | 56/300001 [32:40<2710:38:33, 32.53s/it]training loss: 7.231e-02:   0%|          | 57/300001 [33:11<2690:49:20, 32.30s/it]training loss: 7.231e-02:   0%|          | 58/300001 [33:45<2713:56:40, 32.57s/it]training loss: 7.231e-02:   0%|          | 59/300001 [34:18<2724:05:38, 32.70s/it]training loss: 7.231e-02:   0%|          | 60/300001 [34:51<2739:29:02, 32.88s/it]training loss: 3.937e-02:   0%|          | 60/300001 [35:22<2739:29:02, 32.88s/it]training loss: 3.937e-02:   0%|          | 61/300001 [35:22<2705:13:16, 32.47s/it]training loss: 3.937e-02:   0%|          | 62/300001 [35:53<2668:13:20, 32.03s/it]training loss: 3.937e-02:   0%|          | 63/300001 [36:25<2659:54:44, 31.93s/it]training loss: 3.937e-02:   0%|          | 64/300001 [36:58<2693:49:38, 32.33s/it]training loss: 3.937e-02:   0%|          | 65/300001 [37:31<2700:10:58, 32.41s/it]training loss: 3.937e-02:   0%|          | 66/300001 [38:04<2711:19:46, 32.54s/it]training loss: 3.937e-02:   0%|          | 67/300001 [38:37<2736:52:43, 32.85s/it]training loss: 3.937e-02:   0%|          | 68/300001 [39:10<2736:20:42, 32.84s/it]training loss: 3.937e-02:   0%|          | 69/300001 [39:44<2747:33:03, 32.98s/it]training loss: 3.937e-02:   0%|          | 70/300001 [40:16<2724:01:35, 32.70s/it]training loss: 3.937e-02:   0%|          | 71/300001 [40:49<2731:56:16, 32.79s/it]training loss: 3.937e-02:   0%|          | 72/300001 [41:21<2732:04:51, 32.79s/it]training loss: 3.937e-02:   0%|          | 73/300001 [41:54<2728:08:29, 32.75s/it]training loss: 3.937e-02:   0%|          | 74/300001 [42:27<2723:44:39, 32.69s/it]training loss: 3.937e-02:   0%|          | 75/300001 [42:58<2696:13:23, 32.36s/it]training loss: 3.937e-02:   0%|          | 76/300001 [43:31<2712:31:25, 32.56s/it]training loss: 3.937e-02:   0%|          | 77/300001 [44:04<2722:48:21, 32.68s/it]training loss: 3.937e-02:   0%|          | 78/300001 [44:37<2726:58:01, 32.73s/it]training loss: 3.937e-02:   0%|          | 79/300001 [45:09<2701:27:32, 32.43s/it]training loss: 3.937e-02:   0%|          | 80/300001 [45:42<2715:29:21, 32.59s/it]training loss: 3.173e-02:   0%|          | 80/300001 [46:14<2715:29:21, 32.59s/it]training loss: 3.173e-02:   0%|          | 81/300001 [46:14<2709:04:08, 32.52s/it]training loss: 3.173e-02:   0%|          | 82/300001 [46:46<2692:45:48, 32.32s/it]training loss: 3.173e-02:   0%|          | 83/300001 [47:19<2714:19:06, 32.58s/it]training loss: 3.173e-02:   0%|          | 84/300001 [47:52<2716:17:54, 32.60s/it]training loss: 3.173e-02:   0%|          | 85/300001 [48:25<2725:37:01, 32.72s/it]training loss: 3.173e-02:   0%|          | 86/300001 [48:57<2707:51:15, 32.50s/it]training loss: 3.173e-02:   0%|          | 87/300001 [49:28<2675:29:22, 32.12s/it]training loss: 3.173e-02:   0%|          | 88/300001 [50:01<2700:55:01, 32.42s/it]training loss: 3.173e-02:   0%|          | 89/300001 [50:33<2694:01:25, 32.34s/it]training loss: 3.173e-02:   0%|          | 90/300001 [51:06<2695:25:32, 32.35s/it]training loss: 3.173e-02:   0%|          | 91/300001 [51:39<2711:57:55, 32.55s/it]training loss: 3.173e-02:   0%|          | 92/300001 [52:11<2701:30:45, 32.43s/it]training loss: 3.173e-02:   0%|          | 93/300001 [52:43<2686:11:05, 32.24s/it]training loss: 3.173e-02:   0%|          | 94/300001 [53:15<2683:05:45, 32.21s/it]training loss: 3.173e-02:   0%|          | 95/300001 [53:47<2686:51:19, 32.25s/it]training loss: 3.173e-02:   0%|          | 96/300001 [54:20<2700:26:10, 32.42s/it]training loss: 3.173e-02:   0%|          | 97/300001 [54:53<2705:32:12, 32.48s/it]training loss: 3.173e-02:   0%|          | 98/300001 [55:25<2710:16:16, 32.53s/it]training loss: 3.173e-02:   0%|          | 99/300001 [55:58<2716:23:00, 32.61s/it]training loss: 3.173e-02:   0%|          | 100/300001 [56:32<2741:41:02, 32.91s/it]training loss: 2.610e-02:   0%|          | 100/300001 [57:04<2741:41:02, 32.91s/it]training loss: 2.610e-02:   0%|          | 101/300001 [57:04<2727:02:48, 32.74s/it]training loss: 2.610e-02:   0%|          | 102/300001 [57:36<2715:59:55, 32.60s/it]training loss: 2.610e-02:   0%|          | 103/300001 [58:09<2729:58:30, 32.77s/it]training loss: 2.610e-02:   0%|          | 104/300001 [58:42<2734:04:57, 32.82s/it]training loss: 2.610e-02:   0%|          | 105/300001 [59:16<2751:19:03, 33.03s/it]training loss: 2.610e-02:   0%|          | 106/300001 [59:49<2751:17:32, 33.03s/it]training loss: 2.610e-02:   0%|          | 107/300001 [1:00:21<2737:04:57, 32.86s/it]training loss: 2.610e-02:   0%|          | 108/300001 [1:00:54<2727:00:36, 32.74s/it]training loss: 2.610e-02:   0%|          | 109/300001 [1:01:25<2697:58:11, 32.39s/it]training loss: 2.610e-02:   0%|          | 110/300001 [1:01:57<2684:18:41, 32.22s/it]training loss: 2.610e-02:   0%|          | 111/300001 [1:02:29<2686:15:31, 32.25s/it]training loss: 2.610e-02:   0%|          | 112/300001 [1:03:03<2711:47:25, 32.55s/it]training loss: 2.610e-02:   0%|          | 113/300001 [1:03:35<2711:05:32, 32.55s/it]training loss: 2.610e-02:   0%|          | 114/300001 [1:04:07<2692:39:22, 32.32s/it]training loss: 2.610e-02:   0%|          | 115/300001 [1:04:39<2678:34:16, 32.16s/it]training loss: 2.610e-02:   0%|          | 116/300001 [1:05:11<2677:43:08, 32.14s/it]training loss: 2.610e-02:   0%|          | 117/300001 [1:05:43<2675:00:38, 32.11s/it]training loss: 2.610e-02:   0%|          | 118/300001 [1:06:15<2663:50:03, 31.98s/it]training loss: 2.610e-02:   0%|          | 119/300001 [1:06:48<2693:25:48, 32.33s/it]training loss: 2.610e-02:   0%|          | 120/300001 [1:07:19<2672:57:40, 32.09s/it]training loss: 3.199e-02:   0%|          | 120/300001 [1:07:53<2672:57:40, 32.09s/it]training loss: 3.199e-02:   0%|          | 121/300001 [1:07:53<2702:08:30, 32.44s/it]training loss: 3.199e-02:   0%|          | 122/300001 [1:08:25<2706:49:47, 32.50s/it]training loss: 3.199e-02:   0%|          | 123/300001 [1:08:57<2676:41:14, 32.13s/it]training loss: 3.199e-02:   0%|          | 124/300001 [1:09:29<2689:37:21, 32.29s/it]training loss: 3.199e-02:   0%|          | 125/300001 [1:10:03<2733:46:08, 32.82s/it]training loss: 3.199e-02:   0%|          | 126/300001 [1:10:37<2756:07:29, 33.09s/it]training loss: 3.199e-02:   0%|          | 127/300001 [1:11:10<2766:46:29, 33.22s/it]training loss: 3.199e-02:   0%|          | 128/300001 [1:11:43<2751:56:55, 33.04s/it]training loss: 3.199e-02:   0%|          | 129/300001 [1:12:16<2750:30:32, 33.02s/it]training loss: 3.199e-02:   0%|          | 130/300001 [1:12:48<2734:33:45, 32.83s/it]training loss: 3.199e-02:   0%|          | 131/300001 [1:13:21<2724:46:21, 32.71s/it]training loss: 3.199e-02:   0%|          | 132/300001 [1:13:54<2727:06:58, 32.74s/it]training loss: 3.199e-02:   0%|          | 133/300001 [1:14:27<2745:17:49, 32.96s/it]training loss: 3.199e-02:   0%|          | 134/300001 [1:15:00<2747:19:53, 32.98s/it]training loss: 3.199e-02:   0%|          | 135/300001 [1:15:32<2727:37:01, 32.75s/it]training loss: 3.199e-02:   0%|          | 136/300001 [1:16:06<2740:27:22, 32.90s/it]training loss: 3.199e-02:   0%|          | 137/300001 [1:16:39<2740:54:42, 32.91s/it]training loss: 3.199e-02:   0%|          | 138/300001 [1:17:11<2735:56:51, 32.85s/it]training loss: 3.199e-02:   0%|          | 139/300001 [1:17:44<2745:17:04, 32.96s/it]training loss: 3.199e-02:   0%|          | 140/300001 [1:18:17<2739:32:10, 32.89s/it]training loss: 2.469e-02:   0%|          | 140/300001 [1:18:50<2739:32:10, 32.89s/it]training loss: 2.469e-02:   0%|          | 141/300001 [1:18:50<2726:08:18, 32.73s/it]training loss: 2.469e-02:   0%|          | 142/300001 [1:19:23<2742:35:57, 32.93s/it]training loss: 2.469e-02:   0%|          | 143/300001 [1:19:55<2730:34:20, 32.78s/it]training loss: 2.469e-02:   0%|          | 144/300001 [1:20:28<2737:45:47, 32.87s/it]training loss: 2.469e-02:   0%|          | 145/300001 [1:21:02<2743:37:28, 32.94s/it]training loss: 2.469e-02:   0%|          | 146/300001 [1:21:35<2744:42:20, 32.95s/it]training loss: 2.469e-02:   0%|          | 147/300001 [1:22:07<2729:32:02, 32.77s/it]training loss: 2.469e-02:   0%|          | 148/300001 [1:22:39<2718:38:01, 32.64s/it]training loss: 2.469e-02:   0%|          | 149/300001 [1:23:11<2695:53:11, 32.37s/it]training loss: 2.469e-02:   0%|          | 150/300001 [1:23:44<2715:21:50, 32.60s/it]training loss: 2.469e-02:   0%|          | 151/300001 [1:24:17<2717:41:04, 32.63s/it]training loss: 2.469e-02:   0%|          | 152/300001 [1:24:50<2721:59:47, 32.68s/it]training loss: 2.469e-02:   0%|          | 153/300001 [1:25:23<2740:22:04, 32.90s/it]training loss: 2.469e-02:   0%|          | 154/300001 [1:25:55<2719:39:54, 32.65s/it]training loss: 2.469e-02:   0%|          | 155/300001 [1:26:28<2725:20:47, 32.72s/it]training loss: 2.469e-02:   0%|          | 156/300001 [1:27:01<2732:18:22, 32.80s/it]training loss: 2.469e-02:   0%|          | 157/300001 [1:27:25<2518:12:09, 30.23s/it]training loss: 2.469e-02:   0%|          | 158/300001 [1:27:56<2542:30:22, 30.53s/it]training loss: 2.469e-02:   0%|          | 159/300001 [1:28:28<2564:14:38, 30.79s/it]training loss: 2.469e-02:   0%|          | 160/300001 [1:28:59<2584:23:53, 31.03s/it]training loss: 2.083e-02:   0%|          | 160/300001 [1:29:31<2584:23:53, 31.03s/it]training loss: 2.083e-02:   0%|          | 161/300001 [1:29:31<2597:33:40, 31.19s/it]training loss: 2.083e-02:   0%|          | 162/300001 [1:30:03<2621:20:25, 31.47s/it]training loss: 2.083e-02:   0%|          | 163/300001 [1:30:34<2605:49:26, 31.29s/it]training loss: 2.083e-02:   0%|          | 164/300001 [1:31:05<2608:25:17, 31.32s/it]training loss: 2.083e-02:   0%|          | 165/300001 [1:31:37<2621:34:00, 31.48s/it]training loss: 2.083e-02:   0%|          | 166/300001 [1:32:08<2614:02:09, 31.39s/it]training loss: 2.083e-02:   0%|          | 167/300001 [1:32:40<2622:17:36, 31.48s/it]training loss: 2.083e-02:   0%|          | 168/300001 [1:33:11<2598:24:36, 31.20s/it]training loss: 2.083e-02:   0%|          | 169/300001 [1:33:42<2600:09:10, 31.22s/it]training loss: 2.083e-02:   0%|          | 170/300001 [1:34:14<2616:49:55, 31.42s/it]training loss: 2.083e-02:   0%|          | 171/300001 [1:34:46<2642:35:18, 31.73s/it]training loss: 2.083e-02:   0%|          | 172/300001 [1:35:18<2632:05:24, 31.60s/it]training loss: 2.083e-02:   0%|          | 173/300001 [1:35:48<2613:02:02, 31.37s/it]training loss: 2.083e-02:   0%|          | 174/300001 [1:36:20<2617:30:01, 31.43s/it]training loss: 2.083e-02:   0%|          | 175/300001 [1:36:51<2602:53:25, 31.25s/it]training loss: 2.083e-02:   0%|          | 176/300001 [1:37:23<2638:18:49, 31.68s/it]training loss: 2.083e-02:   0%|          | 177/300001 [1:37:56<2656:34:34, 31.90s/it]training loss: 2.083e-02:   0%|          | 178/300001 [1:38:27<2644:11:31, 31.75s/it]training loss: 2.083e-02:   0%|          | 179/300001 [1:38:58<2623:24:27, 31.50s/it]training loss: 2.083e-02:   0%|          | 180/300001 [1:39:29<2609:47:31, 31.34s/it]training loss: 1.744e-02:   0%|          | 180/300001 [1:40:01<2609:47:31, 31.34s/it]training loss: 1.744e-02:   0%|          | 181/300001 [1:40:02<2636:32:25, 31.66s/it]training loss: 1.744e-02:   0%|          | 182/300001 [1:40:35<2688:44:42, 32.28s/it]training loss: 1.744e-02:   0%|          | 183/300001 [1:41:07<2679:13:26, 32.17s/it]training loss: 1.744e-02:   0%|          | 184/300001 [1:41:39<2658:54:37, 31.93s/it]training loss: 1.744e-02:   0%|          | 185/300001 [1:42:09<2634:08:43, 31.63s/it]training loss: 1.744e-02:   0%|          | 186/300001 [1:42:41<2630:49:35, 31.59s/it]training loss: 1.744e-02:   0%|          | 187/300001 [1:43:13<2639:22:26, 31.69s/it]training loss: 1.744e-02:   0%|          | 188/300001 [1:43:44<2631:35:31, 31.60s/it]training loss: 1.744e-02:   0%|          | 189/300001 [1:44:16<2636:31:08, 31.66s/it]training loss: 1.744e-02:   0%|          | 190/300001 [1:44:48<2638:30:15, 31.68s/it]training loss: 1.744e-02:   0%|          | 191/300001 [1:45:19<2633:41:22, 31.62s/it]training loss: 1.744e-02:   0%|          | 192/300001 [1:45:49<2597:15:51, 31.19s/it]training loss: 1.744e-02:   0%|          | 193/300001 [1:46:22<2620:41:53, 31.47s/it]training loss: 1.744e-02:   0%|          | 194/300001 [1:46:53<2620:55:42, 31.47s/it]training loss: 1.744e-02:   0%|          | 195/300001 [1:47:26<2662:25:36, 31.97s/it]training loss: 1.744e-02:   0%|          | 196/300001 [1:47:58<2655:49:36, 31.89s/it]training loss: 1.744e-02:   0%|          | 197/300001 [1:48:29<2638:37:46, 31.68s/it]training loss: 1.744e-02:   0%|          | 198/300001 [1:49:00<2626:25:16, 31.54s/it]training loss: 1.744e-02:   0%|          | 199/300001 [1:49:32<2618:55:53, 31.45s/it]training loss: 1.744e-02:   0%|          | 200/300001 [1:50:03<2621:28:14, 31.48s/it]training loss: 2.077e-02:   0%|          | 200/300001 [1:50:35<2621:28:14, 31.48s/it]training loss: 2.077e-02:   0%|          | 201/300001 [1:50:35<2624:44:21, 31.52s/it]training loss: 2.077e-02:   0%|          | 202/300001 [1:51:06<2617:36:56, 31.43s/it]training loss: 2.077e-02:   0%|          | 203/300001 [1:51:37<2608:02:36, 31.32s/it]training loss: 2.077e-02:   0%|          | 204/300001 [1:52:09<2621:29:14, 31.48s/it]training loss: 2.077e-02:   0%|          | 205/300001 [1:52:41<2640:35:16, 31.71s/it]training loss: 2.077e-02:   0%|          | 206/300001 [1:53:12<2619:31:04, 31.46s/it]training loss: 2.077e-02:   0%|          | 207/300001 [1:53:43<2597:37:43, 31.19s/it]training loss: 2.077e-02:   0%|          | 208/300001 [1:54:14<2614:22:44, 31.39s/it]training loss: 2.077e-02:   0%|          | 209/300001 [1:54:46<2630:58:20, 31.59s/it]training loss: 2.077e-02:   0%|          | 210/300001 [1:55:18<2619:11:53, 31.45s/it]training loss: 2.077e-02:   0%|          | 211/300001 [1:55:49<2612:41:21, 31.37s/it]training loss: 2.077e-02:   0%|          | 212/300001 [1:56:20<2617:17:09, 31.43s/it]training loss: 2.077e-02:   0%|          | 213/300001 [1:56:52<2621:39:53, 31.48s/it]training loss: 2.077e-02:   0%|          | 214/300001 [1:57:24<2623:37:43, 31.51s/it]training loss: 2.077e-02:   0%|          | 215/300001 [1:57:54<2605:23:18, 31.29s/it]training loss: 2.077e-02:   0%|          | 216/300001 [1:58:26<2623:50:56, 31.51s/it]training loss: 2.077e-02:   0%|          | 217/300001 [1:58:58<2637:12:36, 31.67s/it]training loss: 2.077e-02:   0%|          | 218/300001 [1:59:29<2606:26:29, 31.30s/it]training loss: 2.077e-02:   0%|          | 219/300001 [2:00:01<2620:02:26, 31.46s/it]training loss: 2.077e-02:   0%|          | 220/300001 [2:00:32<2618:42:54, 31.45s/it]training loss: 1.572e-02:   0%|          | 220/300001 [2:01:04<2618:42:54, 31.45s/it]training loss: 1.572e-02:   0%|          | 221/300001 [2:01:04<2632:29:36, 31.61s/it]training loss: 1.572e-02:   0%|          | 222/300001 [2:01:35<2618:02:28, 31.44s/it]training loss: 1.572e-02:   0%|          | 223/300001 [2:02:06<2597:27:32, 31.19s/it]training loss: 1.572e-02:   0%|          | 224/300001 [2:02:38<2627:29:00, 31.55s/it]training loss: 1.572e-02:   0%|          | 225/300001 [2:03:09<2617:18:03, 31.43s/it]training loss: 1.572e-02:   0%|          | 226/300001 [2:03:41<2627:37:00, 31.56s/it]training loss: 1.572e-02:   0%|          | 227/300001 [2:04:14<2649:48:44, 31.82s/it]training loss: 1.572e-02:   0%|          | 228/300001 [2:04:46<2673:02:20, 32.10s/it]training loss: 1.572e-02:   0%|          | 229/300001 [2:05:17<2650:46:04, 31.83s/it]training loss: 1.572e-02:   0%|          | 230/300001 [2:05:48<2627:12:49, 31.55s/it]training loss: 1.572e-02:   0%|          | 231/300001 [2:06:19<2603:12:29, 31.26s/it]training loss: 1.572e-02:   0%|          | 232/300001 [2:06:50<2607:02:36, 31.31s/it]training loss: 1.572e-02:   0%|          | 233/300001 [2:07:22<2609:26:52, 31.34s/it]training loss: 1.572e-02:   0%|          | 234/300001 [2:07:54<2624:59:40, 31.52s/it]training loss: 1.572e-02:   0%|          | 235/300001 [2:08:26<2646:47:54, 31.79s/it]training loss: 1.572e-02:   0%|          | 236/300001 [2:08:57<2626:48:56, 31.55s/it]training loss: 1.572e-02:   0%|          | 237/300001 [2:09:29<2626:41:25, 31.55s/it]training loss: 1.572e-02:   0%|          | 238/300001 [2:10:00<2625:52:19, 31.54s/it]training loss: 1.572e-02:   0%|          | 239/300001 [2:10:31<2609:31:30, 31.34s/it]training loss: 1.572e-02:   0%|          | 240/300001 [2:11:03<2620:29:29, 31.47s/it]training loss: 1.589e-02:   0%|          | 240/300001 [2:11:35<2620:29:29, 31.47s/it]training loss: 1.589e-02:   0%|          | 241/300001 [2:11:35<2632:16:29, 31.61s/it]training loss: 1.589e-02:   0%|          | 242/300001 [2:12:07<2648:57:55, 31.81s/it]training loss: 1.589e-02:   0%|          | 243/300001 [2:12:39<2649:28:13, 31.82s/it]training loss: 1.589e-02:   0%|          | 244/300001 [2:13:11<2644:32:46, 31.76s/it]training loss: 1.589e-02:   0%|          | 245/300001 [2:13:42<2636:12:46, 31.66s/it]training loss: 1.589e-02:   0%|          | 246/300001 [2:14:14<2655:27:02, 31.89s/it]training loss: 1.589e-02:   0%|          | 247/300001 [2:14:47<2673:50:51, 32.11s/it]training loss: 1.589e-02:   0%|          | 248/300001 [2:15:19<2662:07:03, 31.97s/it]training loss: 1.589e-02:   0%|          | 249/300001 [2:15:50<2655:00:17, 31.89s/it]training loss: 1.589e-02:   0%|          | 250/300001 [2:16:23<2669:55:36, 32.07s/it]training loss: 1.589e-02:   0%|          | 251/300001 [2:16:55<2668:08:27, 32.04s/it]training loss: 1.589e-02:   0%|          | 252/300001 [2:17:27<2667:17:37, 32.03s/it]training loss: 1.589e-02:   0%|          | 253/300001 [2:17:59<2675:40:29, 32.14s/it]training loss: 1.589e-02:   0%|          | 254/300001 [2:18:31<2667:40:32, 32.04s/it]training loss: 1.589e-02:   0%|          | 255/300001 [2:19:02<2647:47:57, 31.80s/it]training loss: 1.589e-02:   0%|          | 256/300001 [2:19:34<2653:25:35, 31.87s/it]training loss: 1.589e-02:   0%|          | 257/300001 [2:20:07<2665:31:58, 32.01s/it]training loss: 1.589e-02:   0%|          | 258/300001 [2:20:38<2652:06:05, 31.85s/it]training loss: 1.589e-02:   0%|          | 259/300001 [2:21:10<2642:04:41, 31.73s/it]training loss: 1.589e-02:   0%|          | 260/300001 [2:21:42<2647:55:38, 31.80s/it]training loss: 1.375e-02:   0%|          | 260/300001 [2:22:13<2647:55:38, 31.80s/it]training loss: 1.375e-02:   0%|          | 261/300001 [2:22:13<2632:52:27, 31.62s/it]training loss: 1.375e-02:   0%|          | 262/300001 [2:22:45<2641:30:18, 31.73s/it]training loss: 1.375e-02:   0%|          | 263/300001 [2:23:16<2641:21:03, 31.72s/it]training loss: 1.375e-02:   0%|          | 264/300001 [2:23:48<2642:42:13, 31.74s/it]training loss: 1.375e-02:   0%|          | 265/300001 [2:24:20<2654:45:01, 31.89s/it]training loss: 1.375e-02:   0%|          | 266/300001 [2:24:53<2673:21:23, 32.11s/it]training loss: 1.375e-02:   0%|          | 267/300001 [2:25:25<2670:21:49, 32.07s/it]training loss: 1.375e-02:   0%|          | 268/300001 [2:25:56<2641:35:59, 31.73s/it]training loss: 1.375e-02:   0%|          | 269/300001 [2:26:28<2640:26:32, 31.71s/it]training loss: 1.375e-02:   0%|          | 270/300001 [2:26:59<2634:58:30, 31.65s/it]training loss: 1.375e-02:   0%|          | 271/300001 [2:27:31<2633:37:24, 31.63s/it]training loss: 1.375e-02:   0%|          | 272/300001 [2:28:03<2658:09:58, 31.93s/it]training loss: 1.375e-02:   0%|          | 273/300001 [2:28:35<2659:31:39, 31.94s/it]training loss: 1.375e-02:   0%|          | 274/300001 [2:29:08<2670:21:28, 32.07s/it]training loss: 1.375e-02:   0%|          | 275/300001 [2:29:40<2666:41:33, 32.03s/it]training loss: 1.375e-02:   0%|          | 276/300001 [2:30:12<2681:25:12, 32.21s/it]training loss: 1.375e-02:   0%|          | 277/300001 [2:30:44<2671:52:40, 32.09s/it]training loss: 1.375e-02:   0%|          | 278/300001 [2:31:15<2650:35:39, 31.84s/it]training loss: 1.375e-02:   0%|          | 279/300001 [2:31:48<2680:28:20, 32.20s/it]training loss: 1.375e-02:   0%|          | 280/300001 [2:32:21<2703:19:10, 32.47s/it]training loss: 1.149e-02:   0%|          | 280/300001 [2:32:53<2703:19:10, 32.47s/it]training loss: 1.149e-02:   0%|          | 281/300001 [2:32:53<2690:07:23, 32.31s/it]training loss: 1.149e-02:   0%|          | 282/300001 [2:33:25<2667:55:33, 32.05s/it]training loss: 1.149e-02:   0%|          | 283/300001 [2:33:56<2646:01:01, 31.78s/it]training loss: 1.149e-02:   0%|          | 284/300001 [2:34:26<2609:03:23, 31.34s/it]training loss: 1.149e-02:   0%|          | 285/300001 [2:34:58<2617:48:41, 31.44s/it]training loss: 1.149e-02:   0%|          | 286/300001 [2:35:29<2603:26:29, 31.27s/it]training loss: 1.149e-02:   0%|          | 287/300001 [2:36:00<2608:59:45, 31.34s/it]training loss: 1.149e-02:   0%|          | 288/300001 [2:36:32<2605:18:00, 31.29s/it]training loss: 1.149e-02:   0%|          | 289/300001 [2:37:03<2620:32:44, 31.48s/it]training loss: 1.149e-02:   0%|          | 290/300001 [2:37:35<2627:04:10, 31.56s/it]training loss: 1.149e-02:   0%|          | 291/300001 [2:38:07<2629:20:08, 31.58s/it]training loss: 1.149e-02:   0%|          | 292/300001 [2:38:39<2633:47:45, 31.64s/it]training loss: 1.149e-02:   0%|          | 293/300001 [2:39:10<2633:43:40, 31.64s/it]training loss: 1.149e-02:   0%|          | 294/300001 [2:39:42<2627:09:15, 31.56s/it]training loss: 1.149e-02:   0%|          | 295/300001 [2:40:13<2627:54:03, 31.57s/it]training loss: 1.149e-02:   0%|          | 296/300001 [2:40:44<2607:16:25, 31.32s/it]training loss: 1.149e-02:   0%|          | 297/300001 [2:41:15<2603:43:42, 31.28s/it]training loss: 1.149e-02:   0%|          | 298/300001 [2:41:45<2576:28:34, 30.95s/it]training loss: 1.149e-02:   0%|          | 299/300001 [2:42:16<2570:26:54, 30.88s/it]training loss: 1.149e-02:   0%|          | 300/300001 [2:42:48<2602:51:40, 31.27s/it]training loss: 1.128e-02:   0%|          | 300/300001 [2:43:19<2602:51:40, 31.27s/it]training loss: 1.128e-02:   0%|          | 301/300001 [2:43:19<2602:15:27, 31.26s/it]training loss: 1.128e-02:   0%|          | 302/300001 [2:43:50<2593:20:13, 31.15s/it]training loss: 1.128e-02:   0%|          | 303/300001 [2:44:23<2626:57:42, 31.56s/it]training loss: 1.128e-02:   0%|          | 304/300001 [2:44:55<2645:43:58, 31.78s/it]training loss: 1.128e-02:   0%|          | 305/300001 [2:45:27<2643:28:40, 31.75s/it]training loss: 1.128e-02:   0%|          | 306/300001 [2:45:59<2644:00:35, 31.76s/it]training loss: 1.128e-02:   0%|          | 307/300001 [2:46:31<2657:03:02, 31.92s/it]training loss: 1.128e-02:   0%|          | 308/300001 [2:47:02<2628:52:47, 31.58s/it]training loss: 1.128e-02:   0%|          | 309/300001 [2:47:35<2662:25:24, 31.98s/it]training loss: 1.128e-02:   0%|          | 310/300001 [2:48:06<2651:33:06, 31.85s/it]training loss: 1.128e-02:   0%|          | 311/300001 [2:48:37<2635:23:32, 31.66s/it]training loss: 1.128e-02:   0%|          | 312/300001 [2:49:09<2640:31:22, 31.72s/it]training loss: 1.128e-02:   0%|          | 313/300001 [2:49:40<2627:34:18, 31.56s/it]training loss: 1.128e-02:   0%|          | 314/300001 [2:50:03<2398:39:51, 28.81s/it]training loss: 1.128e-02:   0%|          | 315/300001 [2:50:34<2468:07:51, 29.65s/it]training loss: 1.128e-02:   0%|          | 316/300001 [2:51:06<2517:48:59, 30.25s/it]training loss: 1.128e-02:   0%|          | 317/300001 [2:51:37<2545:41:45, 30.58s/it]training loss: 1.128e-02:   0%|          | 318/300001 [2:52:09<2568:12:26, 30.85s/it]training loss: 1.128e-02:   0%|          | 319/300001 [2:52:40<2575:20:37, 30.94s/it]training loss: 1.128e-02:   0%|          | 320/300001 [2:53:12<2596:03:41, 31.19s/it]training loss: 1.060e-02:   0%|          | 320/300001 [2:53:43<2596:03:41, 31.19s/it]training loss: 1.060e-02:   0%|          | 321/300001 [2:53:43<2604:37:02, 31.29s/it]training loss: 1.060e-02:   0%|          | 322/300001 [2:54:15<2613:45:45, 31.40s/it]training loss: 1.060e-02:   0%|          | 323/300001 [2:54:46<2609:31:20, 31.35s/it]training loss: 1.060e-02:   0%|          | 324/300001 [2:55:18<2618:23:58, 31.45s/it]training loss: 1.060e-02:   0%|          | 325/300001 [2:55:50<2625:24:31, 31.54s/it]training loss: 1.060e-02:   0%|          | 326/300001 [2:56:21<2629:27:06, 31.59s/it]training loss: 1.060e-02:   0%|          | 327/300001 [2:56:54<2645:51:26, 31.78s/it]training loss: 1.060e-02:   0%|          | 328/300001 [2:57:25<2625:17:45, 31.54s/it]training loss: 1.060e-02:   0%|          | 329/300001 [2:57:56<2618:01:59, 31.45s/it]training loss: 1.060e-02:   0%|          | 330/300001 [2:58:28<2636:50:20, 31.68s/it]training loss: 1.060e-02:   0%|          | 331/300001 [2:59:00<2636:21:37, 31.67s/it]training loss: 1.060e-02:   0%|          | 332/300001 [2:59:31<2628:48:38, 31.58s/it]training loss: 1.060e-02:   0%|          | 333/300001 [3:00:03<2637:07:50, 31.68s/it]training loss: 1.060e-02:   0%|          | 334/300001 [3:00:34<2619:34:21, 31.47s/it]training loss: 1.060e-02:   0%|          | 335/300001 [3:01:05<2602:47:06, 31.27s/it]training loss: 1.060e-02:   0%|          | 336/300001 [3:01:36<2614:47:32, 31.41s/it]training loss: 1.060e-02:   0%|          | 337/300001 [3:02:08<2622:46:13, 31.51s/it]training loss: 1.060e-02:   0%|          | 338/300001 [3:02:39<2603:33:51, 31.28s/it]training loss: 1.060e-02:   0%|          | 339/300001 [3:03:11<2617:42:46, 31.45s/it]training loss: 1.060e-02:   0%|          | 340/300001 [3:03:43<2630:30:56, 31.60s/it]training loss: 1.229e-02:   0%|          | 340/300001 [3:04:15<2630:30:56, 31.60s/it]training loss: 1.229e-02:   0%|          | 341/300001 [3:04:15<2646:17:32, 31.79s/it]training loss: 1.229e-02:   0%|          | 342/300001 [3:04:47<2648:06:37, 31.81s/it]training loss: 1.229e-02:   0%|          | 343/300001 [3:05:18<2643:09:13, 31.75s/it]training loss: 1.229e-02:   0%|          | 344/300001 [3:05:50<2631:19:15, 31.61s/it]training loss: 1.229e-02:   0%|          | 345/300001 [3:06:21<2620:09:40, 31.48s/it]training loss: 1.229e-02:   0%|          | 346/300001 [3:06:53<2627:42:54, 31.57s/it]training loss: 1.229e-02:   0%|          | 347/300001 [3:07:23<2608:19:13, 31.34s/it]training loss: 1.229e-02:   0%|          | 348/300001 [3:07:54<2597:00:01, 31.20s/it]training loss: 1.229e-02:   0%|          | 349/300001 [3:08:27<2636:16:25, 31.67s/it]training loss: 1.229e-02:   0%|          | 350/300001 [3:08:59<2628:52:43, 31.58s/it]training loss: 1.229e-02:   0%|          | 351/300001 [3:09:30<2617:49:00, 31.45s/it]training loss: 1.229e-02:   0%|          | 352/300001 [3:10:02<2646:12:33, 31.79s/it]training loss: 1.229e-02:   0%|          | 353/300001 [3:10:33<2622:07:09, 31.50s/it]training loss: 1.229e-02:   0%|          | 354/300001 [3:11:03<2588:45:23, 31.10s/it]training loss: 1.229e-02:   0%|          | 355/300001 [3:11:34<2589:26:20, 31.11s/it]training loss: 1.229e-02:   0%|          | 356/300001 [3:12:06<2607:24:35, 31.33s/it]training loss: 1.229e-02:   0%|          | 357/300001 [3:12:38<2627:50:12, 31.57s/it]training loss: 1.229e-02:   0%|          | 358/300001 [3:13:10<2637:23:15, 31.69s/it]training loss: 1.229e-02:   0%|          | 359/300001 [3:13:41<2614:21:44, 31.41s/it]training loss: 1.229e-02:   0%|          | 360/300001 [3:14:12<2602:44:04, 31.27s/it]training loss: 1.166e-02:   0%|          | 360/300001 [3:14:44<2602:44:04, 31.27s/it]training loss: 1.166e-02:   0%|          | 361/300001 [3:14:44<2627:39:00, 31.57s/it]training loss: 1.166e-02:   0%|          | 362/300001 [3:15:16<2623:30:40, 31.52s/it]training loss: 1.166e-02:   0%|          | 363/300001 [3:15:47<2610:24:46, 31.36s/it]training loss: 1.166e-02:   0%|          | 364/300001 [3:16:19<2627:24:10, 31.57s/it]training loss: 1.166e-02:   0%|          | 365/300001 [3:16:51<2638:20:18, 31.70s/it]training loss: 1.166e-02:   0%|          | 366/300001 [3:17:22<2639:38:42, 31.71s/it]training loss: 1.166e-02:   0%|          | 367/300001 [3:17:54<2647:29:44, 31.81s/it]training loss: 1.166e-02:   0%|          | 368/300001 [3:18:27<2662:05:48, 31.98s/it]training loss: 1.166e-02:   0%|          | 369/300001 [3:18:59<2660:48:33, 31.97s/it]training loss: 1.166e-02:   0%|          | 370/300001 [3:19:31<2667:53:46, 32.05s/it]training loss: 1.166e-02:   0%|          | 371/300001 [3:20:04<2693:12:24, 32.36s/it]training loss: 1.166e-02:   0%|          | 372/300001 [3:20:36<2678:24:30, 32.18s/it]training loss: 1.166e-02:   0%|          | 373/300001 [3:21:07<2658:49:33, 31.95s/it]training loss: 1.166e-02:   0%|          | 374/300001 [3:21:39<2643:26:44, 31.76s/it]training loss: 1.166e-02:   0%|          | 375/300001 [3:22:10<2640:17:00, 31.72s/it]training loss: 1.166e-02:   0%|          | 376/300001 [3:22:41<2616:54:51, 31.44s/it]training loss: 1.166e-02:   0%|          | 377/300001 [3:23:13<2624:08:29, 31.53s/it]training loss: 1.166e-02:   0%|          | 378/300001 [3:23:45<2646:52:12, 31.80s/it]training loss: 1.166e-02:   0%|          | 379/300001 [3:24:17<2639:29:01, 31.71s/it]training loss: 1.166e-02:   0%|          | 380/300001 [3:24:49<2640:51:47, 31.73s/it]training loss: 1.080e-02:   0%|          | 380/300001 [3:25:20<2640:51:47, 31.73s/it]training loss: 1.080e-02:   0%|          | 381/300001 [3:25:21<2648:12:14, 31.82s/it]training loss: 1.080e-02:   0%|          | 382/300001 [3:25:52<2644:25:12, 31.77s/it]training loss: 1.080e-02:   0%|          | 383/300001 [3:26:24<2657:13:09, 31.93s/it]training loss: 1.080e-02:   0%|          | 384/300001 [3:26:55<2619:34:10, 31.48s/it]training loss: 1.080e-02:   0%|          | 385/300001 [3:27:26<2615:54:52, 31.43s/it]training loss: 1.080e-02:   0%|          | 386/300001 [3:27:59<2658:46:32, 31.95s/it]training loss: 1.080e-02:   0%|          | 387/300001 [3:28:31<2661:47:34, 31.98s/it]training loss: 1.080e-02:   0%|          | 388/300001 [3:29:03<2653:25:54, 31.88s/it]training loss: 1.080e-02:   0%|          | 389/300001 [3:29:35<2659:17:27, 31.95s/it]training loss: 1.080e-02:   0%|          | 390/300001 [3:30:06<2628:16:23, 31.58s/it]training loss: 1.080e-02:   0%|          | 391/300001 [3:30:38<2632:12:29, 31.63s/it]training loss: 1.080e-02:   0%|          | 392/300001 [3:31:09<2630:25:10, 31.61s/it]training loss: 1.080e-02:   0%|          | 393/300001 [3:31:40<2621:15:07, 31.50s/it]training loss: 1.080e-02:   0%|          | 394/300001 [3:32:13<2637:48:13, 31.70s/it]training loss: 1.080e-02:   0%|          | 395/300001 [3:32:44<2640:45:03, 31.73s/it]training loss: 1.080e-02:   0%|          | 396/300001 [3:33:17<2658:06:04, 31.94s/it]training loss: 1.080e-02:   0%|          | 397/300001 [3:33:48<2644:03:46, 31.77s/it]training loss: 1.080e-02:   0%|          | 398/300001 [3:34:20<2645:57:55, 31.79s/it]training loss: 1.080e-02:   0%|          | 399/300001 [3:34:51<2626:01:00, 31.55s/it]training loss: 1.080e-02:   0%|          | 400/300001 [3:35:23<2644:36:53, 31.78s/it]training loss: 9.901e-03:   0%|          | 400/300001 [3:35:54<2644:36:53, 31.78s/it]training loss: 9.901e-03:   0%|          | 401/300001 [3:35:54<2625:21:52, 31.55s/it]training loss: 9.901e-03:   0%|          | 402/300001 [3:36:26<2620:45:03, 31.49s/it]training loss: 9.901e-03:   0%|          | 403/300001 [3:36:57<2613:49:42, 31.41s/it]training loss: 9.901e-03:   0%|          | 404/300001 [3:37:28<2603:14:33, 31.28s/it]training loss: 9.901e-03:   0%|          | 405/300001 [3:38:00<2619:10:37, 31.47s/it]training loss: 9.901e-03:   0%|          | 406/300001 [3:38:31<2616:41:40, 31.44s/it]training loss: 9.901e-03:   0%|          | 407/300001 [3:39:03<2618:50:30, 31.47s/it]training loss: 9.901e-03:   0%|          | 408/300001 [3:39:35<2625:47:31, 31.55s/it]training loss: 9.901e-03:   0%|          | 409/300001 [3:40:06<2614:38:57, 31.42s/it]training loss: 9.901e-03:   0%|          | 410/300001 [3:40:38<2648:52:45, 31.83s/it]training loss: 9.901e-03:   0%|          | 411/300001 [3:41:11<2663:32:51, 32.01s/it]training loss: 9.901e-03:   0%|          | 412/300001 [3:41:41<2629:02:34, 31.59s/it]training loss: 9.901e-03:   0%|          | 413/300001 [3:42:14<2656:33:01, 31.92s/it]training loss: 9.901e-03:   0%|          | 414/300001 [3:42:46<2644:53:48, 31.78s/it]training loss: 9.901e-03:   0%|          | 415/300001 [3:43:16<2613:26:27, 31.40s/it]training loss: 9.901e-03:   0%|          | 416/300001 [3:43:47<2612:32:32, 31.39s/it]training loss: 9.901e-03:   0%|          | 417/300001 [3:44:20<2652:01:56, 31.87s/it]training loss: 9.901e-03:   0%|          | 418/300001 [3:44:51<2627:37:14, 31.58s/it]training loss: 9.901e-03:   0%|          | 419/300001 [3:45:23<2632:40:17, 31.64s/it]training loss: 9.901e-03:   0%|          | 420/300001 [3:45:55<2645:35:34, 31.79s/it]training loss: 8.819e-03:   0%|          | 420/300001 [3:46:27<2645:35:34, 31.79s/it]training loss: 8.819e-03:   0%|          | 421/300001 [3:46:28<2657:59:06, 31.94s/it]training loss: 8.819e-03:   0%|          | 422/300001 [3:47:00<2659:30:38, 31.96s/it]training loss: 8.819e-03:   0%|          | 423/300001 [3:47:32<2661:04:04, 31.98s/it]training loss: 8.819e-03:   0%|          | 424/300001 [3:48:04<2664:11:40, 32.02s/it]training loss: 8.819e-03:   0%|          | 425/300001 [3:48:35<2650:14:57, 31.85s/it]training loss: 8.819e-03:   0%|          | 426/300001 [3:49:06<2635:46:23, 31.67s/it]training loss: 8.819e-03:   0%|          | 427/300001 [3:49:39<2648:29:17, 31.83s/it]training loss: 8.819e-03:   0%|          | 428/300001 [3:50:12<2689:57:38, 32.33s/it]training loss: 8.819e-03:   0%|          | 429/300001 [3:50:44<2676:38:13, 32.17s/it]training loss: 8.819e-03:   0%|          | 430/300001 [3:51:16<2679:09:47, 32.20s/it]training loss: 8.819e-03:   0%|          | 431/300001 [3:51:48<2659:51:20, 31.96s/it]training loss: 8.819e-03:   0%|          | 432/300001 [3:52:19<2639:37:20, 31.72s/it]training loss: 8.819e-03:   0%|          | 433/300001 [3:52:50<2629:53:27, 31.60s/it]training loss: 8.819e-03:   0%|          | 434/300001 [3:53:21<2622:49:32, 31.52s/it]training loss: 8.819e-03:   0%|          | 435/300001 [3:53:52<2606:42:59, 31.33s/it]training loss: 8.819e-03:   0%|          | 436/300001 [3:54:23<2598:43:32, 31.23s/it]training loss: 8.819e-03:   0%|          | 437/300001 [3:54:56<2625:41:33, 31.55s/it]training loss: 8.819e-03:   0%|          | 438/300001 [3:55:28<2655:36:39, 31.91s/it]training loss: 8.819e-03:   0%|          | 439/300001 [3:56:00<2639:48:02, 31.72s/it]training loss: 8.819e-03:   0%|          | 440/300001 [3:56:32<2651:10:28, 31.86s/it]training loss: 8.693e-03:   0%|          | 440/300001 [3:57:04<2651:10:28, 31.86s/it]training loss: 8.693e-03:   0%|          | 441/300001 [3:57:04<2671:31:53, 32.11s/it]training loss: 8.693e-03:   0%|          | 442/300001 [3:57:36<2647:39:08, 31.82s/it]training loss: 8.693e-03:   0%|          | 443/300001 [3:58:08<2672:47:12, 32.12s/it]training loss: 8.693e-03:   0%|          | 444/300001 [3:58:40<2648:43:58, 31.83s/it]training loss: 8.693e-03:   0%|          | 445/300001 [3:59:10<2614:33:33, 31.42s/it]training loss: 8.693e-03:   0%|          | 446/300001 [3:59:42<2621:45:14, 31.51s/it]training loss: 8.693e-03:   0%|          | 447/300001 [4:00:13<2608:48:42, 31.35s/it]training loss: 8.693e-03:   0%|          | 448/300001 [4:00:45<2635:29:32, 31.67s/it]training loss: 8.693e-03:   0%|          | 449/300001 [4:01:17<2629:26:54, 31.60s/it]training loss: 8.693e-03:   0%|          | 450/300001 [4:01:48<2621:43:19, 31.51s/it]training loss: 8.693e-03:   0%|          | 451/300001 [4:02:21<2651:05:17, 31.86s/it]training loss: 8.693e-03:   0%|          | 452/300001 [4:02:54<2683:15:20, 32.25s/it]training loss: 8.693e-03:   0%|          | 453/300001 [4:03:26<2674:18:03, 32.14s/it]training loss: 8.693e-03:   0%|          | 454/300001 [4:03:58<2678:33:01, 32.19s/it]training loss: 8.693e-03:   0%|          | 455/300001 [4:04:31<2689:04:50, 32.32s/it]training loss: 8.693e-03:   0%|          | 456/300001 [4:05:02<2678:29:12, 32.19s/it]training loss: 8.693e-03:   0%|          | 457/300001 [4:05:34<2656:26:55, 31.93s/it]training loss: 8.693e-03:   0%|          | 458/300001 [4:06:05<2647:46:18, 31.82s/it]training loss: 8.693e-03:   0%|          | 459/300001 [4:06:36<2618:31:25, 31.47s/it]training loss: 8.693e-03:   0%|          | 460/300001 [4:07:07<2614:32:58, 31.42s/it]training loss: 9.485e-03:   0%|          | 460/300001 [4:07:40<2614:32:58, 31.42s/it]training loss: 9.485e-03:   0%|          | 461/300001 [4:07:40<2639:51:50, 31.73s/it]training loss: 9.485e-03:   0%|          | 462/300001 [4:08:10<2610:14:01, 31.37s/it]training loss: 9.485e-03:   0%|          | 463/300001 [4:08:42<2630:26:38, 31.61s/it]training loss: 9.485e-03:   0%|          | 464/300001 [4:09:15<2657:15:55, 31.94s/it]training loss: 9.485e-03:   0%|          | 465/300001 [4:09:47<2663:45:15, 32.01s/it]training loss: 9.485e-03:   0%|          | 466/300001 [4:10:19<2657:23:12, 31.94s/it]training loss: 9.485e-03:   0%|          | 467/300001 [4:10:50<2634:25:54, 31.66s/it]training loss: 9.485e-03:   0%|          | 468/300001 [4:11:21<2622:15:14, 31.52s/it]training loss: 9.485e-03:   0%|          | 469/300001 [4:11:53<2616:39:13, 31.45s/it]training loss: 9.485e-03:   0%|          | 470/300001 [4:12:24<2621:17:21, 31.50s/it]training loss: 9.485e-03:   0%|          | 471/300001 [4:12:47<2402:34:25, 28.88s/it]training loss: 9.485e-03:   0%|          | 472/300001 [4:13:20<2506:10:44, 30.12s/it]training loss: 9.485e-03:   0%|          | 473/300001 [4:13:52<2547:22:12, 30.62s/it]training loss: 9.485e-03:   0%|          | 474/300001 [4:14:23<2562:45:14, 30.80s/it]training loss: 9.485e-03:   0%|          | 475/300001 [4:14:54<2577:16:09, 30.98s/it]training loss: 9.485e-03:   0%|          | 476/300001 [4:15:26<2595:49:53, 31.20s/it]training loss: 9.485e-03:   0%|          | 477/300001 [4:15:57<2596:43:04, 31.21s/it]training loss: 9.485e-03:   0%|          | 478/300001 [4:16:30<2627:40:15, 31.58s/it]training loss: 9.485e-03:   0%|          | 479/300001 [4:17:03<2666:05:34, 32.04s/it]training loss: 9.485e-03:   0%|          | 480/300001 [4:17:35<2673:34:27, 32.13s/it]training loss: 8.607e-03:   0%|          | 480/300001 [4:18:07<2673:34:27, 32.13s/it]training loss: 8.607e-03:   0%|          | 481/300001 [4:18:07<2655:44:45, 31.92s/it]training loss: 8.607e-03:   0%|          | 482/300001 [4:18:39<2659:02:43, 31.96s/it]training loss: 8.607e-03:   0%|          | 483/300001 [4:19:11<2662:34:28, 32.00s/it]training loss: 8.607e-03:   0%|          | 484/300001 [4:19:43<2668:29:35, 32.07s/it]training loss: 8.607e-03:   0%|          | 485/300001 [4:20:16<2678:00:48, 32.19s/it]training loss: 8.607e-03:   0%|          | 486/300001 [4:20:47<2661:21:10, 31.99s/it]training loss: 8.607e-03:   0%|          | 487/300001 [4:21:19<2650:17:24, 31.86s/it]training loss: 8.607e-03:   0%|          | 488/300001 [4:21:50<2633:13:01, 31.65s/it]training loss: 8.607e-03:   0%|          | 489/300001 [4:22:20<2592:06:17, 31.16s/it]training loss: 8.607e-03:   0%|          | 490/300001 [4:22:52<2627:56:14, 31.59s/it]training loss: 8.607e-03:   0%|          | 491/300001 [4:23:24<2629:46:22, 31.61s/it]training loss: 8.607e-03:   0%|          | 492/300001 [4:23:54<2593:00:04, 31.17s/it]training loss: 8.607e-03:   0%|          | 493/300001 [4:24:25<2588:52:00, 31.12s/it]training loss: 8.607e-03:   0%|          | 494/300001 [4:24:56<2574:23:31, 30.94s/it]training loss: 8.607e-03:   0%|          | 495/300001 [4:25:27<2591:39:51, 31.15s/it]training loss: 8.607e-03:   0%|          | 496/300001 [4:26:00<2620:56:45, 31.50s/it]training loss: 8.607e-03:   0%|          | 497/300001 [4:26:31<2607:34:33, 31.34s/it]training loss: 8.607e-03:   0%|          | 498/300001 [4:27:03<2629:20:16, 31.60s/it]training loss: 8.607e-03:   0%|          | 499/300001 [4:27:34<2609:49:51, 31.37s/it]training loss: 8.607e-03:   0%|          | 500/300001 [4:28:05<2619:05:33, 31.48s/it]training loss: 8.172e-03:   0%|          | 500/300001 [4:28:36<2619:05:33, 31.48s/it]training loss: 8.172e-03:   0%|          | 501/300001 [4:28:39<2678:42:22, 32.20s/it]training loss: 8.172e-03:   0%|          | 502/300001 [4:29:10<2652:14:44, 31.88s/it]training loss: 8.172e-03:   0%|          | 503/300001 [4:29:42<2635:11:50, 31.68s/it]training loss: 8.172e-03:   0%|          | 504/300001 [4:30:14<2659:26:49, 31.97s/it]training loss: 8.172e-03:   0%|          | 505/300001 [4:30:45<2633:36:45, 31.66s/it]training loss: 8.172e-03:   0%|          | 506/300001 [4:31:17<2628:01:26, 31.59s/it]training loss: 8.172e-03:   0%|          | 507/300001 [4:31:48<2618:31:41, 31.48s/it]training loss: 8.172e-03:   0%|          | 508/300001 [4:32:19<2620:46:35, 31.50s/it]training loss: 8.172e-03:   0%|          | 509/300001 [4:32:52<2645:40:29, 31.80s/it]training loss: 8.172e-03:   0%|          | 510/300001 [4:33:23<2618:04:04, 31.47s/it]training loss: 8.172e-03:   0%|          | 511/300001 [4:33:54<2618:25:16, 31.47s/it]training loss: 8.172e-03:   0%|          | 512/300001 [4:34:26<2635:37:35, 31.68s/it]training loss: 8.172e-03:   0%|          | 513/300001 [4:34:57<2623:57:12, 31.54s/it]training loss: 8.172e-03:   0%|          | 514/300001 [4:35:28<2600:28:12, 31.26s/it]training loss: 8.172e-03:   0%|          | 515/300001 [4:36:00<2612:15:10, 31.40s/it]training loss: 8.172e-03:   0%|          | 516/300001 [4:36:32<2628:23:02, 31.59s/it]training loss: 8.172e-03:   0%|          | 517/300001 [4:37:03<2613:13:12, 31.41s/it]training loss: 8.172e-03:   0%|          | 518/300001 [4:37:35<2636:51:49, 31.70s/it]training loss: 8.172e-03:   0%|          | 519/300001 [4:38:07<2646:24:15, 31.81s/it]training loss: 8.172e-03:   0%|          | 520/300001 [4:38:39<2643:23:47, 31.78s/it]training loss: 8.168e-03:   0%|          | 520/300001 [4:39:10<2643:23:47, 31.78s/it]training loss: 8.168e-03:   0%|          | 521/300001 [4:39:10<2632:57:28, 31.65s/it]training loss: 8.168e-03:   0%|          | 522/300001 [4:39:42<2646:05:02, 31.81s/it]training loss: 8.168e-03:   0%|          | 523/300001 [4:40:15<2657:46:44, 31.95s/it]training loss: 8.168e-03:   0%|          | 524/300001 [4:40:47<2667:31:16, 32.07s/it]training loss: 8.168e-03:   0%|          | 525/300001 [4:41:20<2676:39:47, 32.18s/it]training loss: 8.168e-03:   0%|          | 526/300001 [4:41:50<2635:24:18, 31.68s/it]training loss: 8.168e-03:   0%|          | 527/300001 [4:42:22<2630:58:47, 31.63s/it]training loss: 8.168e-03:   0%|          | 528/300001 [4:42:53<2629:21:30, 31.61s/it]training loss: 8.168e-03:   0%|          | 529/300001 [4:43:24<2616:47:01, 31.46s/it]training loss: 8.168e-03:   0%|          | 530/300001 [4:43:56<2612:33:07, 31.41s/it]training loss: 8.168e-03:   0%|          | 531/300001 [4:44:27<2616:41:16, 31.46s/it]training loss: 8.168e-03:   0%|          | 532/300001 [4:44:59<2631:22:21, 31.63s/it]training loss: 8.168e-03:   0%|          | 533/300001 [4:45:30<2620:28:16, 31.50s/it]training loss: 8.168e-03:   0%|          | 534/300001 [4:46:03<2644:51:38, 31.79s/it]training loss: 8.168e-03:   0%|          | 535/300001 [4:46:36<2667:31:11, 32.07s/it]training loss: 8.168e-03:   0%|          | 536/300001 [4:47:06<2630:33:40, 31.62s/it]training loss: 8.168e-03:   0%|          | 537/300001 [4:47:38<2643:03:51, 31.77s/it]training loss: 8.168e-03:   0%|          | 538/300001 [4:48:09<2625:48:23, 31.57s/it]training loss: 8.168e-03:   0%|          | 539/300001 [4:48:41<2618:19:08, 31.48s/it]training loss: 8.168e-03:   0%|          | 540/300001 [4:49:12<2620:44:05, 31.51s/it]training loss: 8.765e-03:   0%|          | 540/300001 [4:49:44<2620:44:05, 31.51s/it]training loss: 8.765e-03:   0%|          | 541/300001 [4:49:44<2629:36:55, 31.61s/it]training loss: 8.765e-03:   0%|          | 542/300001 [4:50:16<2642:29:13, 31.77s/it]training loss: 8.765e-03:   0%|          | 543/300001 [4:50:48<2654:11:24, 31.91s/it]training loss: 8.765e-03:   0%|          | 544/300001 [4:51:21<2660:29:51, 31.98s/it]training loss: 8.765e-03:   0%|          | 545/300001 [4:51:52<2648:46:53, 31.84s/it]training loss: 8.765e-03:   0%|          | 546/300001 [4:52:24<2647:07:46, 31.82s/it]training loss: 8.765e-03:   0%|          | 547/300001 [4:52:56<2655:19:21, 31.92s/it]training loss: 8.765e-03:   0%|          | 548/300001 [4:53:27<2641:08:34, 31.75s/it]training loss: 8.765e-03:   0%|          | 549/300001 [4:53:59<2645:45:06, 31.81s/it]training loss: 8.765e-03:   0%|          | 550/300001 [4:54:31<2642:53:29, 31.77s/it]training loss: 8.765e-03:   0%|          | 551/300001 [4:55:02<2631:26:13, 31.64s/it]training loss: 8.765e-03:   0%|          | 552/300001 [4:55:34<2640:49:42, 31.75s/it]training loss: 8.765e-03:   0%|          | 553/300001 [4:56:07<2667:34:14, 32.07s/it]training loss: 8.765e-03:   0%|          | 554/300001 [4:56:38<2649:34:34, 31.85s/it]training loss: 8.765e-03:   0%|          | 555/300001 [4:57:10<2652:56:10, 31.89s/it]training loss: 8.765e-03:   0%|          | 556/300001 [4:57:42<2641:08:07, 31.75s/it]training loss: 8.765e-03:   0%|          | 557/300001 [4:58:14<2662:52:34, 32.01s/it]training loss: 8.765e-03:   0%|          | 558/300001 [4:58:47<2666:20:22, 32.06s/it]training loss: 8.765e-03:   0%|          | 559/300001 [4:59:18<2655:04:03, 31.92s/it]training loss: 8.765e-03:   0%|          | 560/300001 [4:59:50<2651:09:39, 31.87s/it]training loss: 9.340e-03:   0%|          | 560/300001 [5:00:21<2651:09:39, 31.87s/it]training loss: 9.340e-03:   0%|          | 561/300001 [5:00:21<2636:36:25, 31.70s/it]training loss: 9.340e-03:   0%|          | 562/300001 [5:00:53<2647:57:12, 31.83s/it]training loss: 9.340e-03:   0%|          | 563/300001 [5:01:25<2628:21:30, 31.60s/it]training loss: 9.340e-03:   0%|          | 564/300001 [5:01:56<2625:59:26, 31.57s/it]training loss: 9.340e-03:   0%|          | 565/300001 [5:02:28<2640:29:40, 31.75s/it]training loss: 9.340e-03:   0%|          | 566/300001 [5:03:00<2649:37:50, 31.86s/it]training loss: 9.340e-03:   0%|          | 567/300001 [5:03:32<2653:46:46, 31.91s/it]training loss: 9.340e-03:   0%|          | 568/300001 [5:04:04<2653:27:40, 31.90s/it]training loss: 9.340e-03:   0%|          | 569/300001 [5:04:36<2647:33:31, 31.83s/it]training loss: 9.340e-03:   0%|          | 570/300001 [5:05:06<2603:57:20, 31.31s/it]training loss: 9.340e-03:   0%|          | 571/300001 [5:05:38<2621:53:09, 31.52s/it]training loss: 9.340e-03:   0%|          | 572/300001 [5:06:09<2615:43:04, 31.45s/it]training loss: 9.340e-03:   0%|          | 573/300001 [5:06:42<2638:43:43, 31.73s/it]training loss: 9.340e-03:   0%|          | 574/300001 [5:07:15<2671:05:16, 32.11s/it]training loss: 9.340e-03:   0%|          | 575/300001 [5:07:46<2645:22:08, 31.81s/it]training loss: 9.340e-03:   0%|          | 576/300001 [5:08:18<2655:05:19, 31.92s/it]training loss: 9.340e-03:   0%|          | 577/300001 [5:08:50<2651:31:31, 31.88s/it]training loss: 9.340e-03:   0%|          | 578/300001 [5:09:22<2654:29:08, 31.92s/it]training loss: 9.340e-03:   0%|          | 579/300001 [5:09:54<2660:54:48, 31.99s/it]training loss: 9.340e-03:   0%|          | 580/300001 [5:10:25<2649:59:29, 31.86s/it]training loss: 7.164e-03:   0%|          | 580/300001 [5:10:57<2649:59:29, 31.86s/it]training loss: 7.164e-03:   0%|          | 581/300001 [5:10:57<2638:19:52, 31.72s/it]training loss: 7.164e-03:   0%|          | 582/300001 [5:11:28<2614:07:40, 31.43s/it]training loss: 7.164e-03:   0%|          | 583/300001 [5:11:59<2622:35:55, 31.53s/it]training loss: 7.164e-03:   0%|          | 584/300001 [5:12:30<2599:49:06, 31.26s/it]training loss: 7.164e-03:   0%|          | 585/300001 [5:13:02<2626:17:51, 31.58s/it]training loss: 7.164e-03:   0%|          | 586/300001 [5:13:34<2622:34:22, 31.53s/it]training loss: 7.164e-03:   0%|          | 587/300001 [5:14:05<2625:58:13, 31.57s/it]training loss: 7.164e-03:   0%|          | 588/300001 [5:14:35<2586:48:10, 31.10s/it]training loss: 7.164e-03:   0%|          | 589/300001 [5:15:08<2617:57:56, 31.48s/it]training loss: 7.164e-03:   0%|          | 590/300001 [5:15:38<2585:11:15, 31.08s/it]training loss: 7.164e-03:   0%|          | 591/300001 [5:16:10<2599:11:26, 31.25s/it]training loss: 7.164e-03:   0%|          | 592/300001 [5:16:41<2607:48:59, 31.36s/it]training loss: 7.164e-03:   0%|          | 593/300001 [5:17:13<2623:14:00, 31.54s/it]training loss: 7.164e-03:   0%|          | 594/300001 [5:17:45<2635:36:38, 31.69s/it]training loss: 7.164e-03:   0%|          | 595/300001 [5:18:17<2640:35:45, 31.75s/it]training loss: 7.164e-03:   0%|          | 596/300001 [5:18:49<2645:40:40, 31.81s/it]training loss: 7.164e-03:   0%|          | 597/300001 [5:19:20<2625:19:20, 31.57s/it]training loss: 7.164e-03:   0%|          | 598/300001 [5:19:52<2624:56:58, 31.56s/it]training loss: 7.164e-03:   0%|          | 599/300001 [5:20:24<2654:28:46, 31.92s/it]training loss: 7.164e-03:   0%|          | 600/300001 [5:20:55<2633:14:04, 31.66s/it]training loss: 7.862e-03:   0%|          | 600/300001 [5:21:27<2633:14:04, 31.66s/it]training loss: 7.862e-03:   0%|          | 601/300001 [5:21:27<2637:17:02, 31.71s/it]training loss: 7.862e-03:   0%|          | 602/300001 [5:21:59<2628:08:41, 31.60s/it]training loss: 7.862e-03:   0%|          | 603/300001 [5:22:30<2616:04:53, 31.46s/it]training loss: 7.862e-03:   0%|          | 604/300001 [5:23:03<2668:36:55, 32.09s/it]training loss: 7.862e-03:   0%|          | 605/300001 [5:23:35<2664:29:43, 32.04s/it]training loss: 7.862e-03:   0%|          | 606/300001 [5:24:06<2639:42:23, 31.74s/it]training loss: 7.862e-03:   0%|          | 607/300001 [5:24:38<2652:22:00, 31.89s/it]training loss: 7.862e-03:   0%|          | 608/300001 [5:25:12<2682:30:28, 32.26s/it]training loss: 7.862e-03:   0%|          | 609/300001 [5:25:43<2674:53:28, 32.16s/it]training loss: 7.862e-03:   0%|          | 610/300001 [5:26:16<2678:36:28, 32.21s/it]training loss: 7.862e-03:   0%|          | 611/300001 [5:26:47<2644:30:54, 31.80s/it]training loss: 7.862e-03:   0%|          | 612/300001 [5:27:18<2645:19:25, 31.81s/it]training loss: 7.862e-03:   0%|          | 613/300001 [5:27:50<2649:40:53, 31.86s/it]training loss: 7.862e-03:   0%|          | 614/300001 [5:28:22<2635:27:17, 31.69s/it]training loss: 7.862e-03:   0%|          | 615/300001 [5:28:53<2633:09:24, 31.66s/it]training loss: 7.862e-03:   0%|          | 616/300001 [5:29:26<2661:29:08, 32.00s/it]training loss: 7.862e-03:   0%|          | 617/300001 [5:29:58<2664:27:39, 32.04s/it]training loss: 7.862e-03:   0%|          | 618/300001 [5:30:30<2663:13:55, 32.02s/it]training loss: 7.862e-03:   0%|          | 619/300001 [5:31:02<2657:40:49, 31.96s/it]training loss: 7.862e-03:   0%|          | 620/300001 [5:31:34<2661:38:07, 32.01s/it]training loss: 8.401e-03:   0%|          | 620/300001 [5:32:06<2661:38:07, 32.01s/it]training loss: 8.401e-03:   0%|          | 621/300001 [5:32:06<2648:57:59, 31.85s/it]training loss: 8.401e-03:   0%|          | 622/300001 [5:32:37<2645:17:41, 31.81s/it]training loss: 8.401e-03:   0%|          | 623/300001 [5:33:09<2634:36:09, 31.68s/it]training loss: 8.401e-03:   0%|          | 624/300001 [5:33:40<2616:48:19, 31.47s/it]training loss: 8.401e-03:   0%|          | 625/300001 [5:34:11<2613:11:19, 31.42s/it]training loss: 8.401e-03:   0%|          | 626/300001 [5:34:43<2619:56:38, 31.50s/it]training loss: 8.401e-03:   0%|          | 627/300001 [5:35:14<2615:14:41, 31.45s/it]training loss: 8.401e-03:   0%|          | 628/300001 [5:35:36<2381:28:42, 28.64s/it]training loss: 8.401e-03:   0%|          | 629/300001 [5:36:08<2457:50:02, 29.56s/it]training loss: 8.401e-03:   0%|          | 630/300001 [5:36:40<2528:43:38, 30.41s/it]training loss: 8.401e-03:   0%|          | 631/300001 [5:37:12<2566:57:25, 30.87s/it]training loss: 8.401e-03:   0%|          | 632/300001 [5:37:43<2576:56:35, 30.99s/it]training loss: 8.401e-03:   0%|          | 633/300001 [5:38:16<2618:49:14, 31.49s/it]training loss: 8.401e-03:   0%|          | 634/300001 [5:38:47<2615:26:20, 31.45s/it]training loss: 8.401e-03:   0%|          | 635/300001 [5:39:19<2614:21:28, 31.44s/it]training loss: 8.401e-03:   0%|          | 636/300001 [5:39:50<2601:32:11, 31.28s/it]training loss: 8.401e-03:   0%|          | 637/300001 [5:40:21<2593:20:10, 31.19s/it]training loss: 8.401e-03:   0%|          | 638/300001 [5:40:53<2615:42:09, 31.46s/it]training loss: 8.401e-03:   0%|          | 639/300001 [5:41:23<2590:29:30, 31.15s/it]training loss: 8.401e-03:   0%|          | 640/300001 [5:41:55<2604:38:11, 31.32s/it]training loss: 8.672e-03:   0%|          | 640/300001 [5:42:27<2604:38:11, 31.32s/it]training loss: 8.672e-03:   0%|          | 641/300001 [5:42:27<2612:42:57, 31.42s/it]training loss: 8.672e-03:   0%|          | 642/300001 [5:42:59<2637:53:35, 31.72s/it]training loss: 8.672e-03:   0%|          | 643/300001 [5:43:32<2670:32:57, 32.12s/it]training loss: 8.672e-03:   0%|          | 644/300001 [5:44:03<2649:15:36, 31.86s/it]training loss: 8.672e-03:   0%|          | 645/300001 [5:44:36<2663:09:06, 32.03s/it]training loss: 8.672e-03:   0%|          | 646/300001 [5:45:08<2659:27:12, 31.98s/it]training loss: 8.672e-03:   0%|          | 647/300001 [5:45:38<2621:50:28, 31.53s/it]training loss: 8.672e-03:   0%|          | 648/300001 [5:46:10<2621:38:49, 31.53s/it]training loss: 8.672e-03:   0%|          | 649/300001 [5:46:43<2665:40:07, 32.06s/it]training loss: 8.672e-03:   0%|          | 650/300001 [5:47:15<2670:42:19, 32.12s/it]training loss: 8.672e-03:   0%|          | 651/300001 [5:47:47<2657:30:09, 31.96s/it]training loss: 8.672e-03:   0%|          | 652/300001 [5:48:19<2652:50:53, 31.90s/it]training loss: 8.672e-03:   0%|          | 653/300001 [5:48:52<2698:50:58, 32.46s/it]training loss: 8.672e-03:   0%|          | 654/300001 [5:49:24<2667:12:51, 32.08s/it]training loss: 8.672e-03:   0%|          | 655/300001 [5:49:55<2640:48:40, 31.76s/it]training loss: 8.672e-03:   0%|          | 656/300001 [5:50:27<2656:50:13, 31.95s/it]training loss: 8.672e-03:   0%|          | 657/300001 [5:50:58<2624:19:10, 31.56s/it]training loss: 8.672e-03:   0%|          | 658/300001 [5:51:30<2645:20:24, 31.81s/it]training loss: 8.672e-03:   0%|          | 659/300001 [5:52:02<2652:41:44, 31.90s/it]training loss: 8.672e-03:   0%|          | 660/300001 [5:52:34<2646:39:49, 31.83s/it]training loss: 7.886e-03:   0%|          | 660/300001 [5:53:05<2646:39:49, 31.83s/it]training loss: 7.886e-03:   0%|          | 661/300001 [5:53:06<2645:01:24, 31.81s/it]training loss: 7.886e-03:   0%|          | 662/300001 [5:53:37<2640:20:37, 31.75s/it]training loss: 7.886e-03:   0%|          | 663/300001 [5:54:09<2646:06:25, 31.82s/it]training loss: 7.886e-03:   0%|          | 664/300001 [5:54:40<2631:43:33, 31.65s/it]training loss: 7.886e-03:   0%|          | 665/300001 [5:55:12<2636:12:57, 31.70s/it]training loss: 7.886e-03:   0%|          | 666/300001 [5:55:42<2599:44:02, 31.27s/it]training loss: 7.886e-03:   0%|          | 667/300001 [5:56:14<2614:46:49, 31.45s/it]training loss: 7.886e-03:   0%|          | 668/300001 [5:56:46<2628:21:41, 31.61s/it]training loss: 7.886e-03:   0%|          | 669/300001 [5:57:17<2610:52:54, 31.40s/it]training loss: 7.886e-03:   0%|          | 670/300001 [5:57:49<2625:53:12, 31.58s/it]training loss: 7.886e-03:   0%|          | 671/300001 [5:58:21<2632:56:00, 31.67s/it]training loss: 7.886e-03:   0%|          | 672/300001 [5:58:53<2630:53:52, 31.64s/it]training loss: 7.886e-03:   0%|          | 673/300001 [5:59:24<2626:46:20, 31.59s/it]training loss: 7.886e-03:   0%|          | 674/300001 [5:59:55<2610:55:43, 31.40s/it]training loss: 7.886e-03:   0%|          | 675/300001 [6:00:27<2624:56:41, 31.57s/it]training loss: 7.886e-03:   0%|          | 676/300001 [6:00:59<2623:15:10, 31.55s/it]training loss: 7.886e-03:   0%|          | 677/300001 [6:01:31<2633:19:53, 31.67s/it]training loss: 7.886e-03:   0%|          | 678/300001 [6:02:03<2644:10:37, 31.80s/it]training loss: 7.886e-03:   0%|          | 679/300001 [6:02:35<2663:40:57, 32.04s/it]training loss: 7.886e-03:   0%|          | 680/300001 [6:03:07<2656:31:43, 31.95s/it]training loss: 7.296e-03:   0%|          | 680/300001 [6:03:39<2656:31:43, 31.95s/it]training loss: 7.296e-03:   0%|          | 681/300001 [6:03:39<2653:29:28, 31.91s/it]training loss: 7.296e-03:   0%|          | 682/300001 [6:04:10<2634:27:42, 31.69s/it]training loss: 7.296e-03:   0%|          | 683/300001 [6:04:42<2648:55:39, 31.86s/it]training loss: 7.296e-03:   0%|          | 684/300001 [6:05:15<2669:11:42, 32.10s/it]training loss: 7.296e-03:   0%|          | 685/300001 [6:05:47<2660:38:08, 32.00s/it]training loss: 7.296e-03:   0%|          | 686/300001 [6:06:19<2664:14:28, 32.04s/it]training loss: 7.296e-03:   0%|          | 687/300001 [6:06:51<2661:59:14, 32.02s/it]training loss: 7.296e-03:   0%|          | 688/300001 [6:07:22<2647:11:07, 31.84s/it]training loss: 7.296e-03:   0%|          | 689/300001 [6:07:54<2652:27:48, 31.90s/it]training loss: 7.296e-03:   0%|          | 690/300001 [6:08:26<2645:46:49, 31.82s/it]training loss: 7.296e-03:   0%|          | 691/300001 [6:08:57<2633:50:57, 31.68s/it]training loss: 7.296e-03:   0%|          | 692/300001 [6:09:29<2643:37:47, 31.80s/it]training loss: 7.296e-03:   0%|          | 693/300001 [6:10:02<2657:19:45, 31.96s/it]training loss: 7.296e-03:   0%|          | 694/300001 [6:10:32<2614:24:00, 31.45s/it]training loss: 7.296e-03:   0%|          | 695/300001 [6:11:04<2635:01:59, 31.69s/it]training loss: 7.296e-03:   0%|          | 696/300001 [6:11:37<2663:44:58, 32.04s/it]training loss: 7.296e-03:   0%|          | 697/300001 [6:12:10<2680:21:02, 32.24s/it]training loss: 7.296e-03:   0%|          | 698/300001 [6:12:41<2661:21:17, 32.01s/it]training loss: 7.296e-03:   0%|          | 699/300001 [6:13:14<2674:14:09, 32.17s/it]training loss: 7.296e-03:   0%|          | 700/300001 [6:13:45<2654:25:58, 31.93s/it]training loss: 7.398e-03:   0%|          | 700/300001 [6:14:17<2654:25:58, 31.93s/it]training loss: 7.398e-03:   0%|          | 701/300001 [6:14:17<2653:01:15, 31.91s/it]training loss: 7.398e-03:   0%|          | 702/300001 [6:14:49<2668:06:11, 32.09s/it]training loss: 7.398e-03:   0%|          | 703/300001 [6:15:21<2660:58:51, 32.01s/it]training loss: 7.398e-03:   0%|          | 704/300001 [6:15:53<2648:10:33, 31.85s/it]training loss: 7.398e-03:   0%|          | 705/300001 [6:16:25<2667:41:12, 32.09s/it]training loss: 7.398e-03:   0%|          | 706/300001 [6:16:57<2658:01:25, 31.97s/it]training loss: 7.398e-03:   0%|          | 707/300001 [6:17:29<2665:13:54, 32.06s/it]training loss: 7.398e-03:   0%|          | 708/300001 [6:18:01<2660:28:03, 32.00s/it]training loss: 7.398e-03:   0%|          | 709/300001 [6:18:33<2661:05:57, 32.01s/it]training loss: 7.398e-03:   0%|          | 710/300001 [6:19:05<2655:02:48, 31.94s/it]training loss: 7.398e-03:   0%|          | 711/300001 [6:19:36<2642:51:27, 31.79s/it]training loss: 7.398e-03:   0%|          | 712/300001 [6:20:08<2639:21:24, 31.75s/it]training loss: 7.398e-03:   0%|          | 713/300001 [6:20:39<2627:53:09, 31.61s/it]training loss: 7.398e-03:   0%|          | 714/300001 [6:21:10<2612:35:45, 31.43s/it]training loss: 7.398e-03:   0%|          | 715/300001 [6:21:42<2623:34:09, 31.56s/it]training loss: 7.398e-03:   0%|          | 716/300001 [6:22:14<2640:33:11, 31.76s/it]training loss: 7.398e-03:   0%|          | 717/300001 [6:22:47<2656:07:44, 31.95s/it]training loss: 7.398e-03:   0%|          | 718/300001 [6:23:19<2650:31:59, 31.88s/it]training loss: 7.398e-03:   0%|          | 719/300001 [6:23:50<2635:21:26, 31.70s/it]training loss: 7.398e-03:   0%|          | 720/300001 [6:24:23<2665:37:13, 32.06s/it]training loss: 8.100e-03:   0%|          | 720/300001 [6:24:55<2665:37:13, 32.06s/it]training loss: 8.100e-03:   0%|          | 721/300001 [6:24:55<2675:44:16, 32.19s/it]training loss: 8.100e-03:   0%|          | 722/300001 [6:25:26<2645:47:02, 31.83s/it]training loss: 8.100e-03:   0%|          | 723/300001 [6:25:57<2627:53:52, 31.61s/it]training loss: 8.100e-03:   0%|          | 724/300001 [6:26:29<2638:34:03, 31.74s/it]training loss: 8.100e-03:   0%|          | 725/300001 [6:27:00<2601:46:54, 31.30s/it]training loss: 8.100e-03:   0%|          | 726/300001 [6:27:31<2611:30:03, 31.41s/it]training loss: 8.100e-03:   0%|          | 727/300001 [6:28:03<2628:18:06, 31.62s/it]training loss: 8.100e-03:   0%|          | 728/300001 [6:28:35<2618:23:54, 31.50s/it]training loss: 8.100e-03:   0%|          | 729/300001 [6:29:06<2611:32:43, 31.41s/it]training loss: 8.100e-03:   0%|          | 730/300001 [6:29:37<2603:55:40, 31.32s/it]training loss: 8.100e-03:   0%|          | 731/300001 [6:30:08<2607:43:53, 31.37s/it]training loss: 8.100e-03:   0%|          | 732/300001 [6:30:40<2614:37:56, 31.45s/it]training loss: 8.100e-03:   0%|          | 733/300001 [6:31:11<2602:02:07, 31.30s/it]training loss: 8.100e-03:   0%|          | 734/300001 [6:31:43<2625:04:10, 31.58s/it]training loss: 8.100e-03:   0%|          | 735/300001 [6:32:17<2674:52:20, 32.18s/it]training loss: 8.100e-03:   0%|          | 736/300001 [6:32:49<2678:50:45, 32.23s/it]training loss: 8.100e-03:   0%|          | 737/300001 [6:33:21<2672:24:49, 32.15s/it]training loss: 8.100e-03:   0%|          | 738/300001 [6:33:52<2634:18:36, 31.69s/it]training loss: 8.100e-03:   0%|          | 739/300001 [6:34:25<2660:35:37, 32.01s/it]training loss: 8.100e-03:   0%|          | 740/300001 [6:34:57<2668:19:33, 32.10s/it]training loss: 8.071e-03:   0%|          | 740/300001 [6:35:29<2668:19:33, 32.10s/it]training loss: 8.071e-03:   0%|          | 741/300001 [6:35:30<2682:41:03, 32.27s/it]training loss: 8.071e-03:   0%|          | 742/300001 [6:36:02<2681:20:49, 32.26s/it]training loss: 8.071e-03:   0%|          | 743/300001 [6:36:34<2676:49:14, 32.20s/it]training loss: 8.071e-03:   0%|          | 744/300001 [6:37:04<2633:08:13, 31.68s/it]training loss: 8.071e-03:   0%|          | 745/300001 [6:37:35<2607:40:26, 31.37s/it]training loss: 8.071e-03:   0%|          | 746/300001 [6:38:07<2633:57:47, 31.69s/it]training loss: 8.071e-03:   0%|          | 747/300001 [6:38:38<2610:16:04, 31.40s/it]training loss: 8.071e-03:   0%|          | 748/300001 [6:39:09<2599:25:11, 31.27s/it]training loss: 8.071e-03:   0%|          | 749/300001 [6:39:40<2596:58:43, 31.24s/it]training loss: 8.071e-03:   0%|          | 750/300001 [6:40:11<2593:27:52, 31.20s/it]training loss: 8.071e-03:   0%|          | 751/300001 [6:40:43<2607:51:45, 31.37s/it]training loss: 8.071e-03:   0%|          | 752/300001 [6:41:14<2596:44:29, 31.24s/it]training loss: 8.071e-03:   0%|          | 753/300001 [6:41:44<2573:52:38, 30.96s/it]training loss: 8.071e-03:   0%|          | 754/300001 [6:42:16<2591:17:26, 31.17s/it]training loss: 8.071e-03:   0%|          | 755/300001 [6:42:49<2626:15:37, 31.59s/it]training loss: 8.071e-03:   0%|          | 756/300001 [6:43:21<2642:31:30, 31.79s/it]training loss: 8.071e-03:   0%|          | 757/300001 [6:43:53<2650:03:00, 31.88s/it]training loss: 8.071e-03:   0%|          | 758/300001 [6:44:24<2636:56:38, 31.72s/it]training loss: 8.071e-03:   0%|          | 759/300001 [6:44:56<2635:01:47, 31.70s/it]training loss: 8.071e-03:   0%|          | 760/300001 [6:45:29<2658:32:10, 31.98s/it]training loss: 7.864e-03:   0%|          | 760/300001 [6:46:00<2658:32:10, 31.98s/it]training loss: 7.864e-03:   0%|          | 761/300001 [6:46:00<2643:52:20, 31.81s/it]training loss: 7.864e-03:   0%|          | 762/300001 [6:46:32<2661:31:32, 32.02s/it]training loss: 7.864e-03:   0%|          | 763/300001 [6:47:05<2667:49:46, 32.10s/it]training loss: 7.864e-03:   0%|          | 764/300001 [6:47:37<2679:15:41, 32.23s/it]training loss: 7.864e-03:   0%|          | 765/300001 [6:48:08<2646:30:06, 31.84s/it]training loss: 7.864e-03:   0%|          | 766/300001 [6:48:40<2638:50:26, 31.75s/it]training loss: 7.864e-03:   0%|          | 767/300001 [6:49:11<2634:03:28, 31.69s/it]training loss: 7.864e-03:   0%|          | 768/300001 [6:49:45<2676:52:41, 32.20s/it]training loss: 7.864e-03:   0%|          | 769/300001 [6:50:17<2677:42:10, 32.21s/it]training loss: 7.864e-03:   0%|          | 770/300001 [6:50:48<2649:28:56, 31.88s/it]training loss: 7.864e-03:   0%|          | 771/300001 [6:51:19<2614:51:00, 31.46s/it]training loss: 7.864e-03:   0%|          | 772/300001 [6:51:50<2621:50:28, 31.54s/it]training loss: 7.864e-03:   0%|          | 773/300001 [6:52:21<2607:44:15, 31.37s/it]training loss: 7.864e-03:   0%|          | 774/300001 [6:52:52<2595:10:42, 31.22s/it]training loss: 7.864e-03:   0%|          | 775/300001 [6:53:24<2623:36:11, 31.56s/it]training loss: 7.864e-03:   0%|          | 776/300001 [6:53:57<2636:17:46, 31.72s/it]training loss: 7.864e-03:   0%|          | 777/300001 [6:54:29<2655:27:50, 31.95s/it]training loss: 7.864e-03:   0%|          | 778/300001 [6:55:00<2640:54:39, 31.77s/it]training loss: 7.864e-03:   0%|          | 779/300001 [6:55:31<2610:16:38, 31.40s/it]training loss: 7.864e-03:   0%|          | 780/300001 [6:56:01<2587:45:55, 31.13s/it]training loss: 8.500e-03:   0%|          | 780/300001 [6:56:33<2587:45:55, 31.13s/it]training loss: 8.500e-03:   0%|          | 781/300001 [6:56:33<2609:55:39, 31.40s/it]training loss: 8.500e-03:   0%|          | 782/300001 [6:57:04<2578:21:51, 31.02s/it]training loss: 8.500e-03:   0%|          | 783/300001 [6:57:37<2631:56:39, 31.67s/it]training loss: 8.500e-03:   0%|          | 784/300001 [6:58:08<2617:07:11, 31.49s/it]training loss: 8.500e-03:   0%|          | 785/300001 [6:58:30<2395:09:30, 28.82s/it]training loss: 8.500e-03:   0%|          | 786/300001 [6:59:00<2421:31:12, 29.13s/it]training loss: 8.500e-03:   0%|          | 787/300001 [6:59:33<2501:28:21, 30.10s/it]training loss: 8.500e-03:   0%|          | 788/300001 [7:00:05<2550:50:07, 30.69s/it]training loss: 8.500e-03:   0%|          | 789/300001 [7:00:36<2576:08:46, 31.00s/it]training loss: 8.500e-03:   0%|          | 790/300001 [7:01:08<2587:04:54, 31.13s/it]training loss: 8.500e-03:   0%|          | 791/300001 [7:01:40<2606:59:05, 31.37s/it]training loss: 8.500e-03:   0%|          | 792/300001 [7:02:11<2604:07:28, 31.33s/it]training loss: 8.500e-03:   0%|          | 793/300001 [7:02:43<2615:23:16, 31.47s/it]training loss: 8.500e-03:   0%|          | 794/300001 [7:03:15<2625:42:17, 31.59s/it]training loss: 8.500e-03:   0%|          | 795/300001 [7:03:46<2627:05:11, 31.61s/it]training loss: 8.500e-03:   0%|          | 796/300001 [7:04:18<2616:16:31, 31.48s/it]training loss: 8.500e-03:   0%|          | 797/300001 [7:04:48<2588:08:41, 31.14s/it]training loss: 8.500e-03:   0%|          | 798/300001 [7:05:19<2588:08:30, 31.14s/it]training loss: 8.500e-03:   0%|          | 799/300001 [7:05:50<2588:45:48, 31.15s/it]training loss: 8.500e-03:   0%|          | 800/300001 [7:06:22<2606:24:04, 31.36s/it]training loss: 8.692e-03:   0%|          | 800/300001 [7:06:54<2606:24:04, 31.36s/it]training loss: 8.692e-03:   0%|          | 801/300001 [7:06:56<2666:30:51, 32.08s/it]training loss: 8.692e-03:   0%|          | 802/300001 [7:07:27<2648:18:54, 31.86s/it]training loss: 8.692e-03:   0%|          | 803/300001 [7:08:00<2660:32:08, 32.01s/it]training loss: 8.692e-03:   0%|          | 804/300001 [7:08:31<2658:11:34, 31.98s/it]training loss: 8.692e-03:   0%|          | 805/300001 [7:09:03<2642:38:01, 31.80s/it]training loss: 8.692e-03:   0%|          | 806/300001 [7:09:35<2645:01:24, 31.83s/it]training loss: 8.692e-03:   0%|          | 807/300001 [7:10:05<2606:41:51, 31.36s/it]training loss: 8.692e-03:   0%|          | 808/300001 [7:10:36<2591:43:30, 31.18s/it]training loss: 8.692e-03:   0%|          | 809/300001 [7:11:07<2590:59:35, 31.18s/it]training loss: 8.692e-03:   0%|          | 810/300001 [7:11:38<2594:09:57, 31.21s/it]training loss: 8.692e-03:   0%|          | 811/300001 [7:12:10<2604:36:57, 31.34s/it]training loss: 8.692e-03:   0%|          | 812/300001 [7:12:40<2580:43:40, 31.05s/it]training loss: 8.692e-03:   0%|          | 813/300001 [7:13:13<2613:12:03, 31.44s/it]training loss: 8.692e-03:   0%|          | 814/300001 [7:13:46<2655:01:25, 31.95s/it]training loss: 8.692e-03:   0%|          | 815/300001 [7:14:17<2643:26:59, 31.81s/it]training loss: 8.692e-03:   0%|          | 816/300001 [7:14:49<2647:41:53, 31.86s/it]training loss: 8.692e-03:   0%|          | 817/300001 [7:15:21<2653:52:47, 31.93s/it]training loss: 8.692e-03:   0%|          | 818/300001 [7:15:53<2649:32:43, 31.88s/it]training loss: 8.692e-03:   0%|          | 819/300001 [7:16:26<2674:38:01, 32.18s/it]training loss: 8.692e-03:   0%|          | 820/300001 [7:16:58<2681:05:42, 32.26s/it]training loss: 8.765e-03:   0%|          | 820/300001 [7:17:29<2681:05:42, 32.26s/it]training loss: 8.765e-03:   0%|          | 821/300001 [7:17:29<2643:38:03, 31.81s/it]training loss: 8.765e-03:   0%|          | 822/300001 [7:18:00<2620:18:50, 31.53s/it]training loss: 8.765e-03:   0%|          | 823/300001 [7:18:31<2607:59:26, 31.38s/it]training loss: 8.765e-03:   0%|          | 824/300001 [7:19:03<2621:01:00, 31.54s/it]training loss: 8.765e-03:   0%|          | 825/300001 [7:19:34<2620:37:59, 31.53s/it]training loss: 8.765e-03:   0%|          | 826/300001 [7:20:06<2629:56:10, 31.65s/it]training loss: 8.765e-03:   0%|          | 827/300001 [7:20:37<2612:40:25, 31.44s/it]training loss: 8.765e-03:   0%|          | 828/300001 [7:21:09<2622:46:15, 31.56s/it]training loss: 8.765e-03:   0%|          | 829/300001 [7:21:41<2623:24:53, 31.57s/it]training loss: 8.765e-03:   0%|          | 830/300001 [7:22:13<2634:40:42, 31.70s/it]training loss: 8.765e-03:   0%|          | 831/300001 [7:22:44<2632:36:18, 31.68s/it]training loss: 8.765e-03:   0%|          | 832/300001 [7:23:17<2657:38:27, 31.98s/it]training loss: 8.765e-03:   0%|          | 833/300001 [7:23:48<2642:22:02, 31.80s/it]training loss: 8.765e-03:   0%|          | 834/300001 [7:24:21<2650:23:33, 31.89s/it]training loss: 8.765e-03:   0%|          | 835/300001 [7:24:51<2616:07:27, 31.48s/it]training loss: 8.765e-03:   0%|          | 836/300001 [7:25:23<2632:52:25, 31.68s/it]training loss: 8.765e-03:   0%|          | 837/300001 [7:25:55<2629:06:08, 31.64s/it]training loss: 8.765e-03:   0%|          | 838/300001 [7:26:26<2630:43:08, 31.66s/it]training loss: 8.765e-03:   0%|          | 839/300001 [7:26:58<2638:56:21, 31.76s/it]training loss: 8.765e-03:   0%|          | 840/300001 [7:27:30<2631:09:52, 31.66s/it]training loss: 6.394e-03:   0%|          | 840/300001 [7:28:02<2631:09:52, 31.66s/it]training loss: 6.394e-03:   0%|          | 841/300001 [7:28:02<2630:44:24, 31.66s/it]training loss: 6.394e-03:   0%|          | 842/300001 [7:28:33<2637:07:05, 31.73s/it]training loss: 6.394e-03:   0%|          | 843/300001 [7:29:06<2664:11:34, 32.06s/it]training loss: 6.394e-03:   0%|          | 844/300001 [7:29:39<2683:47:04, 32.30s/it]training loss: 6.394e-03:   0%|          | 845/300001 [7:30:11<2665:58:57, 32.08s/it]training loss: 6.394e-03:   0%|          | 846/300001 [7:30:42<2654:38:36, 31.95s/it]training loss: 6.394e-03:   0%|          | 847/300001 [7:31:14<2636:43:30, 31.73s/it]training loss: 6.394e-03:   0%|          | 848/300001 [7:31:46<2642:43:16, 31.80s/it]training loss: 6.394e-03:   0%|          | 849/300001 [7:32:18<2648:16:41, 31.87s/it]training loss: 6.394e-03:   0%|          | 850/300001 [7:32:50<2656:57:06, 31.97s/it]training loss: 6.394e-03:   0%|          | 851/300001 [7:33:21<2639:49:52, 31.77s/it]training loss: 6.394e-03:   0%|          | 852/300001 [7:33:53<2635:02:13, 31.71s/it]training loss: 6.394e-03:   0%|          | 853/300001 [7:34:25<2641:15:56, 31.79s/it]training loss: 6.394e-03:   0%|          | 854/300001 [7:34:57<2643:31:23, 31.81s/it]training loss: 6.394e-03:   0%|          | 855/300001 [7:35:30<2676:07:09, 32.21s/it]training loss: 6.394e-03:   0%|          | 856/300001 [7:36:02<2683:52:43, 32.30s/it]training loss: 6.394e-03:   0%|          | 857/300001 [7:36:34<2683:00:54, 32.29s/it]training loss: 6.394e-03:   0%|          | 858/300001 [7:37:06<2674:04:50, 32.18s/it]training loss: 6.394e-03:   0%|          | 859/300001 [7:37:38<2653:53:28, 31.94s/it]training loss: 6.394e-03:   0%|          | 860/300001 [7:38:09<2646:57:42, 31.85s/it]training loss: 6.564e-03:   0%|          | 860/300001 [7:38:40<2646:57:42, 31.85s/it]training loss: 6.564e-03:   0%|          | 861/300001 [7:38:40<2624:35:18, 31.59s/it]training loss: 6.564e-03:   0%|          | 862/300001 [7:39:12<2637:19:13, 31.74s/it]training loss: 6.564e-03:   0%|          | 863/300001 [7:39:45<2648:17:28, 31.87s/it]training loss: 6.564e-03:   0%|          | 864/300001 [7:40:16<2628:43:04, 31.64s/it]training loss: 6.564e-03:   0%|          | 865/300001 [7:40:48<2641:43:54, 31.79s/it]training loss: 6.564e-03:   0%|          | 866/300001 [7:41:19<2630:30:53, 31.66s/it]training loss: 6.564e-03:   0%|          | 867/300001 [7:41:52<2657:33:38, 31.98s/it]training loss: 6.564e-03:   0%|          | 868/300001 [7:42:23<2643:50:54, 31.82s/it]training loss: 6.564e-03:   0%|          | 869/300001 [7:42:54<2620:01:28, 31.53s/it]training loss: 6.564e-03:   0%|          | 870/300001 [7:43:26<2620:34:07, 31.54s/it]training loss: 6.564e-03:   0%|          | 871/300001 [7:43:57<2614:48:37, 31.47s/it]training loss: 6.564e-03:   0%|          | 872/300001 [7:44:30<2656:57:22, 31.98s/it]training loss: 6.564e-03:   0%|          | 873/300001 [7:45:03<2688:45:32, 32.36s/it]training loss: 6.564e-03:   0%|          | 874/300001 [7:45:35<2665:54:27, 32.08s/it]training loss: 6.564e-03:   0%|          | 875/300001 [7:46:07<2656:09:09, 31.97s/it]training loss: 6.564e-03:   0%|          | 876/300001 [7:46:38<2639:46:51, 31.77s/it]training loss: 6.564e-03:   0%|          | 877/300001 [7:47:10<2654:40:08, 31.95s/it]training loss: 6.564e-03:   0%|          | 878/300001 [7:47:41<2622:28:31, 31.56s/it]training loss: 6.564e-03:   0%|          | 879/300001 [7:48:13<2634:44:47, 31.71s/it]training loss: 6.564e-03:   0%|          | 880/300001 [7:48:44<2624:09:30, 31.58s/it]training loss: 7.261e-03:   0%|          | 880/300001 [7:49:16<2624:09:30, 31.58s/it]training loss: 7.261e-03:   0%|          | 881/300001 [7:49:16<2634:15:48, 31.70s/it]training loss: 7.261e-03:   0%|          | 882/300001 [7:49:49<2649:10:49, 31.88s/it]training loss: 7.261e-03:   0%|          | 883/300001 [7:50:20<2640:40:27, 31.78s/it]training loss: 7.261e-03:   0%|          | 884/300001 [7:50:54<2690:49:08, 32.39s/it]training loss: 7.261e-03:   0%|          | 885/300001 [7:51:26<2693:34:36, 32.42s/it]training loss: 7.261e-03:   0%|          | 886/300001 [7:51:59<2686:25:30, 32.33s/it]training loss: 7.261e-03:   0%|          | 887/300001 [7:52:31<2682:21:06, 32.28s/it]training loss: 7.261e-03:   0%|          | 888/300001 [7:53:03<2676:36:00, 32.21s/it]training loss: 7.261e-03:   0%|          | 889/300001 [7:53:35<2680:14:25, 32.26s/it]training loss: 7.261e-03:   0%|          | 890/300001 [7:54:07<2667:12:46, 32.10s/it]training loss: 7.261e-03:   0%|          | 891/300001 [7:54:38<2644:11:45, 31.82s/it]training loss: 7.261e-03:   0%|          | 892/300001 [7:55:10<2638:26:18, 31.76s/it]training loss: 7.261e-03:   0%|          | 893/300001 [7:55:41<2632:00:22, 31.68s/it]training loss: 7.261e-03:   0%|          | 894/300001 [7:56:13<2633:28:14, 31.70s/it]training loss: 7.261e-03:   0%|          | 895/300001 [7:56:46<2658:59:51, 32.00s/it]training loss: 7.261e-03:   0%|          | 896/300001 [7:57:17<2649:45:13, 31.89s/it]training loss: 7.261e-03:   0%|          | 897/300001 [7:57:49<2638:21:11, 31.76s/it]training loss: 7.261e-03:   0%|          | 898/300001 [7:58:20<2630:51:24, 31.66s/it]training loss: 7.261e-03:   0%|          | 899/300001 [7:58:52<2633:45:14, 31.70s/it]training loss: 7.261e-03:   0%|          | 900/300001 [7:59:23<2614:21:59, 31.47s/it]training loss: 7.057e-03:   0%|          | 900/300001 [7:59:55<2614:21:59, 31.47s/it]training loss: 7.057e-03:   0%|          | 901/300001 [7:59:55<2636:50:34, 31.74s/it]training loss: 7.057e-03:   0%|          | 902/300001 [8:00:27<2631:50:27, 31.68s/it]training loss: 7.057e-03:   0%|          | 903/300001 [8:00:59<2637:59:40, 31.75s/it]training loss: 7.057e-03:   0%|          | 904/300001 [8:01:31<2651:18:19, 31.91s/it]training loss: 7.057e-03:   0%|          | 905/300001 [8:02:02<2631:48:40, 31.68s/it]training loss: 7.057e-03:   0%|          | 906/300001 [8:02:33<2622:27:32, 31.56s/it]training loss: 7.057e-03:   0%|          | 907/300001 [8:03:05<2620:35:00, 31.54s/it]training loss: 7.057e-03:   0%|          | 908/300001 [8:03:37<2629:19:54, 31.65s/it]training loss: 7.057e-03:   0%|          | 909/300001 [8:04:08<2623:42:23, 31.58s/it]training loss: 7.057e-03:   0%|          | 910/300001 [8:04:39<2615:43:53, 31.48s/it]training loss: 7.057e-03:   0%|          | 911/300001 [8:05:10<2603:22:03, 31.34s/it]training loss: 7.057e-03:   0%|          | 912/300001 [8:05:43<2645:49:49, 31.85s/it]training loss: 7.057e-03:   0%|          | 913/300001 [8:06:16<2653:50:30, 31.94s/it]training loss: 7.057e-03:   0%|          | 914/300001 [8:06:48<2654:04:54, 31.95s/it]training loss: 7.057e-03:   0%|          | 915/300001 [8:07:20<2665:35:39, 32.08s/it]training loss: 7.057e-03:   0%|          | 916/300001 [8:07:52<2653:06:59, 31.93s/it]training loss: 7.057e-03:   0%|          | 917/300001 [8:08:23<2637:25:16, 31.75s/it]training loss: 7.057e-03:   0%|          | 918/300001 [8:08:54<2628:25:05, 31.64s/it]training loss: 7.057e-03:   0%|          | 919/300001 [8:09:27<2643:44:05, 31.82s/it]training loss: 7.057e-03:   0%|          | 920/300001 [8:09:58<2647:00:39, 31.86s/it]training loss: 6.758e-03:   0%|          | 920/300001 [8:10:30<2647:00:39, 31.86s/it]training loss: 6.758e-03:   0%|          | 921/300001 [8:10:30<2641:59:54, 31.80s/it]training loss: 6.758e-03:   0%|          | 922/300001 [8:11:02<2640:48:42, 31.79s/it]training loss: 6.758e-03:   0%|          | 923/300001 [8:11:35<2661:28:27, 32.04s/it]training loss: 6.758e-03:   0%|          | 924/300001 [8:12:06<2656:33:46, 31.98s/it]training loss: 6.758e-03:   0%|          | 925/300001 [8:12:38<2649:58:01, 31.90s/it]training loss: 6.758e-03:   0%|          | 926/300001 [8:13:10<2648:39:49, 31.88s/it]training loss: 6.758e-03:   0%|          | 927/300001 [8:13:41<2636:40:05, 31.74s/it]training loss: 6.758e-03:   0%|          | 928/300001 [8:14:13<2638:21:08, 31.76s/it]training loss: 6.758e-03:   0%|          | 929/300001 [8:14:45<2639:39:24, 31.77s/it]training loss: 6.758e-03:   0%|          | 930/300001 [8:15:16<2621:44:25, 31.56s/it]training loss: 6.758e-03:   0%|          | 931/300001 [8:15:46<2588:11:55, 31.15s/it]training loss: 6.758e-03:   0%|          | 932/300001 [8:16:18<2601:43:47, 31.32s/it]training loss: 6.758e-03:   0%|          | 933/300001 [8:16:50<2619:20:51, 31.53s/it]training loss: 6.758e-03:   0%|          | 934/300001 [8:17:22<2633:24:43, 31.70s/it]training loss: 6.758e-03:   0%|          | 935/300001 [8:17:53<2606:58:24, 31.38s/it]training loss: 6.758e-03:   0%|          | 936/300001 [8:18:25<2628:19:18, 31.64s/it]training loss: 6.758e-03:   0%|          | 937/300001 [8:18:56<2616:35:34, 31.50s/it]training loss: 6.758e-03:   0%|          | 938/300001 [8:19:28<2617:19:19, 31.51s/it]training loss: 6.758e-03:   0%|          | 939/300001 [8:19:58<2599:05:32, 31.29s/it]training loss: 6.758e-03:   0%|          | 940/300001 [8:20:30<2602:35:29, 31.33s/it]training loss: 7.688e-03:   0%|          | 940/300001 [8:21:02<2602:35:29, 31.33s/it]training loss: 7.688e-03:   0%|          | 941/300001 [8:21:02<2623:11:32, 31.58s/it]training loss: 7.688e-03:   0%|          | 942/300001 [8:21:24<2385:11:56, 28.71s/it]training loss: 7.688e-03:   0%|          | 943/300001 [8:21:56<2471:00:48, 29.75s/it]training loss: 7.688e-03:   0%|          | 944/300001 [8:22:27<2498:28:12, 30.08s/it]training loss: 7.688e-03:   0%|          | 945/300001 [8:22:58<2533:21:46, 30.50s/it]training loss: 7.688e-03:   0%|          | 946/300001 [8:23:31<2585:41:37, 31.13s/it]training loss: 7.688e-03:   0%|          | 947/300001 [8:24:03<2598:05:02, 31.28s/it]training loss: 7.688e-03:   0%|          | 948/300001 [8:24:34<2609:05:38, 31.41s/it]training loss: 7.688e-03:   0%|          | 949/300001 [8:25:06<2617:19:20, 31.51s/it]training loss: 7.688e-03:   0%|          | 950/300001 [8:25:39<2647:09:11, 31.87s/it]training loss: 7.688e-03:   0%|          | 951/300001 [8:26:11<2656:57:50, 31.98s/it]training loss: 7.688e-03:   0%|          | 952/300001 [8:26:43<2644:31:28, 31.84s/it]training loss: 7.688e-03:   0%|          | 953/300001 [8:27:14<2628:54:04, 31.65s/it]training loss: 7.688e-03:   0%|          | 954/300001 [8:27:44<2595:25:07, 31.24s/it]training loss: 7.688e-03:   0%|          | 955/300001 [8:28:15<2584:40:01, 31.11s/it]training loss: 7.688e-03:   0%|          | 956/300001 [8:28:47<2619:03:27, 31.53s/it]training loss: 7.688e-03:   0%|          | 957/300001 [8:29:18<2601:53:02, 31.32s/it]training loss: 7.688e-03:   0%|          | 958/300001 [8:29:50<2612:33:23, 31.45s/it]training loss: 7.688e-03:   0%|          | 959/300001 [8:30:22<2615:27:17, 31.49s/it]training loss: 7.688e-03:   0%|          | 960/300001 [8:30:53<2611:18:04, 31.44s/it]training loss: 7.087e-03:   0%|          | 960/300001 [8:31:25<2611:18:04, 31.44s/it]training loss: 7.087e-03:   0%|          | 961/300001 [8:31:25<2629:22:36, 31.65s/it]training loss: 7.087e-03:   0%|          | 962/300001 [8:31:57<2627:56:13, 31.64s/it]training loss: 7.087e-03:   0%|          | 963/300001 [8:32:28<2624:15:16, 31.59s/it]training loss: 7.087e-03:   0%|          | 964/300001 [8:33:00<2620:23:17, 31.55s/it]training loss: 7.087e-03:   0%|          | 965/300001 [8:33:31<2620:13:45, 31.54s/it]training loss: 7.087e-03:   0%|          | 966/300001 [8:34:04<2654:23:54, 31.96s/it]training loss: 7.087e-03:   0%|          | 967/300001 [8:34:36<2642:14:17, 31.81s/it]training loss: 7.087e-03:   0%|          | 968/300001 [8:35:06<2621:42:42, 31.56s/it]training loss: 7.087e-03:   0%|          | 969/300001 [8:35:37<2606:45:15, 31.38s/it]training loss: 7.087e-03:   0%|          | 970/300001 [8:36:09<2607:43:04, 31.39s/it]training loss: 7.087e-03:   0%|          | 971/300001 [8:36:41<2617:04:07, 31.51s/it]training loss: 7.087e-03:   0%|          | 972/300001 [8:37:14<2653:34:22, 31.95s/it]training loss: 7.087e-03:   0%|          | 973/300001 [8:37:45<2646:24:35, 31.86s/it]training loss: 7.087e-03:   0%|          | 974/300001 [8:38:16<2618:25:14, 31.52s/it]training loss: 7.087e-03:   0%|          | 975/300001 [8:38:48<2618:48:23, 31.53s/it]training loss: 7.087e-03:   0%|          | 976/300001 [8:39:19<2614:31:04, 31.48s/it]training loss: 7.087e-03:   0%|          | 977/300001 [8:39:50<2612:56:40, 31.46s/it]training loss: 7.087e-03:   0%|          | 978/300001 [8:40:22<2606:07:52, 31.38s/it]training loss: 7.087e-03:   0%|          | 979/300001 [8:40:54<2624:16:29, 31.59s/it]training loss: 7.087e-03:   0%|          | 980/300001 [8:41:25<2627:08:39, 31.63s/it]training loss: 6.799e-03:   0%|          | 980/300001 [8:41:55<2627:08:39, 31.63s/it]training loss: 6.799e-03:   0%|          | 981/300001 [8:41:55<2584:37:28, 31.12s/it]training loss: 6.799e-03:   0%|          | 982/300001 [8:42:26<2572:44:37, 30.97s/it]training loss: 6.799e-03:   0%|          | 983/300001 [8:42:59<2617:12:45, 31.51s/it]training loss: 6.799e-03:   0%|          | 984/300001 [8:43:30<2621:14:48, 31.56s/it]training loss: 6.799e-03:   0%|          | 985/300001 [8:44:02<2617:56:15, 31.52s/it]training loss: 6.799e-03:   0%|          | 986/300001 [8:44:33<2600:30:09, 31.31s/it]training loss: 6.799e-03:   0%|          | 987/300001 [8:45:04<2610:11:44, 31.43s/it]training loss: 6.799e-03:   0%|          | 988/300001 [8:45:35<2596:58:06, 31.27s/it]training loss: 6.799e-03:   0%|          | 989/300001 [8:46:07<2611:31:21, 31.44s/it]training loss: 6.799e-03:   0%|          | 990/300001 [8:46:39<2619:55:43, 31.54s/it]training loss: 6.799e-03:   0%|          | 991/300001 [8:47:10<2614:37:10, 31.48s/it]training loss: 6.799e-03:   0%|          | 992/300001 [8:47:42<2619:27:44, 31.54s/it]training loss: 6.799e-03:   0%|          | 993/300001 [8:48:15<2659:01:47, 32.01s/it]training loss: 6.799e-03:   0%|          | 994/300001 [8:48:46<2647:51:05, 31.88s/it]training loss: 6.799e-03:   0%|          | 995/300001 [8:49:18<2633:16:10, 31.70s/it]training loss: 6.799e-03:   0%|          | 996/300001 [8:49:49<2627:37:14, 31.64s/it]training loss: 6.799e-03:   0%|          | 997/300001 [8:50:21<2634:57:15, 31.72s/it]training loss: 6.799e-03:   0%|          | 998/300001 [8:50:52<2612:46:48, 31.46s/it]training loss: 6.799e-03:   0%|          | 999/300001 [8:51:24<2620:58:20, 31.56s/it]training loss: 6.799e-03:   0%|          | 1000/300001 [8:51:56<2635:24:49, 31.73s/it]training loss: 6.868e-03:   0%|          | 1000/300001 [8:52:29<2635:24:49, 31.73s/it]training loss: 6.868e-03:   0%|          | 1001/300001 [8:52:33<2756:43:14, 33.19s/it]training loss: 6.868e-03:   0%|          | 1002/300001 [8:53:06<2771:53:19, 33.37s/it]training loss: 6.868e-03:   0%|          | 1003/300001 [8:53:41<2797:28:45, 33.68s/it]training loss: 6.868e-03:   0%|          | 1004/300001 [8:54:13<2765:54:28, 33.30s/it]training loss: 6.868e-03:   0%|          | 1005/300001 [8:54:45<2719:51:56, 32.75s/it]training loss: 6.868e-03:   0%|          | 1006/300001 [8:55:18<2740:27:00, 33.00s/it]training loss: 6.868e-03:   0%|          | 1007/300001 [8:55:48<2668:51:37, 32.13s/it]training loss: 6.868e-03:   0%|          | 1008/300001 [8:56:20<2659:37:21, 32.02s/it]training loss: 6.868e-03:   0%|          | 1009/300001 [8:56:53<2686:19:59, 32.34s/it]training loss: 6.868e-03:   0%|          | 1010/300001 [8:57:25<2661:59:53, 32.05s/it]training loss: 6.868e-03:   0%|          | 1011/300001 [8:57:56<2643:39:09, 31.83s/it]training loss: 6.868e-03:   0%|          | 1012/300001 [8:58:28<2649:41:05, 31.90s/it]training loss: 6.868e-03:   0%|          | 1013/300001 [8:59:00<2652:11:31, 31.93s/it]training loss: 6.868e-03:   0%|          | 1014/300001 [8:59:32<2664:31:07, 32.08s/it]training loss: 6.868e-03:   0%|          | 1015/300001 [9:00:04<2661:42:06, 32.05s/it]training loss: 6.868e-03:   0%|          | 1016/300001 [9:00:36<2656:51:55, 31.99s/it]training loss: 6.868e-03:   0%|          | 1017/300001 [9:01:09<2671:56:20, 32.17s/it]training loss: 6.868e-03:   0%|          | 1018/300001 [9:01:41<2663:10:08, 32.07s/it]training loss: 6.868e-03:   0%|          | 1019/300001 [9:02:12<2648:43:36, 31.89s/it]training loss: 6.868e-03:   0%|          | 1020/300001 [9:02:45<2661:52:58, 32.05s/it]training loss: 7.189e-03:   0%|          | 1020/300001 [9:03:16<2661:52:58, 32.05s/it]training loss: 7.189e-03:   0%|          | 1021/300001 [9:03:16<2657:09:33, 31.99s/it]training loss: 7.189e-03:   0%|          | 1022/300001 [9:03:48<2641:39:19, 31.81s/it]training loss: 7.189e-03:   0%|          | 1023/300001 [9:04:20<2640:25:08, 31.79s/it]training loss: 7.189e-03:   0%|          | 1024/300001 [9:04:52<2661:43:37, 32.05s/it]training loss: 7.189e-03:   0%|          | 1025/300001 [9:05:25<2671:07:06, 32.16s/it]training loss: 7.189e-03:   0%|          | 1026/300001 [9:05:56<2655:29:40, 31.98s/it]training loss: 7.189e-03:   0%|          | 1027/300001 [9:06:28<2659:51:19, 32.03s/it]training loss: 7.189e-03:   0%|          | 1028/300001 [9:06:59<2638:30:11, 31.77s/it]training loss: 7.189e-03:   0%|          | 1029/300001 [9:07:32<2667:14:22, 32.12s/it]training loss: 7.189e-03:   0%|          | 1030/300001 [9:08:05<2677:26:28, 32.24s/it]training loss: 7.189e-03:   0%|          | 1031/300001 [9:08:37<2678:16:20, 32.25s/it]training loss: 7.189e-03:   0%|          | 1032/300001 [9:09:08<2654:10:10, 31.96s/it]training loss: 7.189e-03:   0%|          | 1033/300001 [9:09:42<2690:08:26, 32.39s/it]training loss: 7.189e-03:   0%|          | 1034/300001 [9:10:15<2704:58:16, 32.57s/it]training loss: 7.189e-03:   0%|          | 1035/300001 [9:10:47<2702:32:59, 32.54s/it]training loss: 7.189e-03:   0%|          | 1036/300001 [9:11:19<2677:09:30, 32.24s/it]training loss: 7.189e-03:   0%|          | 1037/300001 [9:11:51<2666:58:05, 32.11s/it]training loss: 7.189e-03:   0%|          | 1038/300001 [9:12:22<2656:10:50, 31.98s/it]training loss: 7.189e-03:   0%|          | 1039/300001 [9:12:55<2667:48:52, 32.12s/it]training loss: 7.189e-03:   0%|          | 1040/300001 [9:13:27<2667:36:49, 32.12s/it]training loss: 6.749e-03:   0%|          | 1040/300001 [9:13:59<2667:36:49, 32.12s/it]training loss: 6.749e-03:   0%|          | 1041/300001 [9:13:59<2663:21:34, 32.07s/it]training loss: 6.749e-03:   0%|          | 1042/300001 [9:14:31<2658:52:31, 32.02s/it]training loss: 6.749e-03:   0%|          | 1043/300001 [9:15:03<2661:48:50, 32.05s/it]training loss: 6.749e-03:   0%|          | 1044/300001 [9:15:35<2662:22:25, 32.06s/it]training loss: 6.749e-03:   0%|          | 1045/300001 [9:16:08<2680:56:03, 32.28s/it]training loss: 6.749e-03:   0%|          | 1046/300001 [9:16:40<2676:36:10, 32.23s/it]training loss: 6.749e-03:   0%|          | 1047/300001 [9:17:13<2697:59:30, 32.49s/it]training loss: 6.749e-03:   0%|          | 1048/300001 [9:17:45<2682:19:36, 32.30s/it]training loss: 6.749e-03:   0%|          | 1049/300001 [9:18:17<2689:24:09, 32.39s/it]training loss: 6.749e-03:   0%|          | 1050/300001 [9:18:50<2681:38:11, 32.29s/it]training loss: 6.749e-03:   0%|          | 1051/300001 [9:19:22<2674:36:34, 32.21s/it]training loss: 6.749e-03:   0%|          | 1052/300001 [9:19:53<2662:13:26, 32.06s/it]training loss: 6.749e-03:   0%|          | 1053/300001 [9:20:25<2650:18:36, 31.92s/it]training loss: 6.749e-03:   0%|          | 1054/300001 [9:20:57<2645:16:34, 31.86s/it]training loss: 6.749e-03:   0%|          | 1055/300001 [9:21:28<2632:28:45, 31.70s/it]training loss: 6.749e-03:   0%|          | 1056/300001 [9:21:59<2628:16:32, 31.65s/it]training loss: 6.749e-03:   0%|          | 1057/300001 [9:22:32<2645:12:53, 31.85s/it]training loss: 6.749e-03:   0%|          | 1058/300001 [9:23:04<2646:52:21, 31.87s/it]training loss: 6.749e-03:   0%|          | 1059/300001 [9:23:36<2657:50:05, 32.01s/it]training loss: 6.749e-03:   0%|          | 1060/300001 [9:24:08<2663:21:46, 32.07s/it]training loss: 7.298e-03:   0%|          | 1060/300001 [9:24:41<2663:21:46, 32.07s/it]training loss: 7.298e-03:   0%|          | 1061/300001 [9:24:41<2682:20:42, 32.30s/it]training loss: 7.298e-03:   0%|          | 1062/300001 [9:25:13<2680:29:27, 32.28s/it]training loss: 7.298e-03:   0%|          | 1063/300001 [9:25:44<2653:33:20, 31.96s/it]training loss: 7.298e-03:   0%|          | 1064/300001 [9:26:15<2622:24:54, 31.58s/it]training loss: 7.298e-03:   0%|          | 1065/300001 [9:26:47<2621:47:10, 31.57s/it]training loss: 7.298e-03:   0%|          | 1066/300001 [9:27:19<2646:43:07, 31.87s/it]training loss: 7.298e-03:   0%|          | 1067/300001 [9:27:51<2648:23:56, 31.89s/it]training loss: 7.298e-03:   0%|          | 1068/300001 [9:28:23<2643:51:49, 31.84s/it]training loss: 7.298e-03:   0%|          | 1069/300001 [9:28:56<2664:29:41, 32.09s/it]training loss: 7.298e-03:   0%|          | 1070/300001 [9:29:26<2631:50:59, 31.70s/it]training loss: 7.298e-03:   0%|          | 1071/300001 [9:29:58<2620:50:45, 31.56s/it]training loss: 7.298e-03:   0%|          | 1072/300001 [9:30:30<2628:22:50, 31.65s/it]training loss: 7.298e-03:   0%|          | 1073/300001 [9:31:01<2625:42:25, 31.62s/it]training loss: 7.298e-03:   0%|          | 1074/300001 [9:31:34<2660:08:42, 32.04s/it]training loss: 7.298e-03:   0%|          | 1075/300001 [9:32:06<2650:38:13, 31.92s/it]training loss: 7.298e-03:   0%|          | 1076/300001 [9:32:39<2676:34:42, 32.23s/it]training loss: 7.298e-03:   0%|          | 1077/300001 [9:33:10<2645:12:47, 31.86s/it]training loss: 7.298e-03:   0%|          | 1078/300001 [9:33:41<2621:03:03, 31.57s/it]training loss: 7.298e-03:   0%|          | 1079/300001 [9:34:12<2629:43:24, 31.67s/it]training loss: 7.298e-03:   0%|          | 1080/300001 [9:34:43<2611:33:10, 31.45s/it]training loss: 6.152e-03:   0%|          | 1080/300001 [9:35:15<2611:33:10, 31.45s/it]training loss: 6.152e-03:   0%|          | 1081/300001 [9:35:16<2627:59:05, 31.65s/it]training loss: 6.152e-03:   0%|          | 1082/300001 [9:35:48<2641:42:37, 31.82s/it]training loss: 6.152e-03:   0%|          | 1083/300001 [9:36:19<2629:14:22, 31.67s/it]training loss: 6.152e-03:   0%|          | 1084/300001 [9:36:51<2644:42:26, 31.85s/it]training loss: 6.152e-03:   0%|          | 1085/300001 [9:37:24<2655:40:51, 31.98s/it]training loss: 6.152e-03:   0%|          | 1086/300001 [9:37:56<2657:11:15, 32.00s/it]training loss: 6.152e-03:   0%|          | 1087/300001 [9:38:28<2656:39:57, 32.00s/it]training loss: 6.152e-03:   0%|          | 1088/300001 [9:38:59<2650:53:26, 31.93s/it]training loss: 6.152e-03:   0%|          | 1089/300001 [9:39:31<2639:02:18, 31.78s/it]training loss: 6.152e-03:   0%|          | 1090/300001 [9:40:03<2660:24:48, 32.04s/it]training loss: 6.152e-03:   0%|          | 1091/300001 [9:40:34<2633:51:57, 31.72s/it]training loss: 6.152e-03:   0%|          | 1092/300001 [9:41:05<2615:36:54, 31.50s/it]training loss: 6.152e-03:   0%|          | 1093/300001 [9:41:37<2619:41:29, 31.55s/it]training loss: 6.152e-03:   0%|          | 1094/300001 [9:42:08<2603:22:18, 31.35s/it]training loss: 6.152e-03:   0%|          | 1095/300001 [9:42:40<2618:38:28, 31.54s/it]training loss: 6.152e-03:   0%|          | 1096/300001 [9:43:13<2653:34:29, 31.96s/it]training loss: 6.152e-03:   0%|          | 1097/300001 [9:43:45<2646:49:24, 31.88s/it]training loss: 6.152e-03:   0%|          | 1098/300001 [9:44:17<2651:35:54, 31.94s/it]training loss: 6.152e-03:   0%|          | 1099/300001 [9:44:39<2402:43:27, 28.94s/it]training loss: 6.152e-03:   0%|          | 1100/300001 [9:45:11<2475:59:26, 29.82s/it]training loss: 7.918e-03:   0%|          | 1100/300001 [9:45:42<2475:59:26, 29.82s/it]training loss: 7.918e-03:   0%|          | 1101/300001 [9:45:42<2518:36:51, 30.33s/it]training loss: 7.918e-03:   0%|          | 1102/300001 [9:46:14<2557:13:51, 30.80s/it]training loss: 7.918e-03:   0%|          | 1103/300001 [9:46:46<2584:02:51, 31.12s/it]training loss: 7.918e-03:   0%|          | 1104/300001 [9:47:18<2619:35:08, 31.55s/it]training loss: 7.918e-03:   0%|          | 1105/300001 [9:47:50<2626:04:21, 31.63s/it]training loss: 7.918e-03:   0%|          | 1106/300001 [9:48:23<2649:12:23, 31.91s/it]training loss: 7.918e-03:   0%|          | 1107/300001 [9:48:55<2659:48:17, 32.04s/it]training loss: 7.918e-03:   0%|          | 1108/300001 [9:49:27<2647:32:22, 31.89s/it]training loss: 7.918e-03:   0%|          | 1109/300001 [9:49:59<2666:59:44, 32.12s/it]training loss: 7.918e-03:   0%|          | 1110/300001 [9:50:32<2670:02:08, 32.16s/it]training loss: 7.918e-03:   0%|          | 1111/300001 [9:51:03<2661:36:10, 32.06s/it]training loss: 7.918e-03:   0%|          | 1112/300001 [9:51:35<2647:49:47, 31.89s/it]training loss: 7.918e-03:   0%|          | 1113/300001 [9:52:07<2645:10:47, 31.86s/it]training loss: 7.918e-03:   0%|          | 1114/300001 [9:52:37<2613:10:21, 31.47s/it]training loss: 7.918e-03:   0%|          | 1115/300001 [9:53:10<2651:59:20, 31.94s/it]training loss: 7.918e-03:   0%|          | 1116/300001 [9:53:41<2626:32:50, 31.64s/it]training loss: 7.918e-03:   0%|          | 1117/300001 [9:54:14<2648:21:01, 31.90s/it]training loss: 7.918e-03:   0%|          | 1118/300001 [9:54:46<2669:11:01, 32.15s/it]training loss: 7.918e-03:   0%|          | 1119/300001 [9:55:18<2659:08:25, 32.03s/it]training loss: 7.918e-03:   0%|          | 1120/300001 [9:55:51<2671:27:22, 32.18s/it]training loss: 6.347e-03:   0%|          | 1120/300001 [9:56:22<2671:27:22, 32.18s/it]training loss: 6.347e-03:   0%|          | 1121/300001 [9:56:22<2652:59:41, 31.96s/it]training loss: 6.347e-03:   0%|          | 1122/300001 [9:56:55<2665:44:44, 32.11s/it]training loss: 6.347e-03:   0%|          | 1123/300001 [9:57:26<2646:18:02, 31.87s/it]training loss: 6.347e-03:   0%|          | 1124/300001 [9:57:58<2644:46:19, 31.86s/it]training loss: 6.347e-03:   0%|          | 1125/300001 [9:58:30<2662:31:23, 32.07s/it]training loss: 6.347e-03:   0%|          | 1126/300001 [9:59:02<2665:04:25, 32.10s/it]training loss: 6.347e-03:   0%|          | 1127/300001 [9:59:36<2690:20:30, 32.41s/it]training loss: 6.347e-03:   0%|          | 1128/300001 [10:00:08<2698:31:16, 32.50s/it]training loss: 6.347e-03:   0%|          | 1129/300001 [10:00:40<2674:07:19, 32.21s/it]training loss: 6.347e-03:   0%|          | 1130/300001 [10:01:11<2652:28:00, 31.95s/it]training loss: 6.347e-03:   0%|          | 1131/300001 [10:01:42<2620:56:39, 31.57s/it]training loss: 6.347e-03:   0%|          | 1132/300001 [10:02:14<2628:40:34, 31.66s/it]training loss: 6.347e-03:   0%|          | 1133/300001 [10:02:47<2657:31:45, 32.01s/it]training loss: 6.347e-03:   0%|          | 1134/300001 [10:03:19<2660:28:45, 32.05s/it]training loss: 6.347e-03:   0%|          | 1135/300001 [10:03:50<2631:23:54, 31.70s/it]training loss: 6.347e-03:   0%|          | 1136/300001 [10:04:21<2628:58:34, 31.67s/it]training loss: 6.347e-03:   0%|          | 1137/300001 [10:04:54<2651:52:19, 31.94s/it]training loss: 6.347e-03:   0%|          | 1138/300001 [10:05:26<2649:15:00, 31.91s/it]training loss: 6.347e-03:   0%|          | 1139/300001 [10:05:58<2671:29:47, 32.18s/it]training loss: 6.347e-03:   0%|          | 1140/300001 [10:06:29<2640:00:24, 31.80s/it]training loss: 6.066e-03:   0%|          | 1140/300001 [10:07:01<2640:00:24, 31.80s/it]training loss: 6.066e-03:   0%|          | 1141/300001 [10:07:01<2641:56:25, 31.82s/it]training loss: 6.066e-03:   0%|          | 1142/300001 [10:07:34<2667:41:00, 32.13s/it]training loss: 6.066e-03:   0%|          | 1143/300001 [10:08:06<2654:53:15, 31.98s/it]training loss: 6.066e-03:   0%|          | 1144/300001 [10:08:37<2642:22:17, 31.83s/it]training loss: 6.066e-03:   0%|          | 1145/300001 [10:09:09<2647:49:26, 31.90s/it]training loss: 6.066e-03:   0%|          | 1146/300001 [10:09:41<2649:41:38, 31.92s/it]training loss: 6.066e-03:   0%|          | 1147/300001 [10:10:13<2654:17:40, 31.97s/it]training loss: 6.066e-03:   0%|          | 1148/300001 [10:10:45<2652:45:46, 31.96s/it]training loss: 6.066e-03:   0%|          | 1149/300001 [10:11:18<2665:17:55, 32.11s/it]training loss: 6.066e-03:   0%|          | 1150/300001 [10:11:50<2666:55:47, 32.13s/it]training loss: 6.066e-03:   0%|          | 1151/300001 [10:12:22<2664:38:58, 32.10s/it]training loss: 6.066e-03:   0%|          | 1152/300001 [10:12:54<2672:10:22, 32.19s/it]training loss: 6.066e-03:   0%|          | 1153/300001 [10:13:26<2659:58:32, 32.04s/it]training loss: 6.066e-03:   0%|          | 1154/300001 [10:13:58<2666:55:18, 32.13s/it]training loss: 6.066e-03:   0%|          | 1155/300001 [10:14:30<2665:56:03, 32.11s/it]training loss: 6.066e-03:   0%|          | 1156/300001 [10:15:02<2643:10:29, 31.84s/it]training loss: 6.066e-03:   0%|          | 1157/300001 [10:15:34<2646:20:30, 31.88s/it]training loss: 6.066e-03:   0%|          | 1158/300001 [10:16:05<2640:23:22, 31.81s/it]training loss: 6.066e-03:   0%|          | 1159/300001 [10:16:37<2634:42:42, 31.74s/it]training loss: 6.066e-03:   0%|          | 1160/300001 [10:17:09<2637:50:20, 31.78s/it]training loss: 7.023e-03:   0%|          | 1160/300001 [10:17:40<2637:50:20, 31.78s/it]training loss: 7.023e-03:   0%|          | 1161/300001 [10:17:40<2617:02:24, 31.53s/it]training loss: 7.023e-03:   0%|          | 1162/300001 [10:18:11<2623:47:09, 31.61s/it]training loss: 7.023e-03:   0%|          | 1163/300001 [10:18:43<2611:56:22, 31.47s/it]training loss: 7.023e-03:   0%|          | 1164/300001 [10:19:15<2639:18:39, 31.79s/it]training loss: 7.023e-03:   0%|          | 1165/300001 [10:19:47<2635:55:01, 31.75s/it]training loss: 7.023e-03:   0%|          | 1166/300001 [10:20:19<2650:33:46, 31.93s/it]training loss: 7.023e-03:   0%|          | 1167/300001 [10:20:51<2660:20:40, 32.05s/it]training loss: 7.023e-03:   0%|          | 1168/300001 [10:21:23<2646:25:51, 31.88s/it]training loss: 7.023e-03:   0%|          | 1169/300001 [10:21:54<2637:17:33, 31.77s/it]training loss: 7.023e-03:   0%|          | 1170/300001 [10:22:26<2625:06:30, 31.62s/it]training loss: 7.023e-03:   0%|          | 1171/300001 [10:22:57<2624:09:33, 31.61s/it]training loss: 7.023e-03:   0%|          | 1172/300001 [10:23:28<2611:18:30, 31.46s/it]training loss: 7.023e-03:   0%|          | 1173/300001 [10:24:00<2621:12:59, 31.58s/it]training loss: 7.023e-03:   0%|          | 1174/300001 [10:24:33<2656:12:08, 32.00s/it]training loss: 7.023e-03:   0%|          | 1175/300001 [10:25:07<2688:47:36, 32.39s/it]training loss: 7.023e-03:   0%|          | 1176/300001 [10:25:38<2669:31:31, 32.16s/it]training loss: 7.023e-03:   0%|          | 1177/300001 [10:26:11<2687:51:22, 32.38s/it]training loss: 7.023e-03:   0%|          | 1178/300001 [10:26:43<2674:24:52, 32.22s/it]training loss: 7.023e-03:   0%|          | 1179/300001 [10:27:14<2659:33:02, 32.04s/it]training loss: 7.023e-03:   0%|          | 1180/300001 [10:27:47<2680:34:17, 32.29s/it]training loss: 6.463e-03:   0%|          | 1180/300001 [10:28:18<2680:34:17, 32.29s/it]training loss: 6.463e-03:   0%|          | 1181/300001 [10:28:18<2639:31:46, 31.80s/it]training loss: 6.463e-03:   0%|          | 1182/300001 [10:28:49<2623:27:30, 31.61s/it]training loss: 6.463e-03:   0%|          | 1183/300001 [10:29:21<2625:19:52, 31.63s/it]training loss: 6.463e-03:   0%|          | 1184/300001 [10:29:52<2612:01:29, 31.47s/it]training loss: 6.463e-03:   0%|          | 1185/300001 [10:30:24<2626:04:30, 31.64s/it]training loss: 6.463e-03:   0%|          | 1186/300001 [10:30:57<2657:36:18, 32.02s/it]training loss: 6.463e-03:   0%|          | 1187/300001 [10:31:28<2645:28:51, 31.87s/it]training loss: 6.463e-03:   0%|          | 1188/300001 [10:31:59<2623:33:10, 31.61s/it]training loss: 6.463e-03:   0%|          | 1189/300001 [10:32:32<2646:16:29, 31.88s/it]training loss: 6.463e-03:   0%|          | 1190/300001 [10:33:06<2691:15:05, 32.42s/it]training loss: 6.463e-03:   0%|          | 1191/300001 [10:33:37<2657:56:35, 32.02s/it]training loss: 6.463e-03:   0%|          | 1192/300001 [10:34:08<2640:01:04, 31.81s/it]training loss: 6.463e-03:   0%|          | 1193/300001 [10:34:39<2626:10:46, 31.64s/it]training loss: 6.463e-03:   0%|          | 1194/300001 [10:35:10<2612:44:10, 31.48s/it]training loss: 6.463e-03:   0%|          | 1195/300001 [10:35:42<2613:43:03, 31.49s/it]training loss: 6.463e-03:   0%|          | 1196/300001 [10:36:13<2596:00:55, 31.28s/it]training loss: 6.463e-03:   0%|          | 1197/300001 [10:36:45<2610:57:37, 31.46s/it]training loss: 6.463e-03:   0%|          | 1198/300001 [10:37:16<2622:25:29, 31.60s/it]training loss: 6.463e-03:   0%|          | 1199/300001 [10:37:49<2644:38:35, 31.86s/it]training loss: 6.463e-03:   0%|          | 1200/300001 [10:38:22<2666:13:43, 32.12s/it]training loss: 6.668e-03:   0%|          | 1200/300001 [10:38:52<2666:13:43, 32.12s/it]training loss: 6.668e-03:   0%|          | 1201/300001 [10:38:53<2635:08:10, 31.75s/it]training loss: 6.668e-03:   0%|          | 1202/300001 [10:39:25<2644:28:13, 31.86s/it]training loss: 6.668e-03:   0%|          | 1203/300001 [10:39:56<2641:00:30, 31.82s/it]training loss: 6.668e-03:   0%|          | 1204/300001 [10:40:28<2632:00:45, 31.71s/it]training loss: 6.668e-03:   0%|          | 1205/300001 [10:40:59<2620:29:04, 31.57s/it]training loss: 6.668e-03:   0%|          | 1206/300001 [10:41:31<2618:26:47, 31.55s/it]training loss: 6.668e-03:   0%|          | 1207/300001 [10:42:04<2661:05:37, 32.06s/it]training loss: 6.668e-03:   0%|          | 1208/300001 [10:42:34<2612:24:42, 31.48s/it]training loss: 6.668e-03:   0%|          | 1209/300001 [10:43:06<2630:19:20, 31.69s/it]training loss: 6.668e-03:   0%|          | 1210/300001 [10:43:38<2634:54:21, 31.75s/it]training loss: 6.668e-03:   0%|          | 1211/300001 [10:44:09<2621:52:30, 31.59s/it]training loss: 6.668e-03:   0%|          | 1212/300001 [10:44:41<2621:16:13, 31.58s/it]training loss: 6.668e-03:   0%|          | 1213/300001 [10:45:11<2595:18:12, 31.27s/it]training loss: 6.668e-03:   0%|          | 1214/300001 [10:45:42<2587:08:38, 31.17s/it]training loss: 6.668e-03:   0%|          | 1215/300001 [10:46:14<2612:11:56, 31.47s/it]training loss: 6.668e-03:   0%|          | 1216/300001 [10:46:46<2613:45:14, 31.49s/it]training loss: 6.668e-03:   0%|          | 1217/300001 [10:47:18<2623:44:31, 31.61s/it]training loss: 6.668e-03:   0%|          | 1218/300001 [10:47:50<2644:11:33, 31.86s/it]training loss: 6.668e-03:   0%|          | 1219/300001 [10:48:24<2685:27:22, 32.36s/it]training loss: 6.668e-03:   0%|          | 1220/300001 [10:48:55<2665:27:34, 32.12s/it]training loss: 6.024e-03:   0%|          | 1220/300001 [10:49:28<2665:27:34, 32.12s/it]training loss: 6.024e-03:   0%|          | 1221/300001 [10:49:28<2680:52:42, 32.30s/it]training loss: 6.024e-03:   0%|          | 1222/300001 [10:50:00<2679:36:45, 32.29s/it]training loss: 6.024e-03:   0%|          | 1223/300001 [10:50:31<2646:14:18, 31.88s/it]training loss: 6.024e-03:   0%|          | 1224/300001 [10:51:03<2647:25:46, 31.90s/it]training loss: 6.024e-03:   0%|          | 1225/300001 [10:51:36<2656:57:21, 32.01s/it]training loss: 6.024e-03:   0%|          | 1226/300001 [10:52:07<2647:15:17, 31.90s/it]training loss: 6.024e-03:   0%|          | 1227/300001 [10:52:38<2625:38:52, 31.64s/it]training loss: 6.024e-03:   0%|          | 1228/300001 [10:53:10<2631:27:34, 31.71s/it]training loss: 6.024e-03:   0%|          | 1229/300001 [10:53:42<2647:11:57, 31.90s/it]training loss: 6.024e-03:   0%|          | 1230/300001 [10:54:14<2628:05:57, 31.67s/it]training loss: 6.024e-03:   0%|          | 1231/300001 [10:54:45<2621:54:11, 31.59s/it]training loss: 6.024e-03:   0%|          | 1232/300001 [10:55:16<2611:15:02, 31.46s/it]training loss: 6.024e-03:   0%|          | 1233/300001 [10:55:47<2605:44:18, 31.40s/it]training loss: 6.024e-03:   0%|          | 1234/300001 [10:56:19<2604:19:27, 31.38s/it]training loss: 6.024e-03:   0%|          | 1235/300001 [10:56:50<2602:14:21, 31.36s/it]training loss: 6.024e-03:   0%|          | 1236/300001 [10:57:23<2630:54:27, 31.70s/it]training loss: 6.024e-03:   0%|          | 1237/300001 [10:57:54<2630:20:14, 31.69s/it]training loss: 6.024e-03:   0%|          | 1238/300001 [10:58:25<2611:02:07, 31.46s/it]training loss: 6.024e-03:   0%|          | 1239/300001 [10:58:57<2611:42:40, 31.47s/it]training loss: 6.024e-03:   0%|          | 1240/300001 [10:59:28<2598:26:58, 31.31s/it]training loss: 6.547e-03:   0%|          | 1240/300001 [11:00:00<2598:26:58, 31.31s/it]training loss: 6.547e-03:   0%|          | 1241/300001 [11:00:00<2618:23:06, 31.55s/it]training loss: 6.547e-03:   0%|          | 1242/300001 [11:00:31<2613:24:34, 31.49s/it]training loss: 6.547e-03:   0%|          | 1243/300001 [11:01:03<2615:48:17, 31.52s/it]training loss: 6.547e-03:   0%|          | 1244/300001 [11:01:34<2614:12:47, 31.50s/it]training loss: 6.547e-03:   0%|          | 1245/300001 [11:02:08<2665:59:05, 32.13s/it]training loss: 6.547e-03:   0%|          | 1246/300001 [11:02:40<2672:50:37, 32.21s/it]training loss: 6.547e-03:   0%|          | 1247/300001 [11:03:12<2657:22:09, 32.02s/it]training loss: 6.547e-03:   0%|          | 1248/300001 [11:03:43<2642:32:54, 31.84s/it]training loss: 6.547e-03:   0%|          | 1249/300001 [11:04:14<2624:06:38, 31.62s/it]training loss: 6.547e-03:   0%|          | 1250/300001 [11:04:46<2632:10:17, 31.72s/it]training loss: 6.547e-03:   0%|          | 1251/300001 [11:05:18<2625:52:28, 31.64s/it]training loss: 6.547e-03:   0%|          | 1252/300001 [11:05:50<2642:16:54, 31.84s/it]training loss: 6.547e-03:   0%|          | 1253/300001 [11:06:23<2666:06:42, 32.13s/it]training loss: 6.547e-03:   0%|          | 1254/300001 [11:06:54<2652:47:51, 31.97s/it]training loss: 6.547e-03:   0%|          | 1255/300001 [11:07:25<2629:41:33, 31.69s/it]training loss: 6.547e-03:   0%|          | 1256/300001 [11:07:48<2395:42:14, 28.87s/it]training loss: 6.547e-03:   0%|          | 1257/300001 [11:08:18<2444:31:54, 29.46s/it]training loss: 6.547e-03:   0%|          | 1258/300001 [11:08:51<2528:23:57, 30.47s/it]training loss: 6.547e-03:   0%|          | 1259/300001 [11:09:23<2557:37:17, 30.82s/it]training loss: 6.547e-03:   0%|          | 1260/300001 [11:09:55<2578:09:23, 31.07s/it]training loss: 7.577e-03:   0%|          | 1260/300001 [11:10:26<2578:09:23, 31.07s/it]training loss: 7.577e-03:   0%|          | 1261/300001 [11:10:26<2596:13:22, 31.29s/it]training loss: 7.577e-03:   0%|          | 1262/300001 [11:10:58<2602:54:40, 31.37s/it]training loss: 7.577e-03:   0%|          | 1263/300001 [11:11:29<2585:22:22, 31.16s/it]training loss: 7.577e-03:   0%|          | 1264/300001 [11:12:00<2600:48:53, 31.34s/it]training loss: 7.577e-03:   0%|          | 1265/300001 [11:12:32<2602:11:06, 31.36s/it]training loss: 7.577e-03:   0%|          | 1266/300001 [11:13:03<2603:27:37, 31.37s/it]training loss: 7.577e-03:   0%|          | 1267/300001 [11:13:34<2602:14:05, 31.36s/it]training loss: 7.577e-03:   0%|          | 1268/300001 [11:14:06<2602:53:06, 31.37s/it]training loss: 7.577e-03:   0%|          | 1269/300001 [11:14:38<2623:12:25, 31.61s/it]training loss: 7.577e-03:   0%|          | 1270/300001 [11:15:10<2638:35:33, 31.80s/it]training loss: 7.577e-03:   0%|          | 1271/300001 [11:15:42<2648:44:11, 31.92s/it]training loss: 7.577e-03:   0%|          | 1272/300001 [11:16:15<2656:21:56, 32.01s/it]training loss: 7.577e-03:   0%|          | 1273/300001 [11:16:46<2632:13:17, 31.72s/it]training loss: 7.577e-03:   0%|          | 1274/300001 [11:17:17<2627:37:31, 31.67s/it]training loss: 7.577e-03:   0%|          | 1275/300001 [11:17:49<2638:24:03, 31.80s/it]training loss: 7.577e-03:   0%|          | 1276/300001 [11:18:21<2638:53:26, 31.80s/it]training loss: 7.577e-03:   0%|          | 1277/300001 [11:18:53<2632:52:13, 31.73s/it]training loss: 7.577e-03:   0%|          | 1278/300001 [11:19:25<2642:08:24, 31.84s/it]training loss: 7.577e-03:   0%|          | 1279/300001 [11:19:57<2656:01:13, 32.01s/it]training loss: 7.577e-03:   0%|          | 1280/300001 [11:20:30<2679:01:11, 32.29s/it]training loss: 6.906e-03:   0%|          | 1280/300001 [11:21:02<2679:01:11, 32.29s/it]training loss: 6.906e-03:   0%|          | 1281/300001 [11:21:02<2677:09:16, 32.26s/it]training loss: 6.906e-03:   0%|          | 1282/300001 [11:21:35<2691:57:08, 32.44s/it]training loss: 6.906e-03:   0%|          | 1283/300001 [11:22:07<2678:39:30, 32.28s/it]training loss: 6.906e-03:   0%|          | 1284/300001 [11:22:39<2665:29:02, 32.12s/it]training loss: 6.906e-03:   0%|          | 1285/300001 [11:23:11<2663:35:47, 32.10s/it]training loss: 6.906e-03:   0%|          | 1286/300001 [11:23:43<2651:29:36, 31.95s/it]training loss: 6.906e-03:   0%|          | 1287/300001 [11:24:14<2637:41:22, 31.79s/it]training loss: 6.906e-03:   0%|          | 1288/300001 [11:24:46<2653:26:19, 31.98s/it]training loss: 6.906e-03:   0%|          | 1289/300001 [11:25:18<2649:30:00, 31.93s/it]training loss: 6.906e-03:   0%|          | 1290/300001 [11:25:51<2671:21:19, 32.19s/it]training loss: 6.906e-03:   0%|          | 1291/300001 [11:26:23<2667:57:14, 32.15s/it]training loss: 6.906e-03:   0%|          | 1292/300001 [11:26:54<2646:28:22, 31.89s/it]training loss: 6.906e-03:   0%|          | 1293/300001 [11:27:26<2628:50:32, 31.68s/it]training loss: 6.906e-03:   0%|          | 1294/300001 [11:27:57<2626:32:59, 31.66s/it]training loss: 6.906e-03:   0%|          | 1295/300001 [11:28:29<2631:49:08, 31.72s/it]training loss: 6.906e-03:   0%|          | 1296/300001 [11:29:00<2618:14:04, 31.56s/it]training loss: 6.906e-03:   0%|          | 1297/300001 [11:29:33<2639:00:33, 31.81s/it]training loss: 6.906e-03:   0%|          | 1298/300001 [11:30:05<2651:52:38, 31.96s/it]training loss: 6.906e-03:   0%|          | 1299/300001 [11:30:37<2656:39:59, 32.02s/it]training loss: 6.906e-03:   0%|          | 1300/300001 [11:31:09<2662:05:22, 32.08s/it]training loss: 6.712e-03:   0%|          | 1300/300001 [11:31:40<2662:05:22, 32.08s/it]training loss: 6.712e-03:   0%|          | 1301/300001 [11:31:40<2637:10:13, 31.78s/it]training loss: 6.712e-03:   0%|          | 1302/300001 [11:32:11<2612:41:02, 31.49s/it]training loss: 6.712e-03:   0%|          | 1303/300001 [11:32:42<2597:12:50, 31.30s/it]training loss: 6.712e-03:   0%|          | 1304/300001 [11:33:13<2596:30:47, 31.29s/it]training loss: 6.712e-03:   0%|          | 1305/300001 [11:33:45<2607:09:53, 31.42s/it]training loss: 6.712e-03:   0%|          | 1306/300001 [11:34:18<2633:15:12, 31.74s/it]training loss: 6.712e-03:   0%|          | 1307/300001 [11:34:51<2669:52:48, 32.18s/it]training loss: 6.712e-03:   0%|          | 1308/300001 [11:35:23<2660:57:02, 32.07s/it]training loss: 6.712e-03:   0%|          | 1309/300001 [11:35:55<2676:23:16, 32.26s/it]training loss: 6.712e-03:   0%|          | 1310/300001 [11:36:26<2647:17:11, 31.91s/it]training loss: 6.712e-03:   0%|          | 1311/300001 [11:36:59<2661:58:12, 32.08s/it]training loss: 6.712e-03:   0%|          | 1312/300001 [11:37:31<2659:02:50, 32.05s/it]training loss: 6.712e-03:   0%|          | 1313/300001 [11:38:02<2643:32:15, 31.86s/it]training loss: 6.712e-03:   0%|          | 1314/300001 [11:38:33<2625:16:16, 31.64s/it]training loss: 6.712e-03:   0%|          | 1315/300001 [11:39:06<2642:20:23, 31.85s/it]training loss: 6.712e-03:   0%|          | 1316/300001 [11:39:38<2642:47:01, 31.85s/it]training loss: 6.712e-03:   0%|          | 1317/300001 [11:40:08<2620:13:34, 31.58s/it]training loss: 6.712e-03:   0%|          | 1318/300001 [11:40:40<2621:23:06, 31.60s/it]training loss: 6.712e-03:   0%|          | 1319/300001 [11:41:12<2634:22:49, 31.75s/it]training loss: 6.712e-03:   0%|          | 1320/300001 [11:41:44<2639:17:19, 31.81s/it]training loss: 5.921e-03:   0%|          | 1320/300001 [11:42:17<2639:17:19, 31.81s/it]training loss: 5.921e-03:   0%|          | 1321/300001 [11:42:17<2658:25:48, 32.04s/it]training loss: 5.921e-03:   0%|          | 1322/300001 [11:42:49<2653:43:28, 31.99s/it]training loss: 5.921e-03:   0%|          | 1323/300001 [11:43:22<2694:18:54, 32.47s/it]training loss: 5.921e-03:   0%|          | 1324/300001 [11:43:54<2666:37:42, 32.14s/it]training loss: 5.921e-03:   0%|          | 1325/300001 [11:44:25<2654:18:59, 31.99s/it]training loss: 5.921e-03:   0%|          | 1326/300001 [11:44:57<2638:19:45, 31.80s/it]training loss: 5.921e-03:   0%|          | 1327/300001 [11:45:28<2633:05:00, 31.74s/it]training loss: 5.921e-03:   0%|          | 1328/300001 [11:46:00<2646:47:22, 31.90s/it]training loss: 5.921e-03:   0%|          | 1329/300001 [11:46:32<2627:33:53, 31.67s/it]training loss: 5.921e-03:   0%|          | 1330/300001 [11:47:03<2628:55:07, 31.69s/it]training loss: 5.921e-03:   0%|          | 1331/300001 [11:47:36<2657:22:57, 32.03s/it]training loss: 5.921e-03:   0%|          | 1332/300001 [11:48:08<2650:54:52, 31.95s/it]training loss: 5.921e-03:   0%|          | 1333/300001 [11:48:39<2623:28:06, 31.62s/it]training loss: 5.921e-03:   0%|          | 1334/300001 [11:49:11<2645:01:06, 31.88s/it]training loss: 5.921e-03:   0%|          | 1335/300001 [11:49:43<2635:59:05, 31.77s/it]training loss: 5.921e-03:   0%|          | 1336/300001 [11:50:13<2604:15:38, 31.39s/it]training loss: 5.921e-03:   0%|          | 1337/300001 [11:50:44<2596:42:26, 31.30s/it]training loss: 5.921e-03:   0%|          | 1338/300001 [11:51:16<2610:26:12, 31.47s/it]training loss: 5.921e-03:   0%|          | 1339/300001 [11:51:48<2607:44:39, 31.43s/it]training loss: 5.921e-03:   0%|          | 1340/300001 [11:52:20<2630:11:29, 31.70s/it]training loss: 6.701e-03:   0%|          | 1340/300001 [11:52:51<2630:11:29, 31.70s/it]training loss: 6.701e-03:   0%|          | 1341/300001 [11:52:51<2616:05:05, 31.53s/it]training loss: 6.701e-03:   0%|          | 1342/300001 [11:53:24<2639:56:37, 31.82s/it]training loss: 6.701e-03:   0%|          | 1343/300001 [11:53:55<2639:25:56, 31.82s/it]training loss: 6.701e-03:   0%|          | 1344/300001 [11:54:27<2637:47:23, 31.80s/it]training loss: 6.701e-03:   0%|          | 1345/300001 [11:54:58<2618:52:24, 31.57s/it]training loss: 6.701e-03:   0%|          | 1346/300001 [11:55:30<2626:46:52, 31.66s/it]training loss: 6.701e-03:   0%|          | 1347/300001 [11:56:02<2638:54:22, 31.81s/it]training loss: 6.701e-03:   0%|          | 1348/300001 [11:56:34<2642:10:55, 31.85s/it]training loss: 6.701e-03:   0%|          | 1349/300001 [11:57:07<2669:03:14, 32.17s/it]training loss: 6.701e-03:   0%|          | 1350/300001 [11:57:38<2646:20:00, 31.90s/it]training loss: 6.701e-03:   0%|          | 1351/300001 [11:58:10<2641:25:31, 31.84s/it]training loss: 6.701e-03:   0%|          | 1352/300001 [11:58:42<2647:31:40, 31.91s/it]training loss: 6.701e-03:   0%|          | 1353/300001 [11:59:14<2658:22:52, 32.04s/it]training loss: 6.701e-03:   0%|          | 1354/300001 [11:59:46<2646:31:37, 31.90s/it]training loss: 6.701e-03:   0%|          | 1355/300001 [12:00:16<2607:15:10, 31.43s/it]training loss: 6.701e-03:   0%|          | 1356/300001 [12:00:48<2605:29:18, 31.41s/it]training loss: 6.701e-03:   0%|          | 1357/300001 [12:01:20<2622:56:49, 31.62s/it]training loss: 6.701e-03:   0%|          | 1358/300001 [12:01:52<2625:23:13, 31.65s/it]training loss: 6.701e-03:   0%|          | 1359/300001 [12:02:22<2600:21:43, 31.35s/it]training loss: 6.701e-03:   0%|          | 1360/300001 [12:02:55<2629:13:29, 31.69s/it]training loss: 5.809e-03:   0%|          | 1360/300001 [12:03:27<2629:13:29, 31.69s/it]training loss: 5.809e-03:   0%|          | 1361/300001 [12:03:28<2658:34:19, 32.05s/it]training loss: 5.809e-03:   0%|          | 1362/300001 [12:04:00<2680:09:07, 32.31s/it]training loss: 5.809e-03:   0%|          | 1363/300001 [12:04:31<2635:31:55, 31.77s/it]training loss: 5.809e-03:   0%|          | 1364/300001 [12:05:02<2613:10:11, 31.50s/it]training loss: 5.809e-03:   0%|          | 1365/300001 [12:05:34<2634:49:09, 31.76s/it]training loss: 5.809e-03:   0%|          | 1366/300001 [12:06:06<2643:49:40, 31.87s/it]training loss: 5.809e-03:   0%|          | 1367/300001 [12:06:38<2644:11:50, 31.88s/it]training loss: 5.809e-03:   0%|          | 1368/300001 [12:07:10<2648:09:04, 31.92s/it]training loss: 5.809e-03:   0%|          | 1369/300001 [12:07:41<2622:33:59, 31.61s/it]training loss: 5.809e-03:   0%|          | 1370/300001 [12:08:13<2636:20:55, 31.78s/it]training loss: 5.809e-03:   0%|          | 1371/300001 [12:08:46<2651:24:45, 31.96s/it]training loss: 5.809e-03:   0%|          | 1372/300001 [12:09:17<2635:52:02, 31.78s/it]training loss: 5.809e-03:   0%|          | 1373/300001 [12:09:49<2642:28:08, 31.86s/it]training loss: 5.809e-03:   0%|          | 1374/300001 [12:10:21<2639:54:34, 31.82s/it]training loss: 5.809e-03:   0%|          | 1375/300001 [12:10:53<2646:15:55, 31.90s/it]training loss: 5.809e-03:   0%|          | 1376/300001 [12:11:25<2649:33:16, 31.94s/it]training loss: 5.809e-03:   0%|          | 1377/300001 [12:11:57<2657:57:17, 32.04s/it]training loss: 5.809e-03:   0%|          | 1378/300001 [12:12:29<2645:54:55, 31.90s/it]training loss: 5.809e-03:   0%|          | 1379/300001 [12:13:01<2644:01:33, 31.87s/it]training loss: 5.809e-03:   0%|          | 1380/300001 [12:13:33<2649:52:29, 31.95s/it]training loss: 6.069e-03:   0%|          | 1380/300001 [12:14:04<2649:52:29, 31.95s/it]training loss: 6.069e-03:   0%|          | 1381/300001 [12:14:05<2645:50:37, 31.90s/it]training loss: 6.069e-03:   0%|          | 1382/300001 [12:14:36<2635:00:12, 31.77s/it]training loss: 6.069e-03:   0%|          | 1383/300001 [12:15:08<2646:35:02, 31.91s/it]training loss: 6.069e-03:   0%|          | 1384/300001 [12:15:39<2629:59:24, 31.71s/it]training loss: 6.069e-03:   0%|          | 1385/300001 [12:16:11<2619:04:00, 31.57s/it]training loss: 6.069e-03:   0%|          | 1386/300001 [12:16:42<2601:35:00, 31.36s/it]training loss: 6.069e-03:   0%|          | 1387/300001 [12:17:13<2612:25:44, 31.49s/it]training loss: 6.069e-03:   0%|          | 1388/300001 [12:17:47<2662:12:57, 32.09s/it]training loss: 6.069e-03:   0%|          | 1389/300001 [12:18:19<2657:30:35, 32.04s/it]training loss: 6.069e-03:   0%|          | 1390/300001 [12:18:51<2650:11:32, 31.95s/it]training loss: 6.069e-03:   0%|          | 1391/300001 [12:19:23<2656:21:31, 32.02s/it]training loss: 6.069e-03:   0%|          | 1392/300001 [12:19:54<2627:28:00, 31.68s/it]training loss: 6.069e-03:   0%|          | 1393/300001 [12:20:25<2629:42:27, 31.70s/it]training loss: 6.069e-03:   0%|          | 1394/300001 [12:20:58<2642:45:28, 31.86s/it]training loss: 6.069e-03:   0%|          | 1395/300001 [12:21:30<2653:26:22, 31.99s/it]training loss: 6.069e-03:   0%|          | 1396/300001 [12:22:03<2686:27:02, 32.39s/it]training loss: 6.069e-03:   0%|          | 1397/300001 [12:22:36<2703:16:21, 32.59s/it]training loss: 6.069e-03:   0%|          | 1398/300001 [12:23:09<2695:27:33, 32.50s/it]training loss: 6.069e-03:   0%|          | 1399/300001 [12:23:41<2692:23:53, 32.46s/it]training loss: 6.069e-03:   0%|          | 1400/300001 [12:24:13<2683:36:10, 32.35s/it]training loss: 6.451e-03:   0%|          | 1400/300001 [12:24:45<2683:36:10, 32.35s/it]training loss: 6.451e-03:   0%|          | 1401/300001 [12:24:45<2680:20:47, 32.31s/it]training loss: 6.451e-03:   0%|          | 1402/300001 [12:25:17<2672:32:07, 32.22s/it]training loss: 6.451e-03:   0%|          | 1403/300001 [12:25:49<2666:19:49, 32.15s/it]training loss: 6.451e-03:   0%|          | 1404/300001 [12:26:20<2635:40:58, 31.78s/it]training loss: 6.451e-03:   0%|          | 1405/300001 [12:26:51<2619:02:57, 31.58s/it]training loss: 6.451e-03:   0%|          | 1406/300001 [12:27:23<2622:17:57, 31.62s/it]training loss: 6.451e-03:   0%|          | 1407/300001 [12:27:54<2616:42:48, 31.55s/it]training loss: 6.451e-03:   0%|          | 1408/300001 [12:28:26<2616:37:11, 31.55s/it]training loss: 6.451e-03:   0%|          | 1409/300001 [12:28:57<2600:44:44, 31.36s/it]training loss: 6.451e-03:   0%|          | 1410/300001 [12:29:28<2586:19:10, 31.18s/it]training loss: 6.451e-03:   0%|          | 1411/300001 [12:29:59<2598:52:01, 31.33s/it]training loss: 6.451e-03:   0%|          | 1412/300001 [12:30:30<2577:16:29, 31.07s/it]training loss: 6.451e-03:   0%|          | 1413/300001 [12:30:52<2353:43:47, 28.38s/it]training loss: 6.451e-03:   0%|          | 1414/300001 [12:31:24<2448:23:52, 29.52s/it]training loss: 6.451e-03:   0%|          | 1415/300001 [12:31:55<2473:49:05, 29.83s/it]training loss: 6.451e-03:   0%|          | 1416/300001 [12:32:27<2541:33:49, 30.64s/it]training loss: 6.451e-03:   0%|          | 1417/300001 [12:32:58<2556:05:44, 30.82s/it]training loss: 6.451e-03:   0%|          | 1418/300001 [12:33:29<2561:59:14, 30.89s/it]training loss: 6.451e-03:   0%|          | 1419/300001 [12:34:01<2581:12:24, 31.12s/it]training loss: 6.451e-03:   0%|          | 1420/300001 [12:34:34<2616:54:56, 31.55s/it]training loss: 6.580e-03:   0%|          | 1420/300001 [12:35:05<2616:54:56, 31.55s/it]training loss: 6.580e-03:   0%|          | 1421/300001 [12:35:05<2608:25:33, 31.45s/it]training loss: 6.580e-03:   0%|          | 1422/300001 [12:35:36<2601:39:18, 31.37s/it]training loss: 6.580e-03:   0%|          | 1423/300001 [12:36:08<2614:41:48, 31.53s/it]training loss: 6.580e-03:   0%|          | 1424/300001 [12:36:40<2617:02:25, 31.55s/it]training loss: 6.580e-03:   0%|          | 1425/300001 [12:37:12<2639:06:57, 31.82s/it]training loss: 6.580e-03:   0%|          | 1426/300001 [12:37:44<2646:49:33, 31.91s/it]training loss: 6.580e-03:   0%|          | 1427/300001 [12:38:16<2645:29:48, 31.90s/it]training loss: 6.580e-03:   0%|          | 1428/300001 [12:38:48<2660:14:21, 32.08s/it]training loss: 6.580e-03:   0%|          | 1429/300001 [12:39:20<2646:13:42, 31.91s/it]training loss: 6.580e-03:   0%|          | 1430/300001 [12:39:51<2628:38:50, 31.69s/it]training loss: 6.580e-03:   0%|          | 1431/300001 [12:40:23<2641:46:14, 31.85s/it]training loss: 6.580e-03:   0%|          | 1432/300001 [12:40:54<2599:49:34, 31.35s/it]training loss: 6.580e-03:   0%|          | 1433/300001 [12:41:25<2595:15:45, 31.29s/it]training loss: 6.580e-03:   0%|          | 1434/300001 [12:41:56<2599:26:26, 31.34s/it]training loss: 6.580e-03:   0%|          | 1435/300001 [12:42:29<2625:57:32, 31.66s/it]training loss: 6.580e-03:   0%|          | 1436/300001 [12:43:00<2609:36:30, 31.47s/it]training loss: 6.580e-03:   0%|          | 1437/300001 [12:43:31<2615:17:55, 31.53s/it]training loss: 6.580e-03:   0%|          | 1438/300001 [12:44:03<2613:38:25, 31.51s/it]training loss: 6.580e-03:   0%|          | 1439/300001 [12:44:34<2610:47:16, 31.48s/it]training loss: 6.580e-03:   0%|          | 1440/300001 [12:45:05<2599:33:36, 31.35s/it]training loss: 5.666e-03:   0%|          | 1440/300001 [12:45:36<2599:33:36, 31.35s/it]training loss: 5.666e-03:   0%|          | 1441/300001 [12:45:36<2598:13:36, 31.33s/it]training loss: 5.666e-03:   0%|          | 1442/300001 [12:46:09<2625:43:08, 31.66s/it]training loss: 5.666e-03:   0%|          | 1443/300001 [12:46:41<2626:30:04, 31.67s/it]training loss: 5.666e-03:   0%|          | 1444/300001 [12:47:13<2639:14:49, 31.82s/it]training loss: 5.666e-03:   0%|          | 1445/300001 [12:47:44<2628:22:49, 31.69s/it]training loss: 5.666e-03:   0%|          | 1446/300001 [12:48:16<2634:30:03, 31.77s/it]training loss: 5.666e-03:   0%|          | 1447/300001 [12:48:48<2644:31:52, 31.89s/it]training loss: 5.666e-03:   0%|          | 1448/300001 [12:49:20<2632:07:38, 31.74s/it]training loss: 5.666e-03:   0%|          | 1449/300001 [12:49:51<2614:54:11, 31.53s/it]training loss: 5.666e-03:   0%|          | 1450/300001 [12:50:23<2632:50:28, 31.75s/it]training loss: 5.666e-03:   0%|          | 1451/300001 [12:50:56<2658:19:34, 32.05s/it]training loss: 5.666e-03:   0%|          | 1452/300001 [12:51:26<2625:31:41, 31.66s/it]training loss: 5.666e-03:   0%|          | 1453/300001 [12:51:58<2617:41:22, 31.57s/it]training loss: 5.666e-03:   0%|          | 1454/300001 [12:52:29<2609:22:32, 31.46s/it]training loss: 5.666e-03:   0%|          | 1455/300001 [12:53:02<2646:01:58, 31.91s/it]training loss: 5.666e-03:   0%|          | 1456/300001 [12:53:33<2620:15:17, 31.60s/it]training loss: 5.666e-03:   0%|          | 1457/300001 [12:54:06<2655:32:56, 32.02s/it]training loss: 5.666e-03:   0%|          | 1458/300001 [12:54:39<2672:37:27, 32.23s/it]training loss: 5.666e-03:   0%|          | 1459/300001 [12:55:09<2629:50:21, 31.71s/it]training loss: 5.666e-03:   0%|          | 1460/300001 [12:55:41<2624:23:54, 31.65s/it]training loss: 6.650e-03:   0%|          | 1460/300001 [12:56:12<2624:23:54, 31.65s/it]training loss: 6.650e-03:   0%|          | 1461/300001 [12:56:13<2634:28:36, 31.77s/it]training loss: 6.650e-03:   0%|          | 1462/300001 [12:56:44<2621:18:30, 31.61s/it]training loss: 6.650e-03:   0%|          | 1463/300001 [12:57:16<2630:41:12, 31.72s/it]training loss: 6.650e-03:   0%|          | 1464/300001 [12:57:49<2665:22:31, 32.14s/it]training loss: 6.650e-03:   0%|          | 1465/300001 [12:58:20<2640:25:43, 31.84s/it]training loss: 6.650e-03:   0%|          | 1466/300001 [12:58:52<2631:09:41, 31.73s/it]training loss: 6.650e-03:   0%|          | 1467/300001 [12:59:23<2630:51:24, 31.73s/it]training loss: 6.650e-03:   0%|          | 1468/300001 [12:59:55<2634:13:07, 31.77s/it]training loss: 6.650e-03:   0%|          | 1469/300001 [13:00:27<2625:01:03, 31.66s/it]training loss: 6.650e-03:   0%|          | 1470/300001 [13:00:58<2621:16:07, 31.61s/it]training loss: 6.650e-03:   0%|          | 1471/300001 [13:01:29<2609:58:32, 31.47s/it]training loss: 6.650e-03:   0%|          | 1472/300001 [13:02:02<2634:44:47, 31.77s/it]training loss: 6.650e-03:   0%|          | 1473/300001 [13:02:33<2631:12:48, 31.73s/it]training loss: 6.650e-03:   0%|          | 1474/300001 [13:03:04<2605:25:17, 31.42s/it]training loss: 6.650e-03:   0%|          | 1475/300001 [13:03:37<2638:08:07, 31.81s/it]training loss: 6.650e-03:   0%|          | 1476/300001 [13:04:09<2655:33:23, 32.02s/it]training loss: 6.650e-03:   0%|          | 1477/300001 [13:04:41<2657:39:14, 32.05s/it]training loss: 6.650e-03:   0%|          | 1478/300001 [13:05:14<2677:15:05, 32.29s/it]training loss: 6.650e-03:   0%|          | 1479/300001 [13:05:46<2659:01:44, 32.07s/it]training loss: 6.650e-03:   0%|          | 1480/300001 [13:06:17<2630:23:33, 31.72s/it]training loss: 6.931e-03:   0%|          | 1480/300001 [13:06:48<2630:23:33, 31.72s/it]training loss: 6.931e-03:   0%|          | 1481/300001 [13:06:48<2615:04:49, 31.54s/it]training loss: 6.931e-03:   0%|          | 1482/300001 [13:07:19<2618:51:39, 31.58s/it]training loss: 6.931e-03:   0%|          | 1483/300001 [13:07:52<2646:59:00, 31.92s/it]training loss: 6.931e-03:   0%|          | 1484/300001 [13:08:23<2631:10:24, 31.73s/it]training loss: 6.931e-03:   0%|          | 1485/300001 [13:08:56<2659:08:10, 32.07s/it]training loss: 6.931e-03:   0%|          | 1486/300001 [13:09:29<2669:32:05, 32.19s/it]training loss: 6.931e-03:   0%|          | 1487/300001 [13:10:01<2657:30:14, 32.05s/it]training loss: 6.931e-03:   0%|          | 1488/300001 [13:10:33<2658:24:03, 32.06s/it]training loss: 6.931e-03:   0%|          | 1489/300001 [13:11:04<2643:16:43, 31.88s/it]training loss: 6.931e-03:   0%|          | 1490/300001 [13:11:36<2651:21:27, 31.97s/it]training loss: 6.931e-03:   0%|          | 1491/300001 [13:12:07<2631:59:07, 31.74s/it]training loss: 6.931e-03:   0%|          | 1492/300001 [13:12:40<2658:16:13, 32.06s/it]training loss: 6.931e-03:   0%|          | 1493/300001 [13:13:12<2660:07:10, 32.08s/it]training loss: 6.931e-03:   0%|          | 1494/300001 [13:13:46<2691:53:21, 32.46s/it]training loss: 6.931e-03:   0%|          | 1495/300001 [13:14:18<2687:19:16, 32.41s/it]training loss: 6.931e-03:   0%|          | 1496/300001 [13:14:50<2665:42:14, 32.15s/it]training loss: 6.931e-03:   0%|          | 1497/300001 [13:15:22<2670:38:19, 32.21s/it]training loss: 6.931e-03:   0%|          | 1498/300001 [13:15:56<2727:58:47, 32.90s/it]training loss: 6.931e-03:   0%|          | 1499/300001 [13:16:28<2684:56:24, 32.38s/it]training loss: 6.931e-03:   0%|          | 1500/300001 [13:16:58<2645:49:34, 31.91s/it]training loss: 6.019e-03:   0%|          | 1500/300001 [13:17:30<2645:49:34, 31.91s/it]training loss: 6.019e-03:   1%|          | 1501/300001 [13:17:34<2733:42:14, 32.97s/it]training loss: 6.019e-03:   1%|          | 1502/300001 [13:18:05<2695:13:12, 32.51s/it]training loss: 6.019e-03:   1%|          | 1503/300001 [13:18:37<2668:44:21, 32.19s/it]training loss: 6.019e-03:   1%|          | 1504/300001 [13:19:08<2656:32:20, 32.04s/it]training loss: 6.019e-03:   1%|          | 1505/300001 [13:19:40<2655:31:09, 32.03s/it]training loss: 6.019e-03:   1%|          | 1506/300001 [13:20:12<2652:27:54, 31.99s/it]training loss: 6.019e-03:   1%|          | 1507/300001 [13:20:45<2658:22:56, 32.06s/it]training loss: 6.019e-03:   1%|          | 1508/300001 [13:21:16<2637:29:59, 31.81s/it]training loss: 6.019e-03:   1%|          | 1509/300001 [13:21:47<2613:07:56, 31.52s/it]training loss: 6.019e-03:   1%|          | 1510/300001 [13:22:19<2637:31:47, 31.81s/it]training loss: 6.019e-03:   1%|          | 1511/300001 [13:22:51<2633:26:10, 31.76s/it]training loss: 6.019e-03:   1%|          | 1512/300001 [13:23:22<2617:39:05, 31.57s/it]training loss: 6.019e-03:   1%|          | 1513/300001 [13:23:55<2651:38:56, 31.98s/it]training loss: 6.019e-03:   1%|          | 1514/300001 [13:24:28<2686:38:41, 32.40s/it]training loss: 6.019e-03:   1%|          | 1515/300001 [13:25:00<2670:06:10, 32.20s/it]training loss: 6.019e-03:   1%|          | 1516/300001 [13:25:31<2652:32:09, 31.99s/it]training loss: 6.019e-03:   1%|          | 1517/300001 [13:26:02<2624:01:39, 31.65s/it]training loss: 6.019e-03:   1%|          | 1518/300001 [13:26:34<2615:03:53, 31.54s/it]training loss: 6.019e-03:   1%|          | 1519/300001 [13:27:06<2645:24:34, 31.91s/it]training loss: 6.019e-03:   1%|          | 1520/300001 [13:27:37<2610:25:15, 31.48s/it]training loss: 5.791e-03:   1%|          | 1520/300001 [13:28:08<2610:25:15, 31.48s/it]training loss: 5.791e-03:   1%|          | 1521/300001 [13:28:09<2617:14:05, 31.57s/it]training loss: 5.791e-03:   1%|          | 1522/300001 [13:28:40<2619:33:17, 31.59s/it]training loss: 5.791e-03:   1%|          | 1523/300001 [13:29:11<2608:36:11, 31.46s/it]training loss: 5.791e-03:   1%|          | 1524/300001 [13:29:44<2624:41:38, 31.66s/it]training loss: 5.791e-03:   1%|          | 1525/300001 [13:30:17<2678:31:33, 32.31s/it]training loss: 5.791e-03:   1%|          | 1526/300001 [13:30:49<2659:10:15, 32.07s/it]training loss: 5.791e-03:   1%|          | 1527/300001 [13:31:21<2654:18:40, 32.01s/it]training loss: 5.791e-03:   1%|          | 1528/300001 [13:31:56<2724:18:21, 32.86s/it]training loss: 5.791e-03:   1%|          | 1529/300001 [13:32:27<2692:24:49, 32.47s/it]training loss: 5.791e-03:   1%|          | 1530/300001 [13:32:59<2687:57:19, 32.42s/it]training loss: 5.791e-03:   1%|          | 1531/300001 [13:33:31<2672:39:20, 32.24s/it]training loss: 5.791e-03:   1%|          | 1532/300001 [13:34:04<2673:36:27, 32.25s/it]training loss: 5.791e-03:   1%|          | 1533/300001 [13:34:35<2658:41:33, 32.07s/it]training loss: 5.791e-03:   1%|          | 1534/300001 [13:35:07<2654:04:28, 32.01s/it]training loss: 5.791e-03:   1%|          | 1535/300001 [13:35:39<2649:47:02, 31.96s/it]training loss: 5.791e-03:   1%|          | 1536/300001 [13:36:10<2631:20:12, 31.74s/it]training loss: 5.791e-03:   1%|          | 1537/300001 [13:36:43<2656:11:01, 32.04s/it]training loss: 5.791e-03:   1%|          | 1538/300001 [13:37:14<2632:29:59, 31.75s/it]training loss: 5.791e-03:   1%|          | 1539/300001 [13:37:46<2634:50:52, 31.78s/it]training loss: 5.791e-03:   1%|          | 1540/300001 [13:38:17<2630:37:13, 31.73s/it]training loss: 6.179e-03:   1%|          | 1540/300001 [13:38:48<2630:37:13, 31.73s/it]training loss: 6.179e-03:   1%|          | 1541/300001 [13:38:48<2605:57:41, 31.43s/it]training loss: 6.179e-03:   1%|          | 1542/300001 [13:39:22<2662:40:06, 32.12s/it]training loss: 6.179e-03:   1%|          | 1543/300001 [13:39:55<2691:05:20, 32.46s/it]training loss: 6.179e-03:   1%|          | 1544/300001 [13:40:27<2679:47:25, 32.32s/it]training loss: 6.179e-03:   1%|          | 1545/300001 [13:41:01<2710:58:59, 32.70s/it]training loss: 6.179e-03:   1%|          | 1546/300001 [13:41:33<2692:07:18, 32.47s/it]training loss: 6.179e-03:   1%|          | 1547/300001 [13:42:04<2672:22:56, 32.23s/it]training loss: 6.179e-03:   1%|          | 1548/300001 [13:42:36<2655:38:16, 32.03s/it]training loss: 6.179e-03:   1%|          | 1549/300001 [13:43:07<2638:07:14, 31.82s/it]training loss: 6.179e-03:   1%|          | 1550/300001 [13:43:39<2630:07:10, 31.73s/it]training loss: 6.179e-03:   1%|          | 1551/300001 [13:44:10<2612:36:33, 31.51s/it]training loss: 6.179e-03:   1%|          | 1552/300001 [13:44:42<2632:19:00, 31.75s/it]training loss: 6.179e-03:   1%|          | 1553/300001 [13:45:14<2633:38:56, 31.77s/it]training loss: 6.179e-03:   1%|          | 1554/300001 [13:45:46<2639:53:18, 31.84s/it]training loss: 6.179e-03:   1%|          | 1555/300001 [13:46:18<2636:43:02, 31.81s/it]training loss: 6.179e-03:   1%|          | 1556/300001 [13:46:51<2666:36:43, 32.17s/it]training loss: 6.179e-03:   1%|          | 1557/300001 [13:47:22<2637:08:46, 31.81s/it]training loss: 6.179e-03:   1%|          | 1558/300001 [13:47:53<2625:23:27, 31.67s/it]training loss: 6.179e-03:   1%|          | 1559/300001 [13:48:25<2632:32:05, 31.76s/it]training loss: 6.179e-03:   1%|          | 1560/300001 [13:48:57<2650:48:40, 31.98s/it]training loss: 7.058e-03:   1%|          | 1560/300001 [13:49:30<2650:48:40, 31.98s/it]training loss: 7.058e-03:   1%|          | 1561/300001 [13:49:30<2667:12:46, 32.17s/it]training loss: 7.058e-03:   1%|          | 1562/300001 [13:50:03<2688:48:25, 32.43s/it]training loss: 7.058e-03:   1%|          | 1563/300001 [13:50:35<2674:17:05, 32.26s/it]training loss: 7.058e-03:   1%|          | 1564/300001 [13:51:07<2677:09:33, 32.29s/it]training loss: 7.058e-03:   1%|          | 1565/300001 [13:51:38<2643:54:58, 31.89s/it]training loss: 7.058e-03:   1%|          | 1566/300001 [13:52:10<2637:19:16, 31.81s/it]training loss: 7.058e-03:   1%|          | 1567/300001 [13:52:41<2626:11:48, 31.68s/it]training loss: 7.058e-03:   1%|          | 1568/300001 [13:53:12<2605:51:13, 31.43s/it]training loss: 7.058e-03:   1%|          | 1569/300001 [13:53:43<2605:23:56, 31.43s/it]training loss: 7.058e-03:   1%|          | 1570/300001 [13:54:07<2397:04:37, 28.92s/it]training loss: 7.058e-03:   1%|          | 1571/300001 [13:54:40<2498:05:47, 30.13s/it]training loss: 7.058e-03:   1%|          | 1572/300001 [13:55:12<2555:36:36, 30.83s/it]training loss: 7.058e-03:   1%|          | 1573/300001 [13:55:45<2617:15:00, 31.57s/it]training loss: 7.058e-03:   1%|          | 1574/300001 [13:56:17<2632:42:51, 31.76s/it]training loss: 7.058e-03:   1%|          | 1575/300001 [13:56:49<2639:10:24, 31.84s/it]training loss: 7.058e-03:   1%|          | 1576/300001 [13:57:21<2620:07:20, 31.61s/it]training loss: 7.058e-03:   1%|          | 1577/300001 [13:57:51<2603:23:41, 31.41s/it]training loss: 7.058e-03:   1%|          | 1578/300001 [13:58:25<2651:42:37, 31.99s/it]training loss: 7.058e-03:   1%|          | 1579/300001 [13:58:57<2646:00:26, 31.92s/it]training loss: 7.058e-03:   1%|          | 1580/300001 [13:59:28<2635:31:53, 31.79s/it]training loss: 6.672e-03:   1%|          | 1580/300001 [14:00:00<2635:31:53, 31.79s/it]training loss: 6.672e-03:   1%|          | 1581/300001 [14:00:00<2643:22:32, 31.89s/it]training loss: 6.672e-03:   1%|          | 1582/300001 [14:00:32<2647:59:46, 31.94s/it]training loss: 6.672e-03:   1%|          | 1583/300001 [14:01:04<2642:44:20, 31.88s/it]training loss: 6.672e-03:   1%|          | 1584/300001 [14:01:36<2634:13:57, 31.78s/it]training loss: 6.672e-03:   1%|          | 1585/300001 [14:02:08<2648:40:00, 31.95s/it]training loss: 6.672e-03:   1%|          | 1586/300001 [14:02:39<2628:29:38, 31.71s/it]training loss: 6.672e-03:   1%|          | 1587/300001 [14:03:10<2610:36:32, 31.49s/it]training loss: 6.672e-03:   1%|          | 1588/300001 [14:03:41<2608:58:22, 31.47s/it]training loss: 6.672e-03:   1%|          | 1589/300001 [14:04:14<2638:14:30, 31.83s/it]training loss: 6.672e-03:   1%|          | 1590/300001 [14:04:46<2641:59:16, 31.87s/it]training loss: 6.672e-03:   1%|          | 1591/300001 [14:05:18<2638:26:33, 31.83s/it]training loss: 6.672e-03:   1%|          | 1592/300001 [14:05:51<2666:44:39, 32.17s/it]training loss: 6.672e-03:   1%|          | 1593/300001 [14:06:23<2668:26:10, 32.19s/it]training loss: 6.672e-03:   1%|          | 1594/300001 [14:06:56<2679:39:22, 32.33s/it]training loss: 6.672e-03:   1%|          | 1595/300001 [14:07:27<2659:55:18, 32.09s/it]training loss: 6.672e-03:   1%|          | 1596/300001 [14:07:58<2631:46:20, 31.75s/it]training loss: 6.672e-03:   1%|          | 1597/300001 [14:08:30<2629:25:41, 31.72s/it]training loss: 6.672e-03:   1%|          | 1598/300001 [14:09:03<2655:12:48, 32.03s/it]training loss: 6.672e-03:   1%|          | 1599/300001 [14:09:34<2632:09:09, 31.75s/it]training loss: 6.672e-03:   1%|          | 1600/300001 [14:10:07<2663:19:11, 32.13s/it]training loss: 5.567e-03:   1%|          | 1600/300001 [14:10:38<2663:19:11, 32.13s/it]training loss: 5.567e-03:   1%|          | 1601/300001 [14:10:38<2646:13:19, 31.92s/it]training loss: 5.567e-03:   1%|          | 1602/300001 [14:11:10<2653:39:54, 32.01s/it]training loss: 5.567e-03:   1%|          | 1603/300001 [14:11:43<2659:41:50, 32.09s/it]training loss: 5.567e-03:   1%|          | 1604/300001 [14:12:14<2648:02:23, 31.95s/it]training loss: 5.567e-03:   1%|          | 1605/300001 [14:12:45<2621:00:58, 31.62s/it]training loss: 5.567e-03:   1%|          | 1606/300001 [14:13:17<2625:23:36, 31.67s/it]training loss: 5.567e-03:   1%|          | 1607/300001 [14:13:50<2651:32:29, 31.99s/it]training loss: 5.567e-03:   1%|          | 1608/300001 [14:14:21<2633:20:46, 31.77s/it]training loss: 5.567e-03:   1%|          | 1609/300001 [14:14:52<2627:36:02, 31.70s/it]training loss: 5.567e-03:   1%|          | 1610/300001 [14:15:24<2632:26:15, 31.76s/it]training loss: 5.567e-03:   1%|          | 1611/300001 [14:15:55<2613:52:43, 31.54s/it]training loss: 5.567e-03:   1%|          | 1612/300001 [14:16:27<2613:54:53, 31.54s/it]training loss: 5.567e-03:   1%|          | 1613/300001 [14:16:58<2611:04:15, 31.50s/it]training loss: 5.567e-03:   1%|          | 1614/300001 [14:17:30<2621:10:23, 31.62s/it]training loss: 5.567e-03:   1%|          | 1615/300001 [14:18:01<2591:29:04, 31.27s/it]training loss: 5.567e-03:   1%|          | 1616/300001 [14:18:31<2580:57:53, 31.14s/it]training loss: 5.567e-03:   1%|          | 1617/300001 [14:19:05<2630:29:56, 31.74s/it]training loss: 5.567e-03:   1%|          | 1618/300001 [14:19:38<2659:59:26, 32.09s/it]training loss: 5.567e-03:   1%|          | 1619/300001 [14:20:09<2648:55:56, 31.96s/it]training loss: 5.567e-03:   1%|          | 1620/300001 [14:20:41<2635:40:06, 31.80s/it]training loss: 6.175e-03:   1%|          | 1620/300001 [14:21:12<2635:40:06, 31.80s/it]training loss: 6.175e-03:   1%|          | 1621/300001 [14:21:12<2618:03:31, 31.59s/it]training loss: 6.175e-03:   1%|          | 1622/300001 [14:21:43<2620:32:36, 31.62s/it]training loss: 6.175e-03:   1%|          | 1623/300001 [14:22:16<2654:38:56, 32.03s/it]training loss: 6.175e-03:   1%|          | 1624/300001 [14:22:47<2616:30:58, 31.57s/it]training loss: 6.175e-03:   1%|          | 1625/300001 [14:23:18<2611:18:19, 31.51s/it]training loss: 6.175e-03:   1%|          | 1626/300001 [14:23:49<2598:45:44, 31.35s/it]training loss: 6.175e-03:   1%|          | 1627/300001 [14:24:19<2567:09:08, 30.97s/it]training loss: 6.175e-03:   1%|          | 1628/300001 [14:24:52<2598:49:26, 31.36s/it]training loss: 6.175e-03:   1%|          | 1629/300001 [14:25:23<2606:03:16, 31.44s/it]training loss: 6.175e-03:   1%|          | 1630/300001 [14:25:56<2626:46:26, 31.69s/it]training loss: 6.175e-03:   1%|          | 1631/300001 [14:26:28<2643:17:22, 31.89s/it]training loss: 6.175e-03:   1%|          | 1632/300001 [14:26:59<2627:07:37, 31.70s/it]training loss: 6.175e-03:   1%|          | 1633/300001 [14:27:30<2611:31:51, 31.51s/it]training loss: 6.175e-03:   1%|          | 1634/300001 [14:28:02<2626:40:28, 31.69s/it]training loss: 6.175e-03:   1%|          | 1635/300001 [14:28:33<2602:21:44, 31.40s/it]training loss: 6.175e-03:   1%|          | 1636/300001 [14:29:05<2622:09:51, 31.64s/it]training loss: 6.175e-03:   1%|          | 1637/300001 [14:29:37<2625:32:59, 31.68s/it]training loss: 6.175e-03:   1%|          | 1638/300001 [14:30:10<2670:36:08, 32.22s/it]training loss: 6.175e-03:   1%|          | 1639/300001 [14:30:42<2643:55:56, 31.90s/it]training loss: 6.175e-03:   1%|          | 1640/300001 [14:31:14<2666:28:06, 32.17s/it]training loss: 5.879e-03:   1%|          | 1640/300001 [14:31:47<2666:28:06, 32.17s/it]training loss: 5.879e-03:   1%|          | 1641/300001 [14:31:47<2668:02:30, 32.19s/it]training loss: 5.879e-03:   1%|          | 1642/300001 [14:32:19<2663:44:37, 32.14s/it]training loss: 5.879e-03:   1%|          | 1643/300001 [14:32:50<2645:46:38, 31.92s/it]training loss: 5.879e-03:   1%|          | 1644/300001 [14:33:22<2655:11:38, 32.04s/it]training loss: 5.879e-03:   1%|          | 1645/300001 [14:33:55<2670:41:06, 32.22s/it]training loss: 5.879e-03:   1%|          | 1646/300001 [14:34:27<2655:07:15, 32.04s/it]training loss: 5.879e-03:   1%|          | 1647/300001 [14:34:58<2631:49:35, 31.76s/it]training loss: 5.879e-03:   1%|          | 1648/300001 [14:35:30<2636:55:51, 31.82s/it]training loss: 5.879e-03:   1%|          | 1649/300001 [14:36:02<2654:54:52, 32.03s/it]training loss: 5.879e-03:   1%|          | 1650/300001 [14:36:34<2636:55:22, 31.82s/it]training loss: 5.879e-03:   1%|          | 1651/300001 [14:37:05<2634:49:27, 31.79s/it]training loss: 5.879e-03:   1%|          | 1652/300001 [14:37:37<2623:10:08, 31.65s/it]training loss: 5.879e-03:   1%|          | 1653/300001 [14:38:10<2664:35:08, 32.15s/it]training loss: 5.879e-03:   1%|          | 1654/300001 [14:38:41<2643:35:38, 31.90s/it]training loss: 5.879e-03:   1%|          | 1655/300001 [14:39:15<2679:37:17, 32.33s/it]training loss: 5.879e-03:   1%|          | 1656/300001 [14:39:46<2648:45:17, 31.96s/it]training loss: 5.879e-03:   1%|          | 1657/300001 [14:40:17<2620:17:50, 31.62s/it]training loss: 5.879e-03:   1%|          | 1658/300001 [14:40:49<2636:32:23, 31.81s/it]training loss: 5.879e-03:   1%|          | 1659/300001 [14:41:19<2605:32:48, 31.44s/it]training loss: 5.879e-03:   1%|          | 1660/300001 [14:41:52<2637:41:40, 31.83s/it]training loss: 7.230e-03:   1%|          | 1660/300001 [14:42:24<2637:41:40, 31.83s/it]training loss: 7.230e-03:   1%|          | 1661/300001 [14:42:24<2640:37:10, 31.86s/it]training loss: 7.230e-03:   1%|          | 1662/300001 [14:42:55<2625:45:38, 31.68s/it]training loss: 7.230e-03:   1%|          | 1663/300001 [14:43:27<2622:49:47, 31.65s/it]training loss: 7.230e-03:   1%|          | 1664/300001 [14:44:00<2653:36:28, 32.02s/it]training loss: 7.230e-03:   1%|          | 1665/300001 [14:44:30<2611:59:17, 31.52s/it]training loss: 7.230e-03:   1%|          | 1666/300001 [14:45:01<2606:12:33, 31.45s/it]training loss: 7.230e-03:   1%|          | 1667/300001 [14:45:33<2619:11:42, 31.61s/it]training loss: 7.230e-03:   1%|          | 1668/300001 [14:46:05<2616:43:28, 31.58s/it]training loss: 7.230e-03:   1%|          | 1669/300001 [14:46:37<2641:27:41, 31.87s/it]training loss: 7.230e-03:   1%|          | 1670/300001 [14:47:10<2662:04:41, 32.12s/it]training loss: 7.230e-03:   1%|          | 1671/300001 [14:47:43<2667:38:35, 32.19s/it]training loss: 7.230e-03:   1%|          | 1672/300001 [14:48:14<2646:45:23, 31.94s/it]training loss: 7.230e-03:   1%|          | 1673/300001 [14:48:47<2669:31:08, 32.21s/it]training loss: 7.230e-03:   1%|          | 1674/300001 [14:49:18<2654:33:16, 32.03s/it]training loss: 7.230e-03:   1%|          | 1675/300001 [14:49:51<2659:29:46, 32.09s/it]training loss: 7.230e-03:   1%|          | 1676/300001 [14:50:22<2645:41:49, 31.93s/it]training loss: 7.230e-03:   1%|          | 1677/300001 [14:50:54<2650:55:47, 31.99s/it]training loss: 7.230e-03:   1%|          | 1678/300001 [14:51:27<2661:54:08, 32.12s/it]training loss: 7.230e-03:   1%|          | 1679/300001 [14:51:59<2659:58:06, 32.10s/it]training loss: 7.230e-03:   1%|          | 1680/300001 [14:52:30<2645:59:03, 31.93s/it]training loss: 5.444e-03:   1%|          | 1680/300001 [14:53:02<2645:59:03, 31.93s/it]training loss: 5.444e-03:   1%|          | 1681/300001 [14:53:02<2637:16:57, 31.83s/it]training loss: 5.444e-03:   1%|          | 1682/300001 [14:53:34<2648:55:03, 31.97s/it]training loss: 5.444e-03:   1%|          | 1683/300001 [14:54:06<2642:02:12, 31.88s/it]training loss: 5.444e-03:   1%|          | 1684/300001 [14:54:37<2612:25:44, 31.53s/it]training loss: 5.444e-03:   1%|          | 1685/300001 [14:55:09<2636:54:27, 31.82s/it]training loss: 5.444e-03:   1%|          | 1686/300001 [14:55:41<2645:04:45, 31.92s/it]training loss: 5.444e-03:   1%|          | 1687/300001 [14:56:12<2624:56:22, 31.68s/it]training loss: 5.444e-03:   1%|          | 1688/300001 [14:56:44<2635:56:15, 31.81s/it]training loss: 5.444e-03:   1%|          | 1689/300001 [14:57:16<2632:49:35, 31.77s/it]training loss: 5.444e-03:   1%|          | 1690/300001 [14:57:49<2653:17:04, 32.02s/it]training loss: 5.444e-03:   1%|          | 1691/300001 [14:58:20<2636:44:30, 31.82s/it]training loss: 5.444e-03:   1%|          | 1692/300001 [14:58:52<2633:53:27, 31.79s/it]training loss: 5.444e-03:   1%|          | 1693/300001 [14:59:23<2629:53:56, 31.74s/it]training loss: 5.444e-03:   1%|          | 1694/300001 [14:59:56<2648:00:20, 31.96s/it]training loss: 5.444e-03:   1%|          | 1695/300001 [15:00:27<2636:30:40, 31.82s/it]training loss: 5.444e-03:   1%|          | 1696/300001 [15:00:58<2620:23:34, 31.62s/it]training loss: 5.444e-03:   1%|          | 1697/300001 [15:01:31<2633:14:03, 31.78s/it]training loss: 5.444e-03:   1%|          | 1698/300001 [15:02:02<2621:59:53, 31.64s/it]training loss: 5.444e-03:   1%|          | 1699/300001 [15:02:33<2599:29:51, 31.37s/it]training loss: 5.444e-03:   1%|          | 1700/300001 [15:03:04<2591:38:51, 31.28s/it]training loss: 6.042e-03:   1%|          | 1700/300001 [15:03:36<2591:38:51, 31.28s/it]training loss: 6.042e-03:   1%|          | 1701/300001 [15:03:37<2629:42:11, 31.74s/it]training loss: 6.042e-03:   1%|          | 1702/300001 [15:04:07<2601:53:55, 31.40s/it]training loss: 6.042e-03:   1%|          | 1703/300001 [15:04:39<2603:39:56, 31.42s/it]training loss: 6.042e-03:   1%|          | 1704/300001 [15:05:10<2597:29:05, 31.35s/it]training loss: 6.042e-03:   1%|          | 1705/300001 [15:05:41<2603:50:09, 31.42s/it]training loss: 6.042e-03:   1%|          | 1706/300001 [15:06:14<2629:44:44, 31.74s/it]training loss: 6.042e-03:   1%|          | 1707/300001 [15:06:46<2635:36:01, 31.81s/it]training loss: 6.042e-03:   1%|          | 1708/300001 [15:07:17<2629:32:42, 31.74s/it]training loss: 6.042e-03:   1%|          | 1709/300001 [15:07:49<2633:45:06, 31.79s/it]training loss: 6.042e-03:   1%|          | 1710/300001 [15:08:21<2631:22:23, 31.76s/it]training loss: 6.042e-03:   1%|          | 1711/300001 [15:08:53<2630:56:35, 31.75s/it]training loss: 6.042e-03:   1%|          | 1712/300001 [15:09:23<2591:36:58, 31.28s/it]training loss: 6.042e-03:   1%|          | 1713/300001 [15:09:54<2586:52:27, 31.22s/it]training loss: 6.042e-03:   1%|          | 1714/300001 [15:10:25<2583:57:35, 31.19s/it]training loss: 6.042e-03:   1%|          | 1715/300001 [15:10:56<2584:44:13, 31.20s/it]training loss: 6.042e-03:   1%|          | 1716/300001 [15:11:28<2599:19:08, 31.37s/it]training loss: 6.042e-03:   1%|          | 1717/300001 [15:12:00<2600:05:58, 31.38s/it]training loss: 6.042e-03:   1%|          | 1718/300001 [15:12:31<2606:07:01, 31.45s/it]training loss: 6.042e-03:   1%|          | 1719/300001 [15:13:04<2630:09:38, 31.74s/it]training loss: 6.042e-03:   1%|          | 1720/300001 [15:13:36<2657:54:22, 32.08s/it]training loss: 5.986e-03:   1%|          | 1720/300001 [15:14:08<2657:54:22, 32.08s/it]training loss: 5.986e-03:   1%|          | 1721/300001 [15:14:08<2655:39:48, 32.05s/it]training loss: 5.986e-03:   1%|          | 1722/300001 [15:14:40<2639:54:35, 31.86s/it]training loss: 5.986e-03:   1%|          | 1723/300001 [15:15:12<2637:09:38, 31.83s/it]training loss: 5.986e-03:   1%|          | 1724/300001 [15:15:44<2645:34:35, 31.93s/it]training loss: 5.986e-03:   1%|          | 1725/300001 [15:16:16<2645:26:26, 31.93s/it]training loss: 5.986e-03:   1%|          | 1726/300001 [15:16:49<2677:56:02, 32.32s/it]training loss: 5.986e-03:   1%|          | 1727/300001 [15:17:12<2441:24:53, 29.47s/it]training loss: 5.986e-03:   1%|          | 1728/300001 [15:17:43<2476:45:24, 29.89s/it]training loss: 5.986e-03:   1%|          | 1729/300001 [15:18:14<2507:52:21, 30.27s/it]training loss: 5.986e-03:   1%|          | 1730/300001 [15:18:45<2541:21:02, 30.67s/it]training loss: 5.986e-03:   1%|          | 1731/300001 [15:19:17<2574:34:56, 31.07s/it]training loss: 5.986e-03:   1%|          | 1732/300001 [15:19:49<2579:09:25, 31.13s/it]training loss: 5.986e-03:   1%|          | 1733/300001 [15:20:21<2602:25:30, 31.41s/it]training loss: 5.986e-03:   1%|          | 1734/300001 [15:20:51<2578:01:07, 31.12s/it]training loss: 5.986e-03:   1%|          | 1735/300001 [15:21:23<2590:29:59, 31.27s/it]training loss: 5.986e-03:   1%|          | 1736/300001 [15:21:55<2604:48:33, 31.44s/it]training loss: 5.986e-03:   1%|          | 1737/300001 [15:22:26<2591:06:22, 31.27s/it]training loss: 5.986e-03:   1%|          | 1738/300001 [15:22:58<2617:57:37, 31.60s/it]training loss: 5.986e-03:   1%|          | 1739/300001 [15:23:29<2596:52:09, 31.34s/it]training loss: 5.986e-03:   1%|          | 1740/300001 [15:24:02<2651:12:49, 32.00s/it]training loss: 5.885e-03:   1%|          | 1740/300001 [15:24:34<2651:12:49, 32.00s/it]training loss: 5.885e-03:   1%|          | 1741/300001 [15:24:34<2655:54:39, 32.06s/it]training loss: 5.885e-03:   1%|          | 1742/300001 [15:25:07<2667:54:37, 32.20s/it]training loss: 5.885e-03:   1%|          | 1743/300001 [15:25:38<2651:38:53, 32.01s/it]training loss: 5.885e-03:   1%|          | 1744/300001 [15:26:11<2676:52:46, 32.31s/it]training loss: 5.885e-03:   1%|          | 1745/300001 [15:26:43<2669:09:14, 32.22s/it]training loss: 5.885e-03:   1%|          | 1746/300001 [15:27:16<2671:45:04, 32.25s/it]training loss: 5.885e-03:   1%|          | 1747/300001 [15:27:48<2682:48:44, 32.38s/it]training loss: 5.885e-03:   1%|          | 1748/300001 [15:28:20<2672:26:48, 32.26s/it]training loss: 5.885e-03:   1%|          | 1749/300001 [15:28:51<2625:27:51, 31.69s/it]training loss: 5.885e-03:   1%|          | 1750/300001 [15:29:23<2639:53:36, 31.86s/it]training loss: 5.885e-03:   1%|          | 1751/300001 [15:29:55<2653:49:45, 32.03s/it]training loss: 5.885e-03:   1%|          | 1752/300001 [15:30:27<2643:29:33, 31.91s/it]training loss: 5.885e-03:   1%|          | 1753/300001 [15:30:59<2636:12:59, 31.82s/it]training loss: 5.885e-03:   1%|          | 1754/300001 [15:31:30<2628:05:25, 31.72s/it]training loss: 5.885e-03:   1%|          | 1755/300001 [15:32:03<2649:13:07, 31.98s/it]training loss: 5.885e-03:   1%|          | 1756/300001 [15:32:34<2628:30:52, 31.73s/it]training loss: 5.885e-03:   1%|          | 1757/300001 [15:33:05<2619:28:17, 31.62s/it]training loss: 5.885e-03:   1%|          | 1758/300001 [15:33:37<2621:00:32, 31.64s/it]training loss: 5.885e-03:   1%|          | 1759/300001 [15:34:08<2602:08:42, 31.41s/it]training loss: 5.885e-03:   1%|          | 1760/300001 [15:34:39<2594:23:24, 31.32s/it]training loss: 5.694e-03:   1%|          | 1760/300001 [15:35:12<2594:23:24, 31.32s/it]training loss: 5.694e-03:   1%|          | 1761/300001 [15:35:12<2633:44:15, 31.79s/it]training loss: 5.694e-03:   1%|          | 1762/300001 [15:35:45<2661:51:56, 32.13s/it]training loss: 5.694e-03:   1%|          | 1763/300001 [15:36:18<2676:50:25, 32.31s/it]training loss: 5.694e-03:   1%|          | 1764/300001 [15:36:50<2680:20:15, 32.35s/it]training loss: 5.694e-03:   1%|          | 1765/300001 [15:37:23<2703:06:22, 32.63s/it]training loss: 5.694e-03:   1%|          | 1766/300001 [15:37:55<2690:41:58, 32.48s/it]training loss: 5.694e-03:   1%|          | 1767/300001 [15:38:27<2664:48:29, 32.17s/it]training loss: 5.694e-03:   1%|          | 1768/300001 [15:38:58<2645:26:06, 31.93s/it]training loss: 5.694e-03:   1%|          | 1769/300001 [15:39:29<2629:55:48, 31.75s/it]training loss: 5.694e-03:   1%|          | 1770/300001 [15:40:01<2614:55:17, 31.57s/it]training loss: 5.694e-03:   1%|          | 1771/300001 [15:40:33<2629:34:13, 31.74s/it]training loss: 5.694e-03:   1%|          | 1772/300001 [15:41:05<2639:35:21, 31.86s/it]training loss: 5.694e-03:   1%|          | 1773/300001 [15:41:37<2653:24:36, 32.03s/it]training loss: 5.694e-03:   1%|          | 1774/300001 [15:42:09<2639:41:52, 31.86s/it]training loss: 5.694e-03:   1%|          | 1775/300001 [15:42:40<2622:31:25, 31.66s/it]training loss: 5.694e-03:   1%|          | 1776/300001 [15:43:12<2621:10:00, 31.64s/it]training loss: 5.694e-03:   1%|          | 1777/300001 [15:43:44<2639:47:35, 31.87s/it]training loss: 5.694e-03:   1%|          | 1778/300001 [15:44:16<2653:21:11, 32.03s/it]training loss: 5.694e-03:   1%|          | 1779/300001 [15:44:48<2648:34:05, 31.97s/it]training loss: 5.694e-03:   1%|          | 1780/300001 [15:45:20<2630:37:21, 31.76s/it]training loss: 6.414e-03:   1%|          | 1780/300001 [15:45:51<2630:37:21, 31.76s/it]training loss: 6.414e-03:   1%|          | 1781/300001 [15:45:52<2637:33:46, 31.84s/it]training loss: 6.414e-03:   1%|          | 1782/300001 [15:46:23<2626:23:04, 31.70s/it]training loss: 6.414e-03:   1%|          | 1783/300001 [15:46:54<2618:57:39, 31.62s/it]training loss: 6.414e-03:   1%|          | 1784/300001 [15:47:26<2615:26:02, 31.57s/it]training loss: 6.414e-03:   1%|          | 1785/300001 [15:47:57<2613:21:30, 31.55s/it]training loss: 6.414e-03:   1%|          | 1786/300001 [15:48:29<2626:37:21, 31.71s/it]training loss: 6.414e-03:   1%|          | 1787/300001 [15:49:01<2622:57:24, 31.66s/it]training loss: 6.414e-03:   1%|          | 1788/300001 [15:49:34<2663:33:16, 32.15s/it]training loss: 6.414e-03:   1%|          | 1789/300001 [15:50:06<2644:32:26, 31.92s/it]training loss: 6.414e-03:   1%|          | 1790/300001 [15:50:37<2631:55:42, 31.77s/it]training loss: 6.414e-03:   1%|          | 1791/300001 [15:51:08<2621:20:18, 31.64s/it]training loss: 6.414e-03:   1%|          | 1792/300001 [15:51:40<2619:40:09, 31.62s/it]training loss: 6.414e-03:   1%|          | 1793/300001 [15:52:12<2628:31:03, 31.73s/it]training loss: 6.414e-03:   1%|          | 1794/300001 [15:52:43<2622:38:58, 31.66s/it]training loss: 6.414e-03:   1%|          | 1795/300001 [15:53:14<2605:02:15, 31.45s/it]training loss: 6.414e-03:   1%|          | 1796/300001 [15:53:46<2597:06:58, 31.35s/it]training loss: 6.414e-03:   1%|          | 1797/300001 [15:54:18<2612:34:26, 31.54s/it]training loss: 6.414e-03:   1%|          | 1798/300001 [15:54:49<2610:29:04, 31.51s/it]training loss: 6.414e-03:   1%|          | 1799/300001 [15:55:21<2612:13:07, 31.54s/it]training loss: 6.414e-03:   1%|          | 1800/300001 [15:55:52<2615:53:17, 31.58s/it]training loss: 6.045e-03:   1%|          | 1800/300001 [15:56:24<2615:53:17, 31.58s/it]training loss: 6.045e-03:   1%|          | 1801/300001 [15:56:25<2634:15:35, 31.80s/it]training loss: 6.045e-03:   1%|          | 1802/300001 [15:56:58<2671:19:17, 32.25s/it]training loss: 6.045e-03:   1%|          | 1803/300001 [15:57:30<2681:12:41, 32.37s/it]training loss: 6.045e-03:   1%|          | 1804/300001 [15:58:02<2672:08:54, 32.26s/it]training loss: 6.045e-03:   1%|          | 1805/300001 [15:58:34<2665:43:16, 32.18s/it]training loss: 6.045e-03:   1%|          | 1806/300001 [15:59:08<2699:30:26, 32.59s/it]training loss: 6.045e-03:   1%|          | 1807/300001 [15:59:40<2681:29:37, 32.37s/it]training loss: 6.045e-03:   1%|          | 1808/300001 [16:00:11<2651:42:19, 32.01s/it]training loss: 6.045e-03:   1%|          | 1809/300001 [16:00:44<2680:05:21, 32.36s/it]training loss: 6.045e-03:   1%|          | 1810/300001 [16:01:16<2659:58:46, 32.11s/it]training loss: 6.045e-03:   1%|          | 1811/300001 [16:01:48<2650:31:00, 32.00s/it]training loss: 6.045e-03:   1%|          | 1812/300001 [16:02:18<2619:55:38, 31.63s/it]training loss: 6.045e-03:   1%|          | 1813/300001 [16:02:50<2619:50:11, 31.63s/it]training loss: 6.045e-03:   1%|          | 1814/300001 [16:03:21<2616:22:48, 31.59s/it]training loss: 6.045e-03:   1%|          | 1815/300001 [16:03:54<2635:20:17, 31.82s/it]training loss: 6.045e-03:   1%|          | 1816/300001 [16:04:25<2609:49:44, 31.51s/it]training loss: 6.045e-03:   1%|          | 1817/300001 [16:04:56<2618:03:43, 31.61s/it]training loss: 6.045e-03:   1%|          | 1818/300001 [16:05:27<2590:36:03, 31.28s/it]training loss: 6.045e-03:   1%|          | 1819/300001 [16:05:59<2613:23:22, 31.55s/it]training loss: 6.045e-03:   1%|          | 1820/300001 [16:06:31<2621:28:58, 31.65s/it]training loss: 5.584e-03:   1%|          | 1820/300001 [16:07:03<2621:28:58, 31.65s/it]training loss: 5.584e-03:   1%|          | 1821/300001 [16:07:03<2623:23:35, 31.67s/it]training loss: 5.584e-03:   1%|          | 1822/300001 [16:07:34<2614:53:29, 31.57s/it]training loss: 5.584e-03:   1%|          | 1823/300001 [16:08:06<2632:27:52, 31.78s/it]training loss: 5.584e-03:   1%|          | 1824/300001 [16:08:36<2589:18:16, 31.26s/it]training loss: 5.584e-03:   1%|          | 1825/300001 [16:09:09<2611:55:40, 31.53s/it]training loss: 5.584e-03:   1%|          | 1826/300001 [16:09:40<2615:58:34, 31.58s/it]training loss: 5.584e-03:   1%|          | 1827/300001 [16:10:13<2637:44:54, 31.85s/it]training loss: 5.584e-03:   1%|          | 1828/300001 [16:10:45<2641:59:46, 31.90s/it]training loss: 5.584e-03:   1%|          | 1829/300001 [16:11:17<2648:25:46, 31.98s/it]training loss: 5.584e-03:   1%|          | 1830/300001 [16:11:49<2659:57:04, 32.12s/it]training loss: 5.584e-03:   1%|          | 1831/300001 [16:12:22<2681:08:23, 32.37s/it]training loss: 5.584e-03:   1%|          | 1832/300001 [16:12:55<2682:38:50, 32.39s/it]training loss: 5.584e-03:   1%|          | 1833/300001 [16:13:26<2656:27:43, 32.07s/it]training loss: 5.584e-03:   1%|          | 1834/300001 [16:13:58<2651:01:32, 32.01s/it]training loss: 5.584e-03:   1%|          | 1835/300001 [16:14:31<2669:31:54, 32.23s/it]training loss: 5.584e-03:   1%|          | 1836/300001 [16:15:02<2645:43:56, 31.94s/it]training loss: 5.584e-03:   1%|          | 1837/300001 [16:15:33<2635:55:58, 31.83s/it]training loss: 5.584e-03:   1%|          | 1838/300001 [16:16:07<2678:12:10, 32.34s/it]training loss: 5.584e-03:   1%|          | 1839/300001 [16:16:39<2659:50:55, 32.11s/it]training loss: 5.584e-03:   1%|          | 1840/300001 [16:17:10<2652:24:18, 32.03s/it]training loss: 5.990e-03:   1%|          | 1840/300001 [16:17:43<2652:24:18, 32.03s/it]training loss: 5.990e-03:   1%|          | 1841/300001 [16:17:43<2660:22:12, 32.12s/it]training loss: 5.990e-03:   1%|          | 1842/300001 [16:18:14<2649:25:49, 31.99s/it]training loss: 5.990e-03:   1%|          | 1843/300001 [16:18:45<2615:52:36, 31.58s/it]training loss: 5.990e-03:   1%|          | 1844/300001 [16:19:17<2623:56:37, 31.68s/it]training loss: 5.990e-03:   1%|          | 1845/300001 [16:19:49<2633:36:48, 31.80s/it]training loss: 5.990e-03:   1%|          | 1846/300001 [16:20:21<2629:15:26, 31.75s/it]training loss: 5.990e-03:   1%|          | 1847/300001 [16:20:52<2625:12:41, 31.70s/it]training loss: 5.990e-03:   1%|          | 1848/300001 [16:21:26<2663:46:47, 32.16s/it]training loss: 5.990e-03:   1%|          | 1849/300001 [16:21:57<2655:38:54, 32.07s/it]training loss: 5.990e-03:   1%|          | 1850/300001 [16:22:29<2647:49:03, 31.97s/it]training loss: 5.990e-03:   1%|          | 1851/300001 [16:23:00<2625:45:52, 31.70s/it]training loss: 5.990e-03:   1%|          | 1852/300001 [16:23:32<2627:10:56, 31.72s/it]training loss: 5.990e-03:   1%|          | 1853/300001 [16:24:04<2642:37:11, 31.91s/it]training loss: 5.990e-03:   1%|          | 1854/300001 [16:24:35<2608:23:42, 31.50s/it]training loss: 5.990e-03:   1%|          | 1855/300001 [16:25:06<2600:39:57, 31.40s/it]training loss: 5.990e-03:   1%|          | 1856/300001 [16:25:39<2632:26:53, 31.79s/it]training loss: 5.990e-03:   1%|          | 1857/300001 [16:26:11<2639:12:26, 31.87s/it]training loss: 5.990e-03:   1%|          | 1858/300001 [16:26:42<2626:49:04, 31.72s/it]training loss: 5.990e-03:   1%|          | 1859/300001 [16:27:14<2622:35:54, 31.67s/it]training loss: 5.990e-03:   1%|          | 1860/300001 [16:27:46<2637:41:10, 31.85s/it]training loss: 5.307e-03:   1%|          | 1860/300001 [16:28:18<2637:41:10, 31.85s/it]training loss: 5.307e-03:   1%|          | 1861/300001 [16:28:18<2643:11:12, 31.92s/it]training loss: 5.307e-03:   1%|          | 1862/300001 [16:28:48<2593:54:48, 31.32s/it]training loss: 5.307e-03:   1%|          | 1863/300001 [16:29:20<2607:02:43, 31.48s/it]training loss: 5.307e-03:   1%|          | 1864/300001 [16:29:51<2597:40:04, 31.37s/it]training loss: 5.307e-03:   1%|          | 1865/300001 [16:30:22<2592:42:02, 31.31s/it]training loss: 5.307e-03:   1%|          | 1866/300001 [16:30:53<2594:01:00, 31.32s/it]training loss: 5.307e-03:   1%|          | 1867/300001 [16:31:25<2588:31:35, 31.26s/it]training loss: 5.307e-03:   1%|          | 1868/300001 [16:31:56<2596:27:17, 31.35s/it]training loss: 5.307e-03:   1%|          | 1869/300001 [16:32:27<2591:49:26, 31.30s/it]training loss: 5.307e-03:   1%|          | 1870/300001 [16:32:59<2599:37:18, 31.39s/it]training loss: 5.307e-03:   1%|          | 1871/300001 [16:33:31<2627:34:24, 31.73s/it]training loss: 5.307e-03:   1%|          | 1872/300001 [16:34:03<2631:05:17, 31.77s/it]training loss: 5.307e-03:   1%|          | 1873/300001 [16:34:35<2631:36:58, 31.78s/it]training loss: 5.307e-03:   1%|          | 1874/300001 [16:35:06<2615:40:11, 31.59s/it]training loss: 5.307e-03:   1%|          | 1875/300001 [16:35:38<2625:56:30, 31.71s/it]training loss: 5.307e-03:   1%|          | 1876/300001 [16:36:09<2604:40:50, 31.45s/it]training loss: 5.307e-03:   1%|          | 1877/300001 [16:36:40<2602:13:08, 31.42s/it]training loss: 5.307e-03:   1%|          | 1878/300001 [16:37:13<2638:03:40, 31.86s/it]training loss: 5.307e-03:   1%|          | 1879/300001 [16:37:45<2630:30:14, 31.76s/it]training loss: 5.307e-03:   1%|          | 1880/300001 [16:38:17<2634:16:17, 31.81s/it]training loss: 7.141e-03:   1%|          | 1880/300001 [16:38:49<2634:16:17, 31.81s/it]training loss: 7.141e-03:   1%|          | 1881/300001 [16:38:49<2635:35:04, 31.83s/it]training loss: 7.141e-03:   1%|          | 1882/300001 [16:39:21<2657:31:16, 32.09s/it]training loss: 7.141e-03:   1%|          | 1883/300001 [16:39:55<2686:33:50, 32.44s/it]training loss: 7.141e-03:   1%|          | 1884/300001 [16:40:18<2459:38:54, 29.70s/it]training loss: 7.141e-03:   1%|          | 1885/300001 [16:40:50<2520:40:58, 30.44s/it]training loss: 7.141e-03:   1%|          | 1886/300001 [16:41:23<2581:21:03, 31.17s/it]training loss: 7.141e-03:   1%|          | 1887/300001 [16:41:54<2581:55:17, 31.18s/it]training loss: 7.141e-03:   1%|          | 1888/300001 [16:42:26<2607:50:05, 31.49s/it]training loss: 7.141e-03:   1%|          | 1889/300001 [16:42:58<2611:16:55, 31.53s/it]training loss: 7.141e-03:   1%|          | 1890/300001 [16:43:30<2615:34:50, 31.59s/it]training loss: 7.141e-03:   1%|          | 1891/300001 [16:44:01<2607:42:17, 31.49s/it]training loss: 7.141e-03:   1%|          | 1892/300001 [16:44:33<2629:16:34, 31.75s/it]training loss: 7.141e-03:   1%|          | 1893/300001 [16:45:06<2648:50:38, 31.99s/it]training loss: 7.141e-03:   1%|          | 1894/300001 [16:45:38<2647:48:55, 31.98s/it]training loss: 7.141e-03:   1%|          | 1895/300001 [16:46:10<2666:08:15, 32.20s/it]training loss: 7.141e-03:   1%|          | 1896/300001 [16:46:43<2668:37:54, 32.23s/it]training loss: 7.141e-03:   1%|          | 1897/300001 [16:47:15<2665:31:31, 32.19s/it]training loss: 7.141e-03:   1%|          | 1898/300001 [16:47:47<2656:04:11, 32.08s/it]training loss: 7.141e-03:   1%|          | 1899/300001 [16:48:19<2650:25:45, 32.01s/it]training loss: 7.141e-03:   1%|          | 1900/300001 [16:48:50<2629:03:00, 31.75s/it]training loss: 5.980e-03:   1%|          | 1900/300001 [16:49:21<2629:03:00, 31.75s/it]training loss: 5.980e-03:   1%|          | 1901/300001 [16:49:21<2630:01:23, 31.76s/it]training loss: 5.980e-03:   1%|          | 1902/300001 [16:49:53<2616:11:21, 31.59s/it]training loss: 5.980e-03:   1%|          | 1903/300001 [16:50:24<2617:21:42, 31.61s/it]training loss: 5.980e-03:   1%|          | 1904/300001 [16:50:56<2614:41:49, 31.58s/it]training loss: 5.980e-03:   1%|          | 1905/300001 [16:51:27<2603:55:55, 31.45s/it]training loss: 5.980e-03:   1%|          | 1906/300001 [16:51:59<2612:14:11, 31.55s/it]training loss: 5.980e-03:   1%|          | 1907/300001 [16:52:30<2602:22:39, 31.43s/it]training loss: 5.980e-03:   1%|          | 1908/300001 [16:53:02<2626:03:11, 31.71s/it]training loss: 5.980e-03:   1%|          | 1909/300001 [16:53:34<2636:21:49, 31.84s/it]training loss: 5.980e-03:   1%|          | 1910/300001 [16:54:06<2622:08:58, 31.67s/it]training loss: 5.980e-03:   1%|          | 1911/300001 [16:54:37<2612:06:31, 31.55s/it]training loss: 5.980e-03:   1%|          | 1912/300001 [16:55:08<2607:02:26, 31.49s/it]training loss: 5.980e-03:   1%|          | 1913/300001 [16:55:40<2605:59:45, 31.47s/it]training loss: 5.980e-03:   1%|          | 1914/300001 [16:56:13<2642:16:42, 31.91s/it]training loss: 5.980e-03:   1%|          | 1915/300001 [16:56:44<2638:54:24, 31.87s/it]training loss: 5.980e-03:   1%|          | 1916/300001 [16:57:16<2623:59:50, 31.69s/it]training loss: 5.980e-03:   1%|          | 1917/300001 [16:57:47<2614:43:58, 31.58s/it]training loss: 5.980e-03:   1%|          | 1918/300001 [16:58:19<2616:32:48, 31.60s/it]training loss: 5.980e-03:   1%|          | 1919/300001 [16:58:50<2613:34:37, 31.56s/it]training loss: 5.980e-03:   1%|          | 1920/300001 [16:59:22<2631:18:57, 31.78s/it]training loss: 8.339e-03:   1%|          | 1920/300001 [16:59:55<2631:18:57, 31.78s/it]training loss: 8.339e-03:   1%|          | 1921/300001 [16:59:55<2649:28:06, 32.00s/it]training loss: 8.339e-03:   1%|          | 1922/300001 [17:00:27<2647:40:30, 31.98s/it]training loss: 8.339e-03:   1%|          | 1923/300001 [17:00:58<2628:47:21, 31.75s/it]training loss: 8.339e-03:   1%|          | 1924/300001 [17:01:30<2626:36:11, 31.72s/it]training loss: 8.339e-03:   1%|          | 1925/300001 [17:02:01<2610:07:11, 31.52s/it]training loss: 8.339e-03:   1%|          | 1926/300001 [17:02:32<2610:46:35, 31.53s/it]training loss: 8.339e-03:   1%|          | 1927/300001 [17:03:03<2581:42:05, 31.18s/it]training loss: 8.339e-03:   1%|          | 1928/300001 [17:03:34<2578:31:31, 31.14s/it]training loss: 8.339e-03:   1%|          | 1929/300001 [17:04:06<2594:49:27, 31.34s/it]training loss: 8.339e-03:   1%|          | 1930/300001 [17:04:37<2596:23:59, 31.36s/it]training loss: 8.339e-03:   1%|          | 1931/300001 [17:05:09<2614:05:16, 31.57s/it]training loss: 8.339e-03:   1%|          | 1932/300001 [17:05:40<2594:36:49, 31.34s/it]training loss: 8.339e-03:   1%|          | 1933/300001 [17:06:11<2597:53:29, 31.38s/it]training loss: 8.339e-03:   1%|          | 1934/300001 [17:06:42<2573:35:02, 31.08s/it]training loss: 8.339e-03:   1%|          | 1935/300001 [17:07:13<2590:47:05, 31.29s/it]training loss: 8.339e-03:   1%|          | 1936/300001 [17:07:46<2620:35:48, 31.65s/it]training loss: 8.339e-03:   1%|          | 1937/300001 [17:08:18<2621:10:34, 31.66s/it]training loss: 8.339e-03:   1%|          | 1938/300001 [17:08:51<2661:58:38, 32.15s/it]training loss: 8.339e-03:   1%|          | 1939/300001 [17:09:25<2696:59:24, 32.57s/it]training loss: 8.339e-03:   1%|          | 1940/300001 [17:09:56<2667:02:35, 32.21s/it]training loss: 6.176e-03:   1%|          | 1940/300001 [17:10:27<2667:02:35, 32.21s/it]training loss: 6.176e-03:   1%|          | 1941/300001 [17:10:27<2632:10:30, 31.79s/it]training loss: 6.176e-03:   1%|          | 1942/300001 [17:10:58<2624:11:48, 31.70s/it]training loss: 6.176e-03:   1%|          | 1943/300001 [17:11:29<2609:37:01, 31.52s/it]training loss: 6.176e-03:   1%|          | 1944/300001 [17:12:00<2590:35:12, 31.29s/it]training loss: 6.176e-03:   1%|          | 1945/300001 [17:12:32<2616:17:50, 31.60s/it]training loss: 6.176e-03:   1%|          | 1946/300001 [17:13:03<2604:24:10, 31.46s/it]training loss: 6.176e-03:   1%|          | 1947/300001 [17:13:35<2604:54:45, 31.46s/it]training loss: 6.176e-03:   1%|          | 1948/300001 [17:14:07<2615:45:31, 31.59s/it]training loss: 6.176e-03:   1%|          | 1949/300001 [17:14:38<2608:33:46, 31.51s/it]training loss: 6.176e-03:   1%|          | 1950/300001 [17:15:11<2650:03:05, 32.01s/it]training loss: 6.176e-03:   1%|          | 1951/300001 [17:15:43<2652:24:11, 32.04s/it]training loss: 6.176e-03:   1%|          | 1952/300001 [17:16:15<2641:19:16, 31.90s/it]training loss: 6.176e-03:   1%|          | 1953/300001 [17:16:46<2628:28:01, 31.75s/it]training loss: 6.176e-03:   1%|          | 1954/300001 [17:17:18<2622:55:05, 31.68s/it]training loss: 6.176e-03:   1%|          | 1955/300001 [17:17:49<2607:50:45, 31.50s/it]training loss: 6.176e-03:   1%|          | 1956/300001 [17:18:21<2613:10:49, 31.56s/it]training loss: 6.176e-03:   1%|          | 1957/300001 [17:18:53<2628:21:07, 31.75s/it]training loss: 6.176e-03:   1%|          | 1958/300001 [17:19:24<2612:32:33, 31.56s/it]training loss: 6.176e-03:   1%|          | 1959/300001 [17:19:55<2599:15:33, 31.40s/it]training loss: 6.176e-03:   1%|          | 1960/300001 [17:20:27<2602:16:17, 31.43s/it]training loss: 5.960e-03:   1%|          | 1960/300001 [17:20:58<2602:16:17, 31.43s/it]training loss: 5.960e-03:   1%|          | 1961/300001 [17:20:58<2604:54:37, 31.46s/it]training loss: 5.960e-03:   1%|          | 1962/300001 [17:21:29<2580:53:25, 31.17s/it]training loss: 5.960e-03:   1%|          | 1963/300001 [17:22:00<2582:56:03, 31.20s/it]training loss: 5.960e-03:   1%|          | 1964/300001 [17:22:31<2587:53:56, 31.26s/it]training loss: 5.960e-03:   1%|          | 1965/300001 [17:23:04<2628:22:24, 31.75s/it]training loss: 5.960e-03:   1%|          | 1966/300001 [17:23:35<2601:27:22, 31.42s/it]training loss: 5.960e-03:   1%|          | 1967/300001 [17:24:06<2595:01:45, 31.35s/it]training loss: 5.960e-03:   1%|          | 1968/300001 [17:24:38<2605:13:11, 31.47s/it]training loss: 5.960e-03:   1%|          | 1969/300001 [17:25:10<2629:03:35, 31.76s/it]training loss: 5.960e-03:   1%|          | 1970/300001 [17:25:43<2647:07:50, 31.98s/it]training loss: 5.960e-03:   1%|          | 1971/300001 [17:26:14<2635:34:27, 31.84s/it]training loss: 5.960e-03:   1%|          | 1972/300001 [17:26:47<2663:09:04, 32.17s/it]training loss: 5.960e-03:   1%|          | 1973/300001 [17:27:18<2639:21:40, 31.88s/it]training loss: 5.960e-03:   1%|          | 1974/300001 [17:27:49<2613:58:46, 31.58s/it]training loss: 5.960e-03:   1%|          | 1975/300001 [17:28:19<2577:42:51, 31.14s/it]training loss: 5.960e-03:   1%|          | 1976/300001 [17:28:50<2572:14:16, 31.07s/it]training loss: 5.960e-03:   1%|          | 1977/300001 [17:29:22<2595:55:04, 31.36s/it]training loss: 5.960e-03:   1%|          | 1978/300001 [17:29:54<2595:35:13, 31.35s/it]training loss: 5.960e-03:   1%|          | 1979/300001 [17:30:26<2623:37:50, 31.69s/it]training loss: 5.960e-03:   1%|          | 1980/300001 [17:30:58<2624:39:32, 31.71s/it]training loss: 6.836e-03:   1%|          | 1980/300001 [17:31:29<2624:39:32, 31.71s/it]training loss: 6.836e-03:   1%|          | 1981/300001 [17:31:29<2622:56:46, 31.68s/it]training loss: 6.836e-03:   1%|          | 1982/300001 [17:32:00<2601:49:50, 31.43s/it]training loss: 6.836e-03:   1%|          | 1983/300001 [17:32:32<2602:34:05, 31.44s/it]training loss: 6.836e-03:   1%|          | 1984/300001 [17:33:04<2618:45:11, 31.63s/it]training loss: 6.836e-03:   1%|          | 1985/300001 [17:33:36<2637:00:04, 31.85s/it]training loss: 6.836e-03:   1%|          | 1986/300001 [17:34:08<2645:43:42, 31.96s/it]training loss: 6.836e-03:   1%|          | 1987/300001 [17:34:40<2635:35:49, 31.84s/it]training loss: 6.836e-03:   1%|          | 1988/300001 [17:35:11<2614:38:45, 31.58s/it]training loss: 6.836e-03:   1%|          | 1989/300001 [17:35:42<2599:40:02, 31.40s/it]training loss: 6.836e-03:   1%|          | 1990/300001 [17:36:14<2612:34:37, 31.56s/it]training loss: 6.836e-03:   1%|          | 1991/300001 [17:36:47<2656:04:20, 32.09s/it]training loss: 6.836e-03:   1%|          | 1992/300001 [17:37:17<2604:34:20, 31.46s/it]training loss: 6.836e-03:   1%|          | 1993/300001 [17:37:49<2607:40:28, 31.50s/it]training loss: 6.836e-03:   1%|          | 1994/300001 [17:38:20<2613:21:21, 31.57s/it]training loss: 6.836e-03:   1%|          | 1995/300001 [17:38:53<2630:31:05, 31.78s/it]training loss: 6.836e-03:   1%|          | 1996/300001 [17:39:25<2653:27:31, 32.05s/it]training loss: 6.836e-03:   1%|          | 1997/300001 [17:39:57<2645:45:34, 31.96s/it]training loss: 6.836e-03:   1%|          | 1998/300001 [17:40:28<2609:35:39, 31.52s/it]training loss: 6.836e-03:   1%|          | 1999/300001 [17:40:59<2605:33:17, 31.48s/it]training loss: 6.836e-03:   1%|          | 2000/300001 [17:41:31<2606:42:37, 31.49s/it]training loss: 6.558e-03:   1%|          | 2000/300001 [17:42:02<2606:42:37, 31.49s/it]training loss: 6.558e-03:   1%|          | 2001/300001 [17:42:06<2695:00:45, 32.56s/it]training loss: 6.558e-03:   1%|          | 2002/300001 [17:42:37<2670:33:51, 32.26s/it]training loss: 6.558e-03:   1%|          | 2003/300001 [17:43:09<2649:23:27, 32.01s/it]training loss: 6.558e-03:   1%|          | 2004/300001 [17:43:40<2643:28:33, 31.93s/it]training loss: 6.558e-03:   1%|          | 2005/300001 [17:44:12<2625:02:16, 31.71s/it]training loss: 6.558e-03:   1%|          | 2006/300001 [17:44:43<2629:28:30, 31.77s/it]training loss: 6.558e-03:   1%|          | 2007/300001 [17:45:16<2642:09:39, 31.92s/it]training loss: 6.558e-03:   1%|          | 2008/300001 [17:45:48<2639:39:33, 31.89s/it]training loss: 6.558e-03:   1%|          | 2009/300001 [17:46:20<2642:57:37, 31.93s/it]training loss: 6.558e-03:   1%|          | 2010/300001 [17:46:50<2615:08:46, 31.59s/it]training loss: 6.558e-03:   1%|          | 2011/300001 [17:47:23<2648:14:43, 31.99s/it]training loss: 6.558e-03:   1%|          | 2012/300001 [17:47:55<2643:13:03, 31.93s/it]training loss: 6.558e-03:   1%|          | 2013/300001 [17:48:26<2627:06:09, 31.74s/it]training loss: 6.558e-03:   1%|          | 2014/300001 [17:48:59<2655:19:05, 32.08s/it]training loss: 6.558e-03:   1%|          | 2015/300001 [17:49:30<2620:49:09, 31.66s/it]training loss: 6.558e-03:   1%|          | 2016/300001 [17:50:03<2659:08:31, 32.13s/it]training loss: 6.558e-03:   1%|          | 2017/300001 [17:50:35<2663:23:51, 32.18s/it]training loss: 6.558e-03:   1%|          | 2018/300001 [17:51:07<2635:05:36, 31.84s/it]training loss: 6.558e-03:   1%|          | 2019/300001 [17:51:39<2649:44:49, 32.01s/it]training loss: 6.558e-03:   1%|          | 2020/300001 [17:52:11<2641:32:16, 31.91s/it]training loss: 5.209e-03:   1%|          | 2020/300001 [17:52:42<2641:32:16, 31.91s/it]training loss: 5.209e-03:   1%|          | 2021/300001 [17:52:42<2628:09:25, 31.75s/it]training loss: 5.209e-03:   1%|          | 2022/300001 [17:53:14<2633:23:38, 31.82s/it]training loss: 5.209e-03:   1%|          | 2023/300001 [17:53:46<2647:22:37, 31.98s/it]training loss: 5.209e-03:   1%|          | 2024/300001 [17:54:17<2619:16:10, 31.64s/it]training loss: 5.209e-03:   1%|          | 2025/300001 [17:54:49<2621:54:12, 31.68s/it]training loss: 5.209e-03:   1%|          | 2026/300001 [17:55:21<2634:45:22, 31.83s/it]training loss: 5.209e-03:   1%|          | 2027/300001 [17:55:54<2652:10:45, 32.04s/it]training loss: 5.209e-03:   1%|          | 2028/300001 [17:56:26<2656:50:15, 32.10s/it]training loss: 5.209e-03:   1%|          | 2029/300001 [17:56:58<2662:00:16, 32.16s/it]training loss: 5.209e-03:   1%|          | 2030/300001 [17:57:29<2634:10:03, 31.83s/it]training loss: 5.209e-03:   1%|          | 2031/300001 [17:58:00<2619:31:39, 31.65s/it]training loss: 5.209e-03:   1%|          | 2032/300001 [17:58:32<2625:36:37, 31.72s/it]training loss: 5.209e-03:   1%|          | 2033/300001 [17:59:04<2625:52:07, 31.73s/it]training loss: 5.209e-03:   1%|          | 2034/300001 [17:59:35<2595:32:27, 31.36s/it]training loss: 5.209e-03:   1%|          | 2035/300001 [18:00:06<2589:41:34, 31.29s/it]training loss: 5.209e-03:   1%|          | 2036/300001 [18:00:38<2610:14:17, 31.54s/it]training loss: 5.209e-03:   1%|          | 2037/300001 [18:01:08<2586:28:45, 31.25s/it]training loss: 5.209e-03:   1%|          | 2038/300001 [18:01:41<2616:12:38, 31.61s/it]training loss: 5.209e-03:   1%|          | 2039/300001 [18:02:12<2599:22:43, 31.41s/it]training loss: 5.209e-03:   1%|          | 2040/300001 [18:02:44<2625:54:16, 31.73s/it]training loss: 6.654e-03:   1%|          | 2040/300001 [18:03:08<2625:54:16, 31.73s/it]training loss: 6.654e-03:   1%|          | 2041/300001 [18:03:08<2436:58:12, 29.44s/it]training loss: 6.654e-03:   1%|          | 2042/300001 [18:03:39<2462:34:30, 29.75s/it]training loss: 6.654e-03:   1%|          | 2043/300001 [18:04:11<2511:08:52, 30.34s/it]training loss: 6.654e-03:   1%|          | 2044/300001 [18:04:42<2529:06:20, 30.56s/it]training loss: 6.654e-03:   1%|          | 2045/300001 [18:05:13<2558:52:32, 30.92s/it]training loss: 6.654e-03:   1%|          | 2046/300001 [18:05:45<2582:23:12, 31.20s/it]training loss: 6.654e-03:   1%|          | 2047/300001 [18:06:18<2621:56:36, 31.68s/it]training loss: 6.654e-03:   1%|          | 2048/300001 [18:06:50<2619:43:53, 31.65s/it]training loss: 6.654e-03:   1%|          | 2049/300001 [18:07:21<2620:48:10, 31.67s/it]training loss: 6.654e-03:   1%|          | 2050/300001 [18:07:53<2625:03:45, 31.72s/it]training loss: 6.654e-03:   1%|          | 2051/300001 [18:08:25<2627:38:29, 31.75s/it]training loss: 6.654e-03:   1%|          | 2052/300001 [18:08:58<2664:22:32, 32.19s/it]training loss: 6.654e-03:   1%|          | 2053/300001 [18:09:31<2667:51:51, 32.23s/it]training loss: 6.654e-03:   1%|          | 2054/300001 [18:10:02<2655:31:01, 32.09s/it]training loss: 6.654e-03:   1%|          | 2055/300001 [18:10:35<2667:49:22, 32.23s/it]training loss: 6.654e-03:   1%|          | 2056/300001 [18:11:06<2644:39:47, 31.95s/it]training loss: 6.654e-03:   1%|          | 2057/300001 [18:11:37<2604:44:37, 31.47s/it]training loss: 6.654e-03:   1%|          | 2058/300001 [18:12:08<2611:40:57, 31.56s/it]training loss: 6.654e-03:   1%|          | 2059/300001 [18:12:43<2694:06:33, 32.55s/it]training loss: 6.654e-03:   1%|          | 2060/300001 [18:13:14<2653:44:39, 32.07s/it]training loss: 6.199e-03:   1%|          | 2060/300001 [18:13:47<2653:44:39, 32.07s/it]training loss: 6.199e-03:   1%|          | 2061/300001 [18:13:47<2667:27:34, 32.23s/it]training loss: 6.199e-03:   1%|          | 2062/300001 [18:14:18<2647:34:27, 31.99s/it]training loss: 6.199e-03:   1%|          | 2063/300001 [18:14:50<2641:31:50, 31.92s/it]training loss: 6.199e-03:   1%|          | 2064/300001 [18:15:22<2634:58:42, 31.84s/it]training loss: 6.199e-03:   1%|          | 2065/300001 [18:15:53<2622:08:14, 31.68s/it]training loss: 6.199e-03:   1%|          | 2066/300001 [18:16:25<2627:30:01, 31.75s/it]training loss: 6.199e-03:   1%|          | 2067/300001 [18:16:57<2627:32:21, 31.75s/it]training loss: 6.199e-03:   1%|          | 2068/300001 [18:17:28<2624:39:57, 31.71s/it]training loss: 6.199e-03:   1%|          | 2069/300001 [18:18:00<2617:49:28, 31.63s/it]training loss: 6.199e-03:   1%|          | 2070/300001 [18:18:30<2591:44:31, 31.32s/it]training loss: 6.199e-03:   1%|          | 2071/300001 [18:19:03<2617:04:50, 31.62s/it]training loss: 6.199e-03:   1%|          | 2072/300001 [18:19:34<2606:59:26, 31.50s/it]training loss: 6.199e-03:   1%|          | 2073/300001 [18:20:05<2612:09:54, 31.56s/it]training loss: 6.199e-03:   1%|          | 2074/300001 [18:20:38<2630:19:05, 31.78s/it]training loss: 6.199e-03:   1%|          | 2075/300001 [18:21:11<2660:56:52, 32.15s/it]training loss: 6.199e-03:   1%|          | 2076/300001 [18:21:42<2641:18:39, 31.92s/it]training loss: 6.199e-03:   1%|          | 2077/300001 [18:22:14<2649:53:54, 32.02s/it]training loss: 6.199e-03:   1%|          | 2078/300001 [18:22:47<2658:23:40, 32.12s/it]training loss: 6.199e-03:   1%|          | 2079/300001 [18:23:20<2677:02:11, 32.35s/it]training loss: 6.199e-03:   1%|          | 2080/300001 [18:23:51<2661:00:56, 32.16s/it]training loss: 6.131e-03:   1%|          | 2080/300001 [18:24:24<2661:00:56, 32.16s/it]training loss: 6.131e-03:   1%|          | 2081/300001 [18:24:24<2668:21:51, 32.24s/it]training loss: 6.131e-03:   1%|          | 2082/300001 [18:24:57<2687:48:17, 32.48s/it]training loss: 6.131e-03:   1%|          | 2083/300001 [18:25:29<2686:57:49, 32.47s/it]training loss: 6.131e-03:   1%|          | 2084/300001 [18:26:02<2688:15:24, 32.48s/it]training loss: 6.131e-03:   1%|          | 2085/300001 [18:26:35<2701:04:01, 32.64s/it]training loss: 6.131e-03:   1%|          | 2086/300001 [18:27:06<2677:23:04, 32.35s/it]training loss: 6.131e-03:   1%|          | 2087/300001 [18:27:39<2672:58:13, 32.30s/it]training loss: 6.131e-03:   1%|          | 2088/300001 [18:28:11<2663:39:12, 32.19s/it]training loss: 6.131e-03:   1%|          | 2089/300001 [18:28:43<2660:34:22, 32.15s/it]training loss: 6.131e-03:   1%|          | 2090/300001 [18:29:15<2655:14:06, 32.09s/it]training loss: 6.131e-03:   1%|          | 2091/300001 [18:29:47<2661:09:03, 32.16s/it]training loss: 6.131e-03:   1%|          | 2092/300001 [18:30:19<2655:45:43, 32.09s/it]training loss: 6.131e-03:   1%|          | 2093/300001 [18:30:49<2604:29:37, 31.47s/it]training loss: 6.131e-03:   1%|          | 2094/300001 [18:31:22<2635:41:53, 31.85s/it]training loss: 6.131e-03:   1%|          | 2095/300001 [18:31:52<2612:27:28, 31.57s/it]training loss: 6.131e-03:   1%|          | 2096/300001 [18:32:24<2618:36:56, 31.64s/it]training loss: 6.131e-03:   1%|          | 2097/300001 [18:32:55<2596:18:51, 31.37s/it]training loss: 6.131e-03:   1%|          | 2098/300001 [18:33:26<2583:08:16, 31.22s/it]training loss: 6.131e-03:   1%|          | 2099/300001 [18:33:58<2612:14:51, 31.57s/it]training loss: 6.131e-03:   1%|          | 2100/300001 [18:34:30<2614:23:17, 31.59s/it]training loss: 6.008e-03:   1%|          | 2100/300001 [18:35:02<2614:23:17, 31.59s/it]training loss: 6.008e-03:   1%|          | 2101/300001 [18:35:02<2621:48:04, 31.68s/it]training loss: 6.008e-03:   1%|          | 2102/300001 [18:35:34<2635:53:09, 31.85s/it]training loss: 6.008e-03:   1%|          | 2103/300001 [18:36:06<2646:04:55, 31.98s/it]training loss: 6.008e-03:   1%|          | 2104/300001 [18:36:38<2631:10:54, 31.80s/it]training loss: 6.008e-03:   1%|          | 2105/300001 [18:37:09<2622:07:26, 31.69s/it]training loss: 6.008e-03:   1%|          | 2106/300001 [18:37:40<2604:03:35, 31.47s/it]training loss: 6.008e-03:   1%|          | 2107/300001 [18:38:13<2630:01:47, 31.78s/it]training loss: 6.008e-03:   1%|          | 2108/300001 [18:38:45<2650:02:11, 32.03s/it]training loss: 6.008e-03:   1%|          | 2109/300001 [18:39:18<2669:52:14, 32.27s/it]training loss: 6.008e-03:   1%|          | 2110/300001 [18:39:50<2655:03:17, 32.09s/it]training loss: 6.008e-03:   1%|          | 2111/300001 [18:40:20<2620:24:18, 31.67s/it]training loss: 6.008e-03:   1%|          | 2112/300001 [18:40:52<2621:49:42, 31.68s/it]training loss: 6.008e-03:   1%|          | 2113/300001 [18:41:24<2624:29:33, 31.72s/it]training loss: 6.008e-03:   1%|          | 2114/300001 [18:41:55<2616:01:23, 31.61s/it]training loss: 6.008e-03:   1%|          | 2115/300001 [18:42:27<2610:52:57, 31.55s/it]training loss: 6.008e-03:   1%|          | 2116/300001 [18:42:59<2617:29:16, 31.63s/it]training loss: 6.008e-03:   1%|          | 2117/300001 [18:43:30<2602:04:40, 31.45s/it]training loss: 6.008e-03:   1%|          | 2118/300001 [18:44:00<2572:28:17, 31.09s/it]training loss: 6.008e-03:   1%|          | 2119/300001 [18:44:31<2574:56:33, 31.12s/it]training loss: 6.008e-03:   1%|          | 2120/300001 [18:45:02<2568:24:38, 31.04s/it]training loss: 5.963e-03:   1%|          | 2120/300001 [18:45:34<2568:24:38, 31.04s/it]training loss: 5.963e-03:   1%|          | 2121/300001 [18:45:34<2603:42:40, 31.47s/it]training loss: 5.963e-03:   1%|          | 2122/300001 [18:46:06<2617:21:07, 31.63s/it]training loss: 5.963e-03:   1%|          | 2123/300001 [18:46:39<2642:27:55, 31.94s/it]training loss: 5.963e-03:   1%|          | 2124/300001 [18:47:12<2658:52:08, 32.13s/it]training loss: 5.963e-03:   1%|          | 2125/300001 [18:47:44<2665:07:39, 32.21s/it]training loss: 5.963e-03:   1%|          | 2126/300001 [18:48:17<2676:34:59, 32.35s/it]training loss: 5.963e-03:   1%|          | 2127/300001 [18:48:47<2624:33:41, 31.72s/it]training loss: 5.963e-03:   1%|          | 2128/300001 [18:49:18<2606:56:25, 31.51s/it]training loss: 5.963e-03:   1%|          | 2129/300001 [18:49:50<2619:03:05, 31.65s/it]training loss: 5.963e-03:   1%|          | 2130/300001 [18:50:22<2642:31:44, 31.94s/it]training loss: 5.963e-03:   1%|          | 2131/300001 [18:50:55<2649:41:34, 32.02s/it]training loss: 5.963e-03:   1%|          | 2132/300001 [18:51:26<2623:36:51, 31.71s/it]training loss: 5.963e-03:   1%|          | 2133/300001 [18:51:57<2617:01:41, 31.63s/it]training loss: 5.963e-03:   1%|          | 2134/300001 [18:52:28<2607:48:34, 31.52s/it]training loss: 5.963e-03:   1%|          | 2135/300001 [18:53:01<2625:01:48, 31.73s/it]training loss: 5.963e-03:   1%|          | 2136/300001 [18:53:31<2599:57:45, 31.42s/it]training loss: 5.963e-03:   1%|          | 2137/300001 [18:54:03<2616:05:42, 31.62s/it]training loss: 5.963e-03:   1%|          | 2138/300001 [18:54:36<2637:26:20, 31.88s/it]training loss: 5.963e-03:   1%|          | 2139/300001 [18:55:08<2643:07:29, 31.95s/it]training loss: 5.963e-03:   1%|          | 2140/300001 [18:55:40<2644:15:05, 31.96s/it]training loss: 6.731e-03:   1%|          | 2140/300001 [18:56:12<2644:15:05, 31.96s/it]training loss: 6.731e-03:   1%|          | 2141/300001 [18:56:12<2646:42:09, 31.99s/it]training loss: 6.731e-03:   1%|          | 2142/300001 [18:56:45<2659:17:30, 32.14s/it]training loss: 6.731e-03:   1%|          | 2143/300001 [18:57:17<2656:11:16, 32.10s/it]training loss: 6.731e-03:   1%|          | 2144/300001 [18:57:48<2628:54:43, 31.77s/it]training loss: 6.731e-03:   1%|          | 2145/300001 [18:58:20<2645:27:10, 31.97s/it]training loss: 6.731e-03:   1%|          | 2146/300001 [18:58:52<2641:59:45, 31.93s/it]training loss: 6.731e-03:   1%|          | 2147/300001 [18:59:24<2643:25:32, 31.95s/it]training loss: 6.731e-03:   1%|          | 2148/300001 [18:59:55<2627:49:05, 31.76s/it]training loss: 6.731e-03:   1%|          | 2149/300001 [19:00:27<2642:34:17, 31.94s/it]training loss: 6.731e-03:   1%|          | 2150/300001 [19:00:59<2633:49:32, 31.83s/it]training loss: 6.731e-03:   1%|          | 2151/300001 [19:01:32<2649:36:09, 32.02s/it]training loss: 6.731e-03:   1%|          | 2152/300001 [19:02:03<2646:57:50, 31.99s/it]training loss: 6.731e-03:   1%|          | 2153/300001 [19:02:35<2642:30:18, 31.94s/it]training loss: 6.731e-03:   1%|          | 2154/300001 [19:03:07<2645:07:26, 31.97s/it]training loss: 6.731e-03:   1%|          | 2155/300001 [19:03:38<2610:41:55, 31.55s/it]training loss: 6.731e-03:   1%|          | 2156/300001 [19:04:10<2611:53:53, 31.57s/it]training loss: 6.731e-03:   1%|          | 2157/300001 [19:04:42<2627:41:22, 31.76s/it]training loss: 6.731e-03:   1%|          | 2158/300001 [19:05:14<2641:58:03, 31.93s/it]training loss: 6.731e-03:   1%|          | 2159/300001 [19:05:46<2645:02:45, 31.97s/it]training loss: 6.731e-03:   1%|          | 2160/300001 [19:06:18<2636:02:44, 31.86s/it]training loss: 5.385e-03:   1%|          | 2160/300001 [19:06:48<2636:02:44, 31.86s/it]training loss: 5.385e-03:   1%|          | 2161/300001 [19:06:48<2606:00:39, 31.50s/it]training loss: 5.385e-03:   1%|          | 2162/300001 [19:07:20<2614:03:00, 31.60s/it]training loss: 5.385e-03:   1%|          | 2163/300001 [19:07:52<2625:25:39, 31.73s/it]training loss: 5.385e-03:   1%|          | 2164/300001 [19:08:24<2620:13:13, 31.67s/it]training loss: 5.385e-03:   1%|          | 2165/300001 [19:08:56<2628:50:35, 31.78s/it]training loss: 5.385e-03:   1%|          | 2166/300001 [19:09:28<2628:03:35, 31.77s/it]training loss: 5.385e-03:   1%|          | 2167/300001 [19:09:59<2631:52:51, 31.81s/it]training loss: 5.385e-03:   1%|          | 2168/300001 [19:10:32<2648:32:01, 32.01s/it]training loss: 5.385e-03:   1%|          | 2169/300001 [19:11:04<2648:12:25, 32.01s/it]training loss: 5.385e-03:   1%|          | 2170/300001 [19:11:35<2624:45:22, 31.73s/it]training loss: 5.385e-03:   1%|          | 2171/300001 [19:12:07<2623:45:44, 31.71s/it]training loss: 5.385e-03:   1%|          | 2172/300001 [19:12:39<2635:13:05, 31.85s/it]training loss: 5.385e-03:   1%|          | 2173/300001 [19:13:10<2623:36:10, 31.71s/it]training loss: 5.385e-03:   1%|          | 2174/300001 [19:13:42<2621:47:16, 31.69s/it]training loss: 5.385e-03:   1%|          | 2175/300001 [19:14:14<2620:42:48, 31.68s/it]training loss: 5.385e-03:   1%|          | 2176/300001 [19:14:45<2619:17:05, 31.66s/it]training loss: 5.385e-03:   1%|          | 2177/300001 [19:15:17<2632:13:31, 31.82s/it]training loss: 5.385e-03:   1%|          | 2178/300001 [19:15:49<2635:40:34, 31.86s/it]training loss: 5.385e-03:   1%|          | 2179/300001 [19:16:20<2612:09:27, 31.58s/it]training loss: 5.385e-03:   1%|          | 2180/300001 [19:16:52<2606:41:22, 31.51s/it]training loss: 5.929e-03:   1%|          | 2180/300001 [19:17:23<2606:41:22, 31.51s/it]training loss: 5.929e-03:   1%|          | 2181/300001 [19:17:23<2608:05:58, 31.53s/it]training loss: 5.929e-03:   1%|          | 2182/300001 [19:17:55<2625:38:41, 31.74s/it]training loss: 5.929e-03:   1%|          | 2183/300001 [19:18:27<2633:03:18, 31.83s/it]training loss: 5.929e-03:   1%|          | 2184/300001 [19:18:58<2609:00:23, 31.54s/it]training loss: 5.929e-03:   1%|          | 2185/300001 [19:19:31<2626:26:28, 31.75s/it]training loss: 5.929e-03:   1%|          | 2186/300001 [19:20:03<2644:48:42, 31.97s/it]training loss: 5.929e-03:   1%|          | 2187/300001 [19:20:36<2661:57:46, 32.18s/it]training loss: 5.929e-03:   1%|          | 2188/300001 [19:21:06<2624:59:20, 31.73s/it]training loss: 5.929e-03:   1%|          | 2189/300001 [19:21:38<2615:53:23, 31.62s/it]training loss: 5.929e-03:   1%|          | 2190/300001 [19:22:10<2629:14:33, 31.78s/it]training loss: 5.929e-03:   1%|          | 2191/300001 [19:22:42<2629:24:21, 31.78s/it]training loss: 5.929e-03:   1%|          | 2192/300001 [19:23:14<2630:58:24, 31.80s/it]training loss: 5.929e-03:   1%|          | 2193/300001 [19:23:45<2614:51:40, 31.61s/it]training loss: 5.929e-03:   1%|          | 2194/300001 [19:24:17<2633:57:46, 31.84s/it]training loss: 5.929e-03:   1%|          | 2195/300001 [19:24:50<2652:04:05, 32.06s/it]training loss: 5.929e-03:   1%|          | 2196/300001 [19:25:22<2655:09:38, 32.10s/it]training loss: 5.929e-03:   1%|          | 2197/300001 [19:25:54<2655:14:23, 32.10s/it]training loss: 5.929e-03:   1%|          | 2198/300001 [19:26:16<2405:13:00, 29.08s/it]training loss: 5.929e-03:   1%|          | 2199/300001 [19:26:48<2473:45:23, 29.90s/it]training loss: 5.929e-03:   1%|          | 2200/300001 [19:27:19<2513:10:39, 30.38s/it]training loss: 6.044e-03:   1%|          | 2200/300001 [19:27:51<2513:10:39, 30.38s/it]training loss: 6.044e-03:   1%|          | 2201/300001 [19:27:51<2544:36:06, 30.76s/it]training loss: 6.044e-03:   1%|          | 2202/300001 [19:28:24<2591:27:41, 31.33s/it]training loss: 6.044e-03:   1%|          | 2203/300001 [19:28:55<2586:43:08, 31.27s/it]training loss: 6.044e-03:   1%|          | 2204/300001 [19:29:26<2597:32:20, 31.40s/it]training loss: 6.044e-03:   1%|          | 2205/300001 [19:29:57<2585:15:47, 31.25s/it]training loss: 6.044e-03:   1%|          | 2206/300001 [19:30:29<2604:05:13, 31.48s/it]training loss: 6.044e-03:   1%|          | 2207/300001 [19:31:01<2611:45:20, 31.57s/it]training loss: 6.044e-03:   1%|          | 2208/300001 [19:31:34<2649:54:31, 32.03s/it]training loss: 6.044e-03:   1%|          | 2209/300001 [19:32:07<2665:27:39, 32.22s/it]training loss: 6.044e-03:   1%|          | 2210/300001 [19:32:39<2659:56:03, 32.16s/it]training loss: 6.044e-03:   1%|          | 2211/300001 [19:33:10<2643:19:26, 31.96s/it]training loss: 6.044e-03:   1%|          | 2212/300001 [19:33:42<2632:41:09, 31.83s/it]training loss: 6.044e-03:   1%|          | 2213/300001 [19:34:13<2608:57:18, 31.54s/it]training loss: 6.044e-03:   1%|          | 2214/300001 [19:34:44<2609:26:55, 31.55s/it]training loss: 6.044e-03:   1%|          | 2215/300001 [19:35:15<2587:57:50, 31.29s/it]training loss: 6.044e-03:   1%|          | 2216/300001 [19:35:46<2581:54:32, 31.21s/it]training loss: 6.044e-03:   1%|          | 2217/300001 [19:36:18<2595:00:18, 31.37s/it]training loss: 6.044e-03:   1%|          | 2218/300001 [19:36:51<2631:35:19, 31.81s/it]training loss: 6.044e-03:   1%|          | 2219/300001 [19:37:23<2646:41:34, 32.00s/it]training loss: 6.044e-03:   1%|          | 2220/300001 [19:37:56<2667:06:53, 32.24s/it]training loss: 5.496e-03:   1%|          | 2220/300001 [19:38:27<2667:06:53, 32.24s/it]training loss: 5.496e-03:   1%|          | 2221/300001 [19:38:27<2649:45:00, 32.03s/it]training loss: 5.496e-03:   1%|          | 2222/300001 [19:38:59<2636:21:41, 31.87s/it]training loss: 5.496e-03:   1%|          | 2223/300001 [19:39:31<2632:17:37, 31.82s/it]training loss: 5.496e-03:   1%|          | 2224/300001 [19:40:02<2629:18:53, 31.79s/it]training loss: 5.496e-03:   1%|          | 2225/300001 [19:40:33<2613:21:03, 31.59s/it]training loss: 5.496e-03:   1%|          | 2226/300001 [19:41:06<2640:11:22, 31.92s/it]training loss: 5.496e-03:   1%|          | 2227/300001 [19:41:37<2617:51:38, 31.65s/it]training loss: 5.496e-03:   1%|          | 2228/300001 [19:42:10<2641:27:23, 31.93s/it]training loss: 5.496e-03:   1%|          | 2229/300001 [19:42:40<2601:09:35, 31.45s/it]training loss: 5.496e-03:   1%|          | 2230/300001 [19:43:11<2600:01:13, 31.43s/it]training loss: 5.496e-03:   1%|          | 2231/300001 [19:43:44<2619:21:32, 31.67s/it]training loss: 5.496e-03:   1%|          | 2232/300001 [19:44:15<2621:49:06, 31.70s/it]training loss: 5.496e-03:   1%|          | 2233/300001 [19:44:48<2642:10:44, 31.94s/it]training loss: 5.496e-03:   1%|          | 2234/300001 [19:45:19<2615:10:30, 31.62s/it]training loss: 5.496e-03:   1%|          | 2235/300001 [19:45:51<2618:35:40, 31.66s/it]training loss: 5.496e-03:   1%|          | 2236/300001 [19:46:23<2642:50:07, 31.95s/it]training loss: 5.496e-03:   1%|          | 2237/300001 [19:46:55<2630:44:36, 31.81s/it]training loss: 5.496e-03:   1%|          | 2238/300001 [19:47:26<2614:41:48, 31.61s/it]training loss: 5.496e-03:   1%|          | 2239/300001 [19:47:58<2619:39:53, 31.67s/it]training loss: 5.496e-03:   1%|          | 2240/300001 [19:48:29<2622:29:58, 31.71s/it]training loss: 5.694e-03:   1%|          | 2240/300001 [19:49:01<2622:29:58, 31.71s/it]training loss: 5.694e-03:   1%|          | 2241/300001 [19:49:01<2630:27:46, 31.80s/it]training loss: 5.694e-03:   1%|          | 2242/300001 [19:49:33<2620:22:49, 31.68s/it]training loss: 5.694e-03:   1%|          | 2243/300001 [19:50:04<2602:36:01, 31.47s/it]training loss: 5.694e-03:   1%|          | 2244/300001 [19:50:36<2611:13:11, 31.57s/it]training loss: 5.694e-03:   1%|          | 2245/300001 [19:51:08<2633:32:13, 31.84s/it]training loss: 5.694e-03:   1%|          | 2246/300001 [19:51:38<2594:44:40, 31.37s/it]training loss: 5.694e-03:   1%|          | 2247/300001 [19:52:10<2598:05:32, 31.41s/it]training loss: 5.694e-03:   1%|          | 2248/300001 [19:52:42<2626:18:59, 31.75s/it]training loss: 5.694e-03:   1%|          | 2249/300001 [19:53:14<2612:46:46, 31.59s/it]training loss: 5.694e-03:   1%|          | 2250/300001 [19:53:44<2593:18:29, 31.35s/it]training loss: 5.694e-03:   1%|          | 2251/300001 [19:54:16<2601:38:56, 31.46s/it]training loss: 5.694e-03:   1%|          | 2252/300001 [19:54:48<2615:23:56, 31.62s/it]training loss: 5.694e-03:   1%|          | 2253/300001 [19:55:20<2630:09:18, 31.80s/it]training loss: 5.694e-03:   1%|          | 2254/300001 [19:55:52<2632:45:42, 31.83s/it]training loss: 5.694e-03:   1%|          | 2255/300001 [19:56:24<2622:56:39, 31.71s/it]training loss: 5.694e-03:   1%|          | 2256/300001 [19:56:54<2597:32:39, 31.41s/it]training loss: 5.694e-03:   1%|          | 2257/300001 [19:57:26<2601:49:02, 31.46s/it]training loss: 5.694e-03:   1%|          | 2258/300001 [19:57:57<2600:29:15, 31.44s/it]training loss: 5.694e-03:   1%|          | 2259/300001 [19:58:30<2618:31:40, 31.66s/it]training loss: 5.694e-03:   1%|          | 2260/300001 [19:59:01<2622:29:49, 31.71s/it]slurmstepd: error: *** JOB 9913543 ON gpu018 CANCELLED AT 2026-05-15T12:03:35 DUE TO TIME LIMIT ***
diff --git a/slurm/logs/pidm_darcy_diffusion_9913543.out b/slurm/logs/pidm_darcy_diffusion_9913543.out
new file mode 100644
index 0000000..4b80c77
--- /dev/null
+++ b/slurm/logs/pidm_darcy_diffusion_9913543.out
@@ -0,0 +1 @@
+Number of trainable parameters: 10386482
diff --git a/slurm/logs/pidm_darcy_diffusion_9940441.err b/slurm/logs/pidm_darcy_diffusion_9940441.err
new file mode 100644
index 0000000..7daadb6
--- /dev/null
+++ b/slurm/logs/pidm_darcy_diffusion_9940441.err
@@ -0,0 +1,11 @@
+Traceback (most recent call last):
+  File "<string>", line 1, in <module>
+  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/torch/cuda/__init__.py", line 491, in get_device_name
+    return get_device_properties(device).name
+           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/torch/cuda/__init__.py", line 523, in get_device_properties
+    _lazy_init()  # will define _get_device_properties
+    ^^^^^^^^^^^^
+  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/torch/cuda/__init__.py", line 310, in _lazy_init
+    raise AssertionError("Torch not compiled with CUDA enabled")
+AssertionError: Torch not compiled with CUDA enabled
diff --git a/slurm/logs/pidm_darcy_diffusion_9940441.out b/slurm/logs/pidm_darcy_diffusion_9940441.out
new file mode 100644
index 0000000..bc59c12
--- /dev/null
+++ b/slurm/logs/pidm_darcy_diffusion_9940441.out
@@ -0,0 +1 @@
+False
diff --git a/slurm/logs/pidm_darcy_pg_9913376.err b/slurm/logs/pidm_darcy_pg_9913376.err
new file mode 100644
index 0000000..8b6b7cd
--- /dev/null
+++ b/slurm/logs/pidm_darcy_pg_9913376.err
@@ -0,0 +1,6 @@
+  0%|          | 0/300001 [00:00<?, ?it/s]training loss: 3.411e+00:   0%|          | 0/300001 [00:33<?, ?it/s]training loss: 3.411e+00:   0%|          | 1/300001 [04:18<21507:19:42, 258.09s/it]/cm/local/apps/slurm/var/spool/job9913376/slurm_script: line 29: 2618595 Killed                  python -c "
+import os
+code = open('main.py').read().replace(\"name = 'run_1'\", \"name = '\" + os.environ['PIDM_RUN_NAME'] + \"'\")
+exec(compile(code, 'main.py', 'exec'))
+"
+slurmstepd: error: Detected 1 oom-kill event(s) in StepId=9913376.batch. Some of your processes may have been killed by the cgroup out-of-memory handler.
diff --git a/slurm/logs/pidm_darcy_pg_9913376.out b/slurm/logs/pidm_darcy_pg_9913376.out
new file mode 100644
index 0000000..4b80c77
--- /dev/null
+++ b/slurm/logs/pidm_darcy_pg_9913376.out
@@ -0,0 +1 @@
+Number of trainable parameters: 10386482
diff --git a/slurm/logs/pidm_darcy_pg_9913544.err b/slurm/logs/pidm_darcy_pg_9913544.err
new file mode 100644
index 0000000..e40b4b8
--- /dev/null
+++ b/slurm/logs/pidm_darcy_pg_9913544.err
@@ -0,0 +1 @@
+  0%|          | 0/300001 [00:00<?, ?it/s]training loss: 4.021e+00:   0%|          | 0/300001 [01:33<?, ?it/s]training loss: 4.021e+00:   0%|          | 1/300001 [18:06<90503:40:22, 1086.04s/it]training loss: 4.021e+00:   0%|          | 2/300001 [19:12<40535:38:50, 486.43s/it] training loss: 4.021e+00:   0%|          | 3/300001 [20:14<24358:08:47, 292.30s/it]training loss: 4.021e+00:   0%|          | 4/300001 [21:31<17277:21:38, 207.33s/it]training loss: 4.021e+00:   0%|          | 5/300001 [22:47<13333:54:01, 160.01s/it]training loss: 4.021e+00:   0%|          | 6/300001 [23:34<10139:29:29, 121.68s/it]training loss: 4.021e+00:   0%|          | 7/300001 [24:24<8199:10:52, 98.39s/it]  training loss: 4.021e+00:   0%|          | 8/300001 [25:07<6721:38:59, 80.66s/it]training loss: 4.021e+00:   0%|          | 9/300001 [25:51<5768:08:28, 69.22s/it]training loss: 4.021e+00:   0%|          | 10/300001 [26:42<5298:26:17, 63.58s/it]training loss: 4.021e+00:   0%|          | 11/300001 [27:40<5152:56:31, 61.84s/it]training loss: 4.021e+00:   0%|          | 12/300001 [28:38<5066:06:23, 60.80s/it]training loss: 4.021e+00:   0%|          | 13/300001 [29:28<4786:15:50, 57.44s/it]training loss: 4.021e+00:   0%|          | 14/300001 [30:20<4643:03:44, 55.72s/it]training loss: 4.021e+00:   0%|          | 15/300001 [31:07<4414:16:18, 52.97s/it]training loss: 4.021e+00:   0%|          | 16/300001 [32:21<4954:44:38, 59.46s/it]training loss: 4.021e+00:   0%|          | 17/300001 [33:22<4992:07:49, 59.91s/it]training loss: 4.021e+00:   0%|          | 18/300001 [34:12<4744:36:32, 56.94s/it]training loss: 4.021e+00:   0%|          | 19/300001 [34:57<4438:26:24, 53.26s/it]training loss: 4.021e+00:   0%|          | 20/300001 [35:45<4305:56:08, 51.67s/it]training loss: 1.848e-01:   0%|          | 20/300001 [36:25<4305:56:08, 51.67s/it]training loss: 1.848e-01:   0%|          | 21/300001 [36:26<4035:02:46, 48.42s/it]training loss: 1.848e-01:   0%|          | 22/300001 [37:10<3938:38:45, 47.27s/it]training loss: 1.848e-01:   0%|          | 23/300001 [37:52<3800:39:13, 45.61s/it]training loss: 1.848e-01:   0%|          | 24/300001 [38:38<3821:54:44, 45.87s/it]training loss: 1.848e-01:   0%|          | 25/300001 [39:21<3737:25:31, 44.85s/it]training loss: 1.848e-01:   0%|          | 26/300001 [40:13<3933:04:34, 47.20s/it]training loss: 1.848e-01:   0%|          | 27/300001 [40:58<3874:25:39, 46.50s/it]training loss: 1.848e-01:   0%|          | 28/300001 [41:42<3812:31:26, 45.75s/it]training loss: 1.848e-01:   0%|          | 29/300001 [42:25<3745:45:40, 44.95s/it]training loss: 1.848e-01:   0%|          | 30/300001 [43:25<4106:29:37, 49.28s/it]training loss: 1.848e-01:   0%|          | 31/300001 [45:00<5252:01:23, 63.03s/it]training loss: 1.848e-01:   0%|          | 32/300001 [46:06<5323:37:07, 63.89s/it]training loss: 1.848e-01:   0%|          | 33/300001 [47:04<5188:12:17, 62.27s/it]training loss: 1.848e-01:   0%|          | 34/300001 [48:03<5095:30:14, 61.15s/it]training loss: 1.848e-01:   0%|          | 35/300001 [50:22<7037:08:59, 84.46s/it]training loss: 1.848e-01:   0%|          | 36/300001 [51:35<6755:19:22, 81.07s/it]training loss: 1.848e-01:   0%|          | 37/300001 [52:34<6196:22:28, 74.37s/it]training loss: 1.848e-01:   0%|          | 38/300001 [53:28<5693:37:22, 68.33s/it]training loss: 1.848e-01:   0%|          | 39/300001 [54:15<5159:25:04, 61.92s/it]training loss: 1.848e-01:   0%|          | 40/300001 [55:49<5977:39:45, 71.74s/it]training loss: 6.546e-02:   0%|          | 40/300001 [56:57<5977:39:45, 71.74s/it]training loss: 6.546e-02:   0%|          | 41/300001 [56:57<5882:46:10, 70.60s/it]training loss: 6.546e-02:   0%|          | 42/300001 [57:57<5613:03:42, 67.37s/it]training loss: 6.546e-02:   0%|          | 43/300001 [58:45<5124:39:41, 61.50s/it]training loss: 6.546e-02:   0%|          | 44/300001 [59:29<4685:47:34, 56.24s/it]training loss: 6.546e-02:   0%|          | 45/300001 [1:00:10<4313:15:50, 51.77s/it]training loss: 6.546e-02:   0%|          | 46/300001 [1:01:21<4794:00:46, 57.54s/it]training loss: 6.546e-02:   0%|          | 47/300001 [1:02:33<5148:49:06, 61.80s/it]training loss: 6.546e-02:   0%|          | 48/300001 [1:03:20<4782:58:52, 57.40s/it]training loss: 6.546e-02:   0%|          | 49/300001 [1:04:03<4427:16:58, 53.14s/it]training loss: 6.546e-02:   0%|          | 50/300001 [1:04:48<4226:31:30, 50.73s/it]training loss: 6.546e-02:   0%|          | 51/300001 [1:05:35<4112:42:36, 49.36s/it]training loss: 6.546e-02:   0%|          | 52/300001 [1:06:20<4000:21:45, 48.01s/it]training loss: 6.546e-02:   0%|          | 53/300001 [1:07:05<3934:05:50, 47.22s/it]training loss: 6.546e-02:   0%|          | 54/300001 [1:07:49<3854:36:00, 46.26s/it]training loss: 6.546e-02:   0%|          | 55/300001 [1:08:33<3807:27:36, 45.70s/it]training loss: 6.546e-02:   0%|          | 56/300001 [1:09:21<3845:00:22, 46.15s/it]training loss: 6.546e-02:   0%|          | 57/300001 [1:10:18<4131:12:03, 49.58s/it]training loss: 6.546e-02:   0%|          | 58/300001 [1:11:03<4008:54:15, 48.12s/it]training loss: 6.546e-02:   0%|          | 59/300001 [1:11:49<3959:14:37, 47.52s/it]training loss: 6.546e-02:   0%|          | 60/300001 [1:12:36<3949:39:02, 47.41s/it]training loss: 4.493e-02:   0%|          | 60/300001 [1:13:32<3949:39:02, 47.41s/it]training loss: 4.493e-02:   0%|          | 61/300001 [1:13:32<4160:20:56, 49.93s/it]training loss: 4.493e-02:   0%|          | 62/300001 [1:14:18<4066:33:45, 48.81s/it]training loss: 4.493e-02:   0%|          | 63/300001 [1:15:14<4232:41:06, 50.80s/it]training loss: 4.493e-02:   0%|          | 64/300001 [1:16:23<4708:47:16, 56.52s/it]training loss: 4.493e-02:   0%|          | 65/300001 [1:17:19<4685:35:16, 56.24s/it]training loss: 4.493e-02:   0%|          | 66/300001 [1:18:01<4332:48:04, 52.00s/it]training loss: 4.493e-02:   0%|          | 67/300001 [1:18:57<4429:33:16, 53.17s/it]training loss: 4.493e-02:   0%|          | 68/300001 [1:19:45<4304:33:31, 51.67s/it]training loss: 4.493e-02:   0%|          | 69/300001 [1:20:29<4101:27:28, 49.23s/it]training loss: 4.493e-02:   0%|          | 70/300001 [1:21:17<4086:27:31, 49.05s/it]training loss: 4.493e-02:   0%|          | 71/300001 [1:22:14<4284:40:12, 51.43s/it]training loss: 4.493e-02:   0%|          | 72/300001 [1:23:05<4255:57:28, 51.08s/it]training loss: 4.493e-02:   0%|          | 73/300001 [1:23:47<4030:39:45, 48.38s/it]training loss: 4.493e-02:   0%|          | 74/300001 [1:24:31<3933:47:25, 47.22s/it]training loss: 4.493e-02:   0%|          | 75/300001 [1:25:17<3902:08:23, 46.84s/it]training loss: 4.493e-02:   0%|          | 76/300001 [1:26:12<4098:19:39, 49.19s/it]training loss: 4.493e-02:   0%|          | 77/300001 [1:27:17<4510:38:13, 54.14s/it]training loss: 4.493e-02:   0%|          | 78/300001 [1:28:15<4597:30:35, 55.18s/it]training loss: 4.493e-02:   0%|          | 79/300001 [1:29:20<4848:33:50, 58.20s/it]training loss: 4.493e-02:   0%|          | 80/300001 [1:30:25<4998:04:46, 59.99s/it]training loss: 3.425e-02:   0%|          | 80/300001 [1:31:11<4998:04:46, 59.99s/it]training loss: 3.425e-02:   0%|          | 81/300001 [1:31:11<4665:09:22, 56.00s/it]training loss: 3.425e-02:   0%|          | 82/300001 [1:32:10<4723:17:06, 56.69s/it]training loss: 3.425e-02:   0%|          | 83/300001 [1:32:57<4486:56:23, 53.86s/it]training loss: 3.425e-02:   0%|          | 84/300001 [1:33:48<4417:54:12, 53.03s/it]training loss: 3.425e-02:   0%|          | 85/300001 [1:34:44<4507:30:39, 54.11s/it]training loss: 3.425e-02:   0%|          | 86/300001 [1:35:42<4590:33:23, 55.10s/it]training loss: 3.425e-02:   0%|          | 87/300001 [1:36:22<4220:09:47, 50.66s/it]training loss: 3.425e-02:   0%|          | 88/300001 [1:37:19<4377:35:25, 52.55s/it]training loss: 3.425e-02:   0%|          | 89/300001 [1:38:06<4248:25:13, 51.00s/it]training loss: 3.425e-02:   0%|          | 90/300001 [1:39:00<4319:59:21, 51.86s/it]training loss: 3.425e-02:   0%|          | 91/300001 [1:39:44<4116:40:30, 49.41s/it]training loss: 3.425e-02:   0%|          | 92/300001 [1:40:26<3934:47:22, 47.23s/it]training loss: 3.425e-02:   0%|          | 93/300001 [1:41:07<3766:55:38, 45.22s/it]training loss: 3.425e-02:   0%|          | 94/300001 [1:41:49<3694:52:59, 44.35s/it]training loss: 3.425e-02:   0%|          | 95/300001 [1:42:35<3743:35:23, 44.94s/it]training loss: 3.425e-02:   0%|          | 96/300001 [1:43:25<3855:51:21, 46.28s/it]training loss: 3.425e-02:   0%|          | 97/300001 [1:44:09<3792:17:06, 45.52s/it]training loss: 3.425e-02:   0%|          | 98/300001 [1:44:54<3781:56:23, 45.40s/it]training loss: 3.425e-02:   0%|          | 99/300001 [1:45:50<4045:15:23, 48.56s/it]training loss: 3.425e-02:   0%|          | 100/300001 [1:46:52<4394:23:03, 52.75s/it]training loss: 2.690e-02:   0%|          | 100/300001 [1:47:56<4394:23:03, 52.75s/it]training loss: 2.690e-02:   0%|          | 101/300001 [1:47:56<4681:06:43, 56.19s/it]training loss: 2.690e-02:   0%|          | 102/300001 [1:48:49<4586:32:04, 55.06s/it]training loss: 2.690e-02:   0%|          | 103/300001 [1:49:45<4606:50:03, 55.30s/it]training loss: 2.690e-02:   0%|          | 104/300001 [1:50:49<4844:56:33, 58.16s/it]training loss: 2.690e-02:   0%|          | 105/300001 [1:51:35<4526:36:21, 54.34s/it]training loss: 2.690e-02:   0%|          | 106/300001 [1:52:39<4772:57:23, 57.30s/it]training loss: 2.690e-02:   0%|          | 107/300001 [1:53:34<4712:25:43, 56.57s/it]training loss: 2.690e-02:   0%|          | 108/300001 [1:54:31<4719:59:39, 56.66s/it]training loss: 2.690e-02:   0%|          | 109/300001 [1:55:15<4401:25:42, 52.84s/it]training loss: 2.690e-02:   0%|          | 110/300001 [1:56:14<4551:03:33, 54.63s/it]training loss: 2.690e-02:   0%|          | 111/300001 [1:57:26<5001:00:10, 60.03s/it]training loss: 2.690e-02:   0%|          | 112/300001 [1:58:14<4687:44:57, 56.27s/it]training loss: 2.690e-02:   0%|          | 113/300001 [1:58:58<4376:44:03, 52.54s/it]training loss: 2.690e-02:   0%|          | 114/300001 [1:59:48<4320:43:56, 51.87s/it]training loss: 2.690e-02:   0%|          | 115/300001 [2:00:39<4302:47:19, 51.65s/it]training loss: 2.690e-02:   0%|          | 116/300001 [2:01:33<4370:31:26, 52.47s/it]training loss: 2.690e-02:   0%|          | 117/300001 [2:02:24<4325:17:56, 51.92s/it]training loss: 2.690e-02:   0%|          | 118/300001 [2:03:13<4249:06:23, 51.01s/it]training loss: 2.690e-02:   0%|          | 119/300001 [2:04:01<4182:06:12, 50.20s/it]training loss: 2.690e-02:   0%|          | 120/300001 [2:04:47<4075:52:27, 48.93s/it]training loss: 2.829e-02:   0%|          | 120/300001 [2:05:42<4075:52:27, 48.93s/it]training loss: 2.829e-02:   0%|          | 121/300001 [2:05:42<4219:53:45, 50.66s/it]training loss: 2.829e-02:   0%|          | 122/300001 [2:06:29<4125:18:52, 49.52s/it]training loss: 2.829e-02:   0%|          | 123/300001 [2:07:23<4240:06:48, 50.90s/it]training loss: 2.829e-02:   0%|          | 124/300001 [2:08:16<4289:16:27, 51.49s/it]training loss: 2.829e-02:   0%|          | 125/300001 [2:09:03<4190:55:02, 50.31s/it]training loss: 2.829e-02:   0%|          | 126/300001 [2:09:55<4237:09:27, 50.87s/it]training loss: 2.829e-02:   0%|          | 127/300001 [2:10:57<4508:20:34, 54.12s/it]training loss: 2.829e-02:   0%|          | 128/300001 [2:11:47<4400:52:12, 52.83s/it]training loss: 2.829e-02:   0%|          | 129/300001 [2:12:36<4306:59:52, 51.71s/it]training loss: 2.829e-02:   0%|          | 130/300001 [2:13:19<4086:34:49, 49.06s/it]training loss: 2.829e-02:   0%|          | 131/300001 [2:14:10<4144:11:45, 49.75s/it]training loss: 2.829e-02:   0%|          | 132/300001 [2:14:56<4043:15:17, 48.54s/it]training loss: 2.829e-02:   0%|          | 133/300001 [2:15:44<4029:04:23, 48.37s/it]training loss: 2.829e-02:   0%|          | 134/300001 [2:16:26<3875:11:44, 46.52s/it]training loss: 2.829e-02:   0%|          | 135/300001 [2:17:15<3944:33:36, 47.36s/it]training loss: 2.829e-02:   0%|          | 136/300001 [2:18:07<4053:50:41, 48.67s/it]training loss: 2.829e-02:   0%|          | 137/300001 [2:18:52<3952:33:44, 47.45s/it]training loss: 2.829e-02:   0%|          | 138/300001 [2:19:36<3869:33:12, 46.46s/it]training loss: 2.829e-02:   0%|          | 139/300001 [2:20:21<3840:06:10, 46.10s/it]training loss: 2.829e-02:   0%|          | 140/300001 [2:21:05<3779:56:04, 45.38s/it]training loss: 2.207e-02:   0%|          | 140/300001 [2:21:54<3779:56:04, 45.38s/it]training loss: 2.207e-02:   0%|          | 141/300001 [2:21:54<3873:54:14, 46.51s/it]training loss: 2.207e-02:   0%|          | 142/300001 [2:22:51<4123:07:01, 49.50s/it]training loss: 2.207e-02:   0%|          | 143/300001 [2:23:37<4058:50:39, 48.73s/it]training loss: 2.207e-02:   0%|          | 144/300001 [2:24:32<4206:43:33, 50.50s/it]training loss: 2.207e-02:   0%|          | 145/300001 [2:25:18<4097:21:23, 49.19s/it]training loss: 2.207e-02:   0%|          | 146/300001 [2:26:23<4473:35:08, 53.71s/it]training loss: 2.207e-02:   0%|          | 147/300001 [2:27:21<4602:01:17, 55.25s/it]training loss: 2.207e-02:   0%|          | 148/300001 [2:28:04<4290:16:07, 51.51s/it]training loss: 2.207e-02:   0%|          | 149/300001 [2:28:53<4228:54:50, 50.77s/it]training loss: 2.207e-02:   0%|          | 150/300001 [2:29:36<4031:20:37, 48.40s/it]training loss: 2.207e-02:   0%|          | 151/300001 [2:30:21<3935:40:54, 47.25s/it]training loss: 2.207e-02:   0%|          | 152/300001 [2:31:05<3864:00:14, 46.39s/it]training loss: 2.207e-02:   0%|          | 153/300001 [2:31:48<3771:56:28, 45.29s/it]training loss: 2.207e-02:   0%|          | 154/300001 [2:32:31<3711:43:35, 44.56s/it]training loss: 2.207e-02:   0%|          | 155/300001 [2:33:15<3699:52:33, 44.42s/it]training loss: 2.207e-02:   0%|          | 156/300001 [2:34:00<3718:45:57, 44.65s/it]training loss: 2.207e-02:   0%|          | 157/300001 [2:34:36<3511:18:41, 42.16s/it]training loss: 2.207e-02:   0%|          | 158/300001 [2:35:37<3966:16:19, 47.62s/it]training loss: 2.207e-02:   0%|          | 159/300001 [2:36:22<3901:47:51, 46.85s/it]training loss: 2.207e-02:   0%|          | 160/300001 [2:37:09<3925:57:46, 47.14s/it]training loss: 1.893e-02:   0%|          | 160/300001 [2:37:54<3925:57:46, 47.14s/it]training loss: 1.893e-02:   0%|          | 161/300001 [2:37:54<3866:14:42, 46.42s/it]training loss: 1.893e-02:   0%|          | 162/300001 [2:38:38<3808:36:16, 45.73s/it]training loss: 1.893e-02:   0%|          | 163/300001 [2:39:43<4287:24:28, 51.48s/it]training loss: 1.893e-02:   0%|          | 164/300001 [2:40:39<4383:49:33, 52.63s/it]training loss: 1.893e-02:   0%|          | 165/300001 [2:41:29<4320:23:37, 51.87s/it]training loss: 1.893e-02:   0%|          | 166/300001 [2:42:31<4591:37:41, 55.13s/it]training loss: 1.893e-02:   0%|          | 167/300001 [2:43:24<4527:24:18, 54.36s/it]training loss: 1.893e-02:   0%|          | 168/300001 [2:44:12<4380:02:23, 52.59s/it]training loss: 1.893e-02:   0%|          | 169/300001 [2:45:10<4518:05:17, 54.25s/it]training loss: 1.893e-02:   0%|          | 170/300001 [2:45:54<4255:19:02, 51.09s/it]training loss: 1.893e-02:   0%|          | 171/300001 [2:46:38<4084:17:31, 49.04s/it]training loss: 1.893e-02:   0%|          | 172/300001 [2:47:31<4174:44:34, 50.13s/it]training loss: 1.893e-02:   0%|          | 173/300001 [2:48:41<4673:39:13, 56.12s/it]training loss: 1.893e-02:   0%|          | 174/300001 [2:50:01<5262:43:18, 63.19s/it]training loss: 1.893e-02:   0%|          | 175/300001 [2:50:56<5058:15:40, 60.73s/it]training loss: 1.893e-02:   0%|          | 176/300001 [2:51:36<4552:38:52, 54.66s/it]training loss: 1.893e-02:   0%|          | 177/300001 [2:52:21<4293:26:10, 51.55s/it]training loss: 1.893e-02:   0%|          | 178/300001 [2:53:18<4446:56:07, 53.39s/it]training loss: 1.893e-02:   0%|          | 179/300001 [2:54:02<4209:50:32, 50.55s/it]training loss: 1.893e-02:   0%|          | 180/300001 [2:54:45<4018:43:59, 48.25s/it]training loss: 1.954e-02:   0%|          | 180/300001 [2:55:29<4018:43:59, 48.25s/it]training loss: 1.954e-02:   0%|          | 181/300001 [2:55:29<3904:47:27, 46.89s/it]training loss: 1.954e-02:   0%|          | 182/300001 [2:56:17<3935:43:23, 47.26s/it]training loss: 1.954e-02:   0%|          | 183/300001 [2:57:11<4113:02:35, 49.39s/it]training loss: 1.954e-02:   0%|          | 184/300001 [2:58:04<4186:36:01, 50.27s/it]training loss: 1.954e-02:   0%|          | 185/300001 [2:58:53<4174:07:25, 50.12s/it]training loss: 1.954e-02:   0%|          | 186/300001 [2:59:34<3934:48:46, 47.25s/it]training loss: 1.954e-02:   0%|          | 187/300001 [3:00:22<3940:52:41, 47.32s/it]training loss: 1.954e-02:   0%|          | 188/300001 [3:01:33<4552:17:27, 54.66s/it]training loss: 1.954e-02:   0%|          | 189/300001 [3:02:35<4731:20:30, 56.81s/it]training loss: 1.954e-02:   0%|          | 190/300001 [3:03:24<4520:49:17, 54.28s/it]training loss: 1.954e-02:   0%|          | 191/300001 [3:04:26<4723:38:01, 56.72s/it]training loss: 1.954e-02:   0%|          | 192/300001 [3:05:15<4537:40:54, 54.49s/it]training loss: 1.954e-02:   0%|          | 193/300001 [3:06:00<4306:02:06, 51.71s/it]training loss: 1.954e-02:   0%|          | 194/300001 [3:06:41<4036:28:01, 48.47s/it]training loss: 1.954e-02:   0%|          | 195/300001 [3:07:24<3888:26:38, 46.69s/it]training loss: 1.954e-02:   0%|          | 196/300001 [3:08:12<3925:31:47, 47.14s/it]training loss: 1.954e-02:   0%|          | 197/300001 [3:08:56<3844:08:10, 46.16s/it]training loss: 1.954e-02:   0%|          | 198/300001 [3:09:57<4209:16:54, 50.54s/it]training loss: 1.954e-02:   0%|          | 199/300001 [3:10:54<4368:29:41, 52.46s/it]training loss: 1.954e-02:   0%|          | 200/300001 [3:11:43<4284:12:03, 51.44s/it]training loss: 1.875e-02:   0%|          | 200/300001 [3:12:36<4284:12:03, 51.44s/it]training loss: 1.875e-02:   0%|          | 201/300001 [3:12:36<4336:37:41, 52.07s/it]training loss: 1.875e-02:   0%|          | 202/300001 [3:14:01<5155:04:30, 61.90s/it]training loss: 1.875e-02:   0%|          | 203/300001 [3:14:45<4698:54:40, 56.42s/it]training loss: 1.875e-02:   0%|          | 204/300001 [3:15:36<4566:07:08, 54.83s/it]training loss: 1.875e-02:   0%|          | 205/300001 [3:16:22<4360:59:48, 52.37s/it]training loss: 1.875e-02:   0%|          | 206/300001 [3:17:05<4114:40:32, 49.41s/it]training loss: 1.875e-02:   0%|          | 207/300001 [3:17:46<3907:17:56, 46.92s/it]training loss: 1.875e-02:   0%|          | 208/300001 [3:18:27<3748:51:52, 45.02s/it]training loss: 1.875e-02:   0%|          | 209/300001 [3:19:09<3672:54:13, 44.11s/it]training loss: 1.875e-02:   0%|          | 210/300001 [3:19:51<3637:57:32, 43.69s/it]training loss: 1.875e-02:   0%|          | 211/300001 [3:20:32<3563:35:02, 42.79s/it]training loss: 1.875e-02:   0%|          | 212/300001 [3:21:28<3883:07:58, 46.63s/it]training loss: 1.875e-02:   0%|          | 213/300001 [3:22:13<3846:31:55, 46.19s/it]training loss: 1.875e-02:   0%|          | 214/300001 [3:22:59<3846:04:24, 46.19s/it]training loss: 1.875e-02:   0%|          | 215/300001 [3:23:44<3826:58:42, 45.96s/it]training loss: 1.875e-02:   0%|          | 216/300001 [3:24:40<4062:23:09, 48.78s/it]training loss: 1.875e-02:   0%|          | 217/300001 [3:25:26<4003:18:12, 48.07s/it]training loss: 1.875e-02:   0%|          | 218/300001 [3:26:12<3944:42:26, 47.37s/it]training loss: 1.875e-02:   0%|          | 219/300001 [3:27:12<4269:55:31, 51.28s/it]training loss: 1.875e-02:   0%|          | 220/300001 [3:28:19<4657:21:16, 55.93s/it]training loss: 1.955e-02:   0%|          | 220/300001 [3:29:12<4657:21:16, 55.93s/it]training loss: 1.955e-02:   0%|          | 221/300001 [3:29:12<4591:25:25, 55.14s/it]training loss: 1.955e-02:   0%|          | 222/300001 [3:30:08<4594:24:32, 55.17s/it]training loss: 1.955e-02:   0%|          | 223/300001 [3:31:05<4649:08:44, 55.83s/it]training loss: 1.955e-02:   0%|          | 224/300001 [3:32:14<4969:59:33, 59.68s/it]training loss: 1.955e-02:   0%|          | 225/300001 [3:33:00<4637:39:31, 55.69s/it]training loss: 1.955e-02:   0%|          | 226/300001 [3:33:48<4444:01:46, 53.37s/it]training loss: 1.955e-02:   0%|          | 227/300001 [3:34:33<4238:24:32, 50.90s/it]training loss: 1.955e-02:   0%|          | 228/300001 [3:35:20<4137:17:05, 49.69s/it]training loss: 1.955e-02:   0%|          | 229/300001 [3:36:20<4386:41:10, 52.68s/it]training loss: 1.955e-02:   0%|          | 230/300001 [3:37:12<4368:39:54, 52.46s/it]training loss: 1.955e-02:   0%|          | 231/300001 [3:37:55<4139:46:55, 49.72s/it]training loss: 1.955e-02:   0%|          | 232/300001 [3:38:45<4143:19:21, 49.76s/it]training loss: 1.955e-02:   0%|          | 233/300001 [3:39:30<4018:17:33, 48.26s/it]training loss: 1.955e-02:   0%|          | 234/300001 [3:40:22<4123:43:52, 49.52s/it]training loss: 1.955e-02:   0%|          | 235/300001 [3:41:17<4269:00:11, 51.27s/it]training loss: 1.955e-02:   0%|          | 236/300001 [3:42:27<4720:34:10, 56.69s/it]training loss: 1.955e-02:   0%|          | 237/300001 [3:43:12<4428:19:12, 53.18s/it]training loss: 1.955e-02:   0%|          | 238/300001 [3:44:01<4328:57:24, 51.99s/it]training loss: 1.955e-02:   0%|          | 239/300001 [3:44:44<4098:03:54, 49.22s/it]training loss: 1.955e-02:   0%|          | 240/300001 [3:45:36<4165:46:20, 50.03s/it]training loss: 1.593e-02:   0%|          | 240/300001 [3:46:19<4165:46:20, 50.03s/it]training loss: 1.593e-02:   0%|          | 241/300001 [3:46:19<4008:26:10, 48.14s/it]training loss: 1.593e-02:   0%|          | 242/300001 [3:47:05<3941:06:29, 47.33s/it]training loss: 1.593e-02:   0%|          | 243/300001 [3:47:53<3973:09:21, 47.72s/it]training loss: 1.593e-02:   0%|          | 244/300001 [3:48:44<4049:16:23, 48.63s/it]training loss: 1.593e-02:   0%|          | 245/300001 [3:49:46<4380:01:28, 52.60s/it]training loss: 1.593e-02:   0%|          | 246/300001 [3:51:05<5045:43:27, 60.60s/it]training loss: 1.593e-02:   0%|          | 247/300001 [3:52:20<5408:38:45, 64.96s/it]training loss: 1.593e-02:   0%|          | 248/300001 [3:53:37<5705:22:47, 68.52s/it]training loss: 1.593e-02:   0%|          | 249/300001 [3:54:34<5417:08:10, 65.06s/it]training loss: 1.593e-02:   0%|          | 250/300001 [3:55:21<4950:22:51, 59.45s/it]training loss: 1.593e-02:   0%|          | 251/300001 [3:56:05<4574:58:32, 54.95s/it]training loss: 1.593e-02:   0%|          | 252/300001 [3:56:57<4498:45:02, 54.03s/it]training loss: 1.593e-02:   0%|          | 253/300001 [3:58:03<4804:33:22, 57.70s/it]training loss: 1.593e-02:   0%|          | 254/300001 [3:58:49<4497:50:37, 54.02s/it]training loss: 1.593e-02:   0%|          | 255/300001 [3:59:35<4316:43:26, 51.84s/it]training loss: 1.593e-02:   0%|          | 256/300001 [4:00:35<4512:14:53, 54.19s/it]training loss: 1.593e-02:   0%|          | 257/300001 [4:02:06<5430:36:57, 65.22s/it]training loss: 1.593e-02:   0%|          | 258/300001 [4:03:09<5366:10:46, 64.45s/it]training loss: 1.593e-02:   0%|          | 259/300001 [4:04:24<5629:18:09, 67.61s/it]training loss: 1.593e-02:   0%|          | 260/300001 [4:05:15<5235:10:04, 62.88s/it]training loss: 1.372e-02:   0%|          | 260/300001 [4:06:03<5235:10:04, 62.88s/it]training loss: 1.372e-02:   0%|          | 261/300001 [4:06:03<4854:22:01, 58.30s/it]training loss: 1.372e-02:   0%|          | 262/300001 [4:07:27<5483:07:38, 65.85s/it]training loss: 1.372e-02:   0%|          | 263/300001 [4:08:38<5626:03:15, 67.57s/it]training loss: 1.372e-02:   0%|          | 264/300001 [4:09:24<5076:22:56, 60.97s/it]training loss: 1.372e-02:   0%|          | 265/300001 [4:10:09<4677:37:17, 56.18s/it]training loss: 1.372e-02:   0%|          | 266/300001 [4:10:51<4339:38:16, 52.12s/it]training loss: 1.372e-02:   0%|          | 267/300001 [4:11:42<4297:51:58, 51.62s/it]training loss: 1.372e-02:   0%|          | 268/300001 [4:12:34<4308:26:17, 51.75s/it]training loss: 1.372e-02:   0%|          | 269/300001 [4:13:42<4724:10:56, 56.74s/it]training loss: 1.372e-02:   0%|          | 270/300001 [4:14:36<4642:43:12, 55.76s/it]training loss: 1.372e-02:   0%|          | 271/300001 [4:15:23<4430:23:54, 53.21s/it]training loss: 1.372e-02:   0%|          | 272/300001 [4:16:19<4506:30:19, 54.13s/it]training loss: 1.372e-02:   0%|          | 273/300001 [4:17:04<4260:15:15, 51.17s/it]training loss: 1.372e-02:   0%|          | 274/300001 [4:18:22<4939:45:04, 59.33s/it]training loss: 1.372e-02:   0%|          | 275/300001 [4:19:04<4511:44:59, 54.19s/it]training loss: 1.372e-02:   0%|          | 276/300001 [4:20:03<4617:56:09, 55.47s/it]training loss: 1.372e-02:   0%|          | 277/300001 [4:21:02<4721:41:31, 56.71s/it]training loss: 1.372e-02:   0%|          | 278/300001 [4:22:10<5010:22:05, 60.18s/it]training loss: 1.372e-02:   0%|          | 279/300001 [4:23:07<4910:12:38, 58.98s/it]training loss: 1.372e-02:   0%|          | 280/300001 [4:24:06<4922:35:45, 59.13s/it]training loss: 1.207e-02:   0%|          | 280/300001 [4:25:32<4922:35:45, 59.13s/it]training loss: 1.207e-02:   0%|          | 281/300001 [4:25:32<5598:28:38, 67.24s/it]training loss: 1.207e-02:   0%|          | 282/300001 [4:27:01<6130:18:02, 73.63s/it]training loss: 1.207e-02:   0%|          | 283/300001 [4:28:08<5971:10:33, 71.72s/it]training loss: 1.207e-02:   0%|          | 284/300001 [4:28:57<5405:36:36, 64.93s/it]training loss: 1.207e-02:   0%|          | 285/300001 [4:29:45<4968:05:31, 59.67s/it]training loss: 1.207e-02:   0%|          | 286/300001 [4:30:37<4786:10:13, 57.49s/it]training loss: 1.207e-02:   0%|          | 287/300001 [4:31:31<4698:08:23, 56.43s/it]training loss: 1.207e-02:   0%|          | 288/300001 [4:32:46<5175:00:02, 62.16s/it]training loss: 1.207e-02:   0%|          | 289/300001 [4:33:34<4805:40:56, 57.72s/it]training loss: 1.207e-02:   0%|          | 290/300001 [4:34:21<4532:47:17, 54.45s/it]training loss: 1.207e-02:   0%|          | 291/300001 [4:35:08<4364:44:58, 52.43s/it]training loss: 1.207e-02:   0%|          | 292/300001 [4:35:58<4291:31:36, 51.55s/it]training loss: 1.207e-02:   0%|          | 293/300001 [4:37:04<4665:11:44, 56.04s/it]training loss: 1.207e-02:   0%|          | 294/300001 [4:38:23<5235:42:08, 62.89s/it]training loss: 1.207e-02:   0%|          | 295/300001 [4:39:15<4968:41:42, 59.68s/it]training loss: 1.207e-02:   0%|          | 296/300001 [4:40:11<4873:09:00, 58.54s/it]training loss: 1.207e-02:   0%|          | 297/300001 [4:41:00<4621:06:07, 55.51s/it]training loss: 1.207e-02:   0%|          | 298/300001 [4:41:41<4264:00:06, 51.22s/it]training loss: 1.207e-02:   0%|          | 299/300001 [4:42:22<3999:10:50, 48.04s/it]training loss: 1.207e-02:   0%|          | 300/300001 [4:43:15<4146:27:39, 49.81s/it]training loss: 1.109e-02:   0%|          | 300/300001 [4:43:57<4146:27:39, 49.81s/it]training loss: 1.109e-02:   0%|          | 301/300001 [4:43:57<3935:41:26, 47.28s/it]training loss: 1.109e-02:   0%|          | 302/300001 [4:45:00<4341:57:05, 52.16s/it]training loss: 1.109e-02:   0%|          | 303/300001 [4:46:08<4717:57:19, 56.67s/it]training loss: 1.109e-02:   0%|          | 304/300001 [4:47:08<4819:53:22, 57.90s/it]training loss: 1.109e-02:   0%|          | 305/300001 [4:48:05<4794:34:13, 57.59s/it]training loss: 1.109e-02:   0%|          | 306/300001 [4:49:12<5034:49:49, 60.48s/it]training loss: 1.109e-02:   0%|          | 307/300001 [4:50:17<5131:14:09, 61.64s/it]training loss: 1.109e-02:   0%|          | 308/300001 [4:51:22<5210:39:45, 62.59s/it]training loss: 1.109e-02:   0%|          | 309/300001 [4:52:27<5292:10:48, 63.57s/it]training loss: 1.109e-02:   0%|          | 310/300001 [4:53:18<4976:51:11, 59.78s/it]training loss: 1.109e-02:   0%|          | 311/300001 [4:54:05<4654:53:39, 55.92s/it]training loss: 1.109e-02:   0%|          | 312/300001 [4:54:50<4380:30:35, 52.62s/it]training loss: 1.109e-02:   0%|          | 313/300001 [4:55:37<4234:56:37, 50.87s/it]training loss: 1.109e-02:   0%|          | 314/300001 [4:56:27<4206:08:06, 50.53s/it]training loss: 1.109e-02:   0%|          | 315/300001 [4:57:43<4837:02:58, 58.11s/it]training loss: 1.109e-02:   0%|          | 316/300001 [4:59:12<5614:54:10, 67.45s/it]training loss: 1.109e-02:   0%|          | 317/300001 [5:00:29<5862:27:43, 70.42s/it]training loss: 1.109e-02:   0%|          | 318/300001 [5:01:26<5526:25:05, 66.39s/it]training loss: 1.109e-02:   0%|          | 319/300001 [5:02:20<5217:40:20, 62.68s/it]training loss: 1.109e-02:   0%|          | 320/300001 [5:03:22<5188:22:20, 62.33s/it]training loss: 9.777e-03:   0%|          | 320/300001 [5:04:04<5188:22:20, 62.33s/it]training loss: 9.777e-03:   0%|          | 321/300001 [5:04:04<4681:12:08, 56.23s/it]training loss: 9.777e-03:   0%|          | 322/300001 [5:04:48<4381:13:43, 52.63s/it]training loss: 9.777e-03:   0%|          | 323/300001 [5:05:43<4452:41:03, 53.49s/it]training loss: 9.777e-03:   0%|          | 324/300001 [5:06:34<4379:16:08, 52.61s/it]training loss: 9.777e-03:   0%|          | 325/300001 [5:07:19<4182:30:49, 50.24s/it]training loss: 9.777e-03:   0%|          | 326/300001 [5:08:46<5106:39:39, 61.35s/it]training loss: 9.777e-03:   0%|          | 327/300001 [5:09:45<5051:31:53, 60.68s/it]training loss: 9.777e-03:   0%|          | 328/300001 [5:10:36<4802:15:29, 57.69s/it]training loss: 9.777e-03:   0%|          | 329/300001 [5:11:35<4842:05:07, 58.17s/it]training loss: 9.777e-03:   0%|          | 330/300001 [5:13:19<5982:21:35, 71.87s/it]training loss: 9.777e-03:   0%|          | 331/300001 [5:14:41<6229:18:56, 74.83s/it]training loss: 9.777e-03:   0%|          | 332/300001 [5:15:41<5869:02:46, 70.51s/it]training loss: 9.777e-03:   0%|          | 333/300001 [5:17:43<7163:14:31, 86.05s/it]training loss: 9.777e-03:   0%|          | 334/300001 [5:19:34<7765:57:15, 93.30s/it]training loss: 9.777e-03:   0%|          | 335/300001 [5:21:05<7713:07:13, 92.66s/it]training loss: 9.777e-03:   0%|          | 336/300001 [5:22:26<7423:02:01, 89.18s/it]training loss: 9.777e-03:   0%|          | 337/300001 [5:24:32<8342:16:42, 100.22s/it]training loss: 9.777e-03:   0%|          | 338/300001 [5:25:31<7312:19:21, 87.85s/it] training loss: 9.777e-03:   0%|          | 339/300001 [5:27:10<7603:13:47, 91.34s/it]training loss: 9.777e-03:   0%|          | 340/300001 [5:28:00<6552:48:31, 78.72s/it]training loss: 1.052e-02:   0%|          | 340/300001 [5:28:54<6552:48:31, 78.72s/it]training loss: 1.052e-02:   0%|          | 341/300001 [5:28:55<5959:30:05, 71.60s/it]training loss: 1.052e-02:   0%|          | 342/300001 [5:30:15<6174:24:32, 74.18s/it]training loss: 1.052e-02:   0%|          | 343/300001 [5:31:10<5708:41:18, 68.58s/it]training loss: 1.052e-02:   0%|          | 344/300001 [5:31:58<5192:16:35, 62.38s/it]training loss: 1.052e-02:   0%|          | 345/300001 [5:33:01<5201:24:19, 62.49s/it]training loss: 1.052e-02:   0%|          | 346/300001 [5:34:01<5147:13:23, 61.84s/it]training loss: 1.052e-02:   0%|          | 347/300001 [5:34:58<5018:15:40, 60.29s/it]training loss: 1.052e-02:   0%|          | 348/300001 [5:35:55<4927:24:57, 59.20s/it]training loss: 1.052e-02:   0%|          | 349/300001 [5:36:41<4611:54:52, 55.41s/it]training loss: 1.052e-02:   0%|          | 350/300001 [5:37:30<4454:13:24, 53.51s/it]training loss: 1.052e-02:   0%|          | 351/300001 [5:38:24<4463:27:21, 53.62s/it]training loss: 1.052e-02:   0%|          | 352/300001 [5:39:23<4597:25:12, 55.23s/it]training loss: 1.052e-02:   0%|          | 353/300001 [5:40:06<4301:41:19, 51.68s/it]training loss: 1.052e-02:   0%|          | 354/300001 [5:40:53<4166:56:30, 50.06s/it]training loss: 1.052e-02:   0%|          | 355/300001 [5:41:47<4284:12:12, 51.47s/it]training loss: 1.052e-02:   0%|          | 356/300001 [5:43:04<4899:18:06, 58.86s/it]training loss: 1.052e-02:   0%|          | 357/300001 [5:45:02<6390:22:04, 76.78s/it]training loss: 1.052e-02:   0%|          | 358/300001 [5:46:25<6542:26:53, 78.60s/it]training loss: 1.052e-02:   0%|          | 359/300001 [5:47:16<5856:22:50, 70.36s/it]training loss: 1.052e-02:   0%|          | 360/300001 [5:48:08<5383:12:36, 64.68s/it]training loss: 1.182e-02:   0%|          | 360/300001 [5:49:04<5383:12:36, 64.68s/it]training loss: 1.182e-02:   0%|          | 361/300001 [5:49:04<5169:52:30, 62.11s/it]training loss: 1.182e-02:   0%|          | 362/300001 [5:49:59<5001:44:19, 60.09s/it]training loss: 1.182e-02:   0%|          | 363/300001 [5:50:53<4856:02:58, 58.34s/it]training loss: 1.182e-02:   0%|          | 364/300001 [5:51:44<4661:03:40, 56.00s/it]training loss: 1.182e-02:   0%|          | 365/300001 [5:52:32<4474:27:22, 53.76s/it]training loss: 1.182e-02:   0%|          | 366/300001 [5:53:30<4568:21:15, 54.89s/it]training loss: 1.182e-02:   0%|          | 367/300001 [5:54:34<4787:42:37, 57.52s/it]training loss: 1.182e-02:   0%|          | 368/300001 [5:55:23<4574:03:52, 54.96s/it]training loss: 1.182e-02:   0%|          | 369/300001 [5:56:17<4563:18:21, 54.83s/it]training loss: 1.182e-02:   0%|          | 370/300001 [5:57:05<4380:28:33, 52.63s/it]training loss: 1.182e-02:   0%|          | 371/300001 [5:58:15<4816:06:50, 57.86s/it]training loss: 1.182e-02:   0%|          | 372/300001 [5:59:45<5631:45:41, 67.66s/it]training loss: 1.182e-02:   0%|          | 373/300001 [6:00:35<5173:34:14, 62.16s/it]training loss: 1.182e-02:   0%|          | 374/300001 [6:01:46<5397:36:21, 64.85s/it]training loss: 1.182e-02:   0%|          | 375/300001 [6:03:12<5938:22:44, 71.35s/it]training loss: 1.182e-02:   0%|          | 376/300001 [6:04:25<5985:15:01, 71.91s/it]training loss: 1.182e-02:   0%|          | 377/300001 [6:05:16<5441:19:40, 65.38s/it]training loss: 1.182e-02:   0%|          | 378/300001 [6:06:39<5902:53:17, 70.92s/it]training loss: 1.182e-02:   0%|          | 379/300001 [6:07:47<5821:59:21, 69.95s/it]training loss: 1.182e-02:   0%|          | 380/300001 [6:09:01<5931:33:44, 71.27s/it]training loss: 1.102e-02:   0%|          | 380/300001 [6:09:53<5931:33:44, 71.27s/it]training loss: 1.102e-02:   0%|          | 381/300001 [6:09:53<5436:29:51, 65.32s/it]training loss: 1.102e-02:   0%|          | 382/300001 [6:11:25<6102:47:12, 73.33s/it]training loss: 1.102e-02:   0%|          | 383/300001 [6:13:25<7259:15:39, 87.22s/it]training loss: 1.102e-02:   0%|          | 384/300001 [6:14:13<6298:17:35, 75.68s/it]training loss: 1.102e-02:   0%|          | 385/300001 [6:15:29<6300:08:34, 75.70s/it]training loss: 1.102e-02:   0%|          | 386/300001 [6:16:24<5795:41:19, 69.64s/it]training loss: 1.102e-02:   0%|          | 387/300001 [6:17:09<5177:16:01, 62.21s/it]training loss: 1.102e-02:   0%|          | 388/300001 [6:18:02<4926:36:14, 59.20s/it]training loss: 1.102e-02:   0%|          | 389/300001 [6:18:52<4719:16:18, 56.70s/it]training loss: 1.102e-02:   0%|          | 390/300001 [6:20:01<5010:18:38, 60.20s/it]training loss: 1.102e-02:   0%|          | 391/300001 [6:21:07<5167:52:51, 62.10s/it]training loss: 1.102e-02:   0%|          | 392/300001 [6:21:59<4905:58:12, 58.95s/it]training loss: 1.102e-02:   0%|          | 393/300001 [6:23:18<5410:30:44, 65.01s/it]training loss: 1.102e-02:   0%|          | 394/300001 [6:24:29<5547:37:01, 66.66s/it]training loss: 1.102e-02:   0%|          | 395/300001 [6:25:31<5435:23:06, 65.31s/it]training loss: 1.102e-02:   0%|          | 396/300001 [6:27:02<6083:09:49, 73.09s/it]training loss: 1.102e-02:   0%|          | 397/300001 [6:28:24<6309:02:14, 75.81s/it]training loss: 1.102e-02:   0%|          | 398/300001 [6:29:20<5818:36:38, 69.92s/it]training loss: 1.102e-02:   0%|          | 399/300001 [6:30:06<5208:23:41, 62.58s/it]training loss: 1.102e-02:   0%|          | 400/300001 [6:30:54<4841:04:28, 58.17s/it]training loss: 1.221e-02:   0%|          | 400/300001 [6:32:01<4841:04:28, 58.17s/it]training loss: 1.221e-02:   0%|          | 401/300001 [6:32:01<5062:55:49, 60.84s/it]training loss: 1.221e-02:   0%|          | 402/300001 [6:32:53<4839:25:57, 58.15s/it]training loss: 1.221e-02:   0%|          | 403/300001 [6:34:29<5789:33:20, 69.57s/it]training loss: 1.221e-02:   0%|          | 404/300001 [6:35:17<5244:12:46, 63.02s/it]training loss: 1.221e-02:   0%|          | 405/300001 [6:36:10<4996:10:40, 60.03s/it]training loss: 1.221e-02:   0%|          | 406/300001 [6:37:28<5466:35:33, 65.69s/it]training loss: 1.221e-02:   0%|          | 407/300001 [6:39:11<6393:03:41, 76.82s/it]training loss: 1.221e-02:   0%|          | 408/300001 [6:40:17<6104:48:28, 73.36s/it]training loss: 1.221e-02:   0%|          | 409/300001 [6:41:13<5683:07:36, 68.29s/it]training loss: 1.221e-02:   0%|          | 410/300001 [6:42:12<5458:08:05, 65.59s/it]training loss: 1.221e-02:   0%|          | 411/300001 [6:42:57<4935:03:18, 59.30s/it]training loss: 1.221e-02:   0%|          | 412/300001 [6:43:46<4690:50:46, 56.37s/it]training loss: 1.221e-02:   0%|          | 413/300001 [6:44:45<4757:41:30, 57.17s/it]training loss: 1.221e-02:   0%|          | 414/300001 [6:45:30<4449:07:40, 53.46s/it]training loss: 1.221e-02:   0%|          | 415/300001 [6:46:15<4237:06:00, 50.92s/it]training loss: 1.221e-02:   0%|          | 416/300001 [6:47:02<4132:09:35, 49.65s/it]training loss: 1.221e-02:   0%|          | 417/300001 [6:48:21<4863:17:22, 58.44s/it]training loss: 1.221e-02:   0%|          | 418/300001 [6:49:19<4863:52:49, 58.45s/it]training loss: 1.221e-02:   0%|          | 419/300001 [6:50:05<4542:16:49, 54.58s/it]training loss: 1.221e-02:   0%|          | 420/300001 [6:50:46<4202:51:34, 50.50s/it]training loss: 1.275e-02:   0%|          | 420/300001 [6:51:26<4202:51:34, 50.50s/it]training loss: 1.275e-02:   0%|          | 421/300001 [6:51:26<3933:29:04, 47.27s/it]training loss: 1.275e-02:   0%|          | 422/300001 [6:52:29<4325:03:15, 51.97s/it]training loss: 1.275e-02:   0%|          | 423/300001 [6:53:16<4203:44:05, 50.52s/it]training loss: 1.275e-02:   0%|          | 424/300001 [6:54:16<4441:05:57, 53.37s/it]training loss: 1.275e-02:   0%|          | 425/300001 [6:55:28<4914:32:19, 59.06s/it]training loss: 1.275e-02:   0%|          | 426/300001 [6:57:04<5825:02:45, 70.00s/it]training loss: 1.275e-02:   0%|          | 427/300001 [6:57:51<5256:58:54, 63.17s/it]training loss: 1.275e-02:   0%|          | 428/300001 [6:58:53<5226:53:43, 62.81s/it]training loss: 1.275e-02:   0%|          | 429/300001 [7:00:33<6151:20:40, 73.92s/it]training loss: 1.275e-02:   0%|          | 430/300001 [7:01:43<6054:17:27, 72.76s/it]training loss: 1.275e-02:   0%|          | 431/300001 [7:02:28<5376:08:27, 64.61s/it]training loss: 1.275e-02:   0%|          | 432/300001 [7:03:14<4901:01:30, 58.90s/it]training loss: 1.275e-02:   0%|          | 433/300001 [7:04:07<4745:46:39, 57.03s/it]training loss: 1.275e-02:   0%|          | 434/300001 [7:04:56<4554:38:05, 54.73s/it]training loss: 1.275e-02:   0%|          | 435/300001 [7:05:42<4343:26:38, 52.20s/it]training loss: 1.275e-02:   0%|          | 436/300001 [7:06:51<4761:51:37, 57.23s/it]training loss: 1.275e-02:   0%|          | 437/300001 [7:07:54<4905:09:18, 58.95s/it]training loss: 1.275e-02:   0%|          | 438/300001 [7:08:52<4866:11:30, 58.48s/it]training loss: 1.275e-02:   0%|          | 439/300001 [7:10:19<5595:03:45, 67.24s/it]training loss: 1.275e-02:   0%|          | 440/300001 [7:11:08<5128:16:41, 61.63s/it]training loss: 8.467e-03:   0%|          | 440/300001 [7:12:42<5128:16:41, 61.63s/it]training loss: 8.467e-03:   0%|          | 441/300001 [7:12:42<5945:50:14, 71.45s/it]training loss: 8.467e-03:   0%|          | 442/300001 [7:14:14<6451:19:11, 77.53s/it]training loss: 8.467e-03:   0%|          | 443/300001 [7:15:08<5878:13:18, 70.64s/it]training loss: 8.467e-03:   0%|          | 444/300001 [7:15:56<5293:16:51, 63.61s/it]training loss: 8.467e-03:   0%|          | 445/300001 [7:16:42<4864:02:15, 58.45s/it]training loss: 8.467e-03:   0%|          | 446/300001 [7:17:32<4656:48:04, 55.96s/it]training loss: 8.467e-03:   0%|          | 447/300001 [7:18:24<4552:53:03, 54.72s/it]training loss: 8.467e-03:   0%|          | 448/300001 [7:19:09<4312:25:53, 51.83s/it]training loss: 8.467e-03:   0%|          | 449/300001 [7:19:58<4245:07:23, 51.02s/it]training loss: 8.467e-03:   0%|          | 450/300001 [7:20:45<4149:21:38, 49.87s/it]training loss: 8.467e-03:   0%|          | 451/300001 [7:22:02<4828:05:55, 58.02s/it]training loss: 8.467e-03:   0%|          | 452/300001 [7:23:21<5333:20:46, 64.10s/it]training loss: 8.467e-03:   0%|          | 453/300001 [7:24:05<4842:06:48, 58.19s/it]training loss: 8.467e-03:   0%|          | 454/300001 [7:24:48<4471:12:09, 53.74s/it]training loss: 8.467e-03:   0%|          | 455/300001 [7:26:07<5098:28:50, 61.27s/it]training loss: 8.467e-03:   0%|          | 456/300001 [7:27:05<5018:47:52, 60.32s/it]training loss: 8.467e-03:   0%|          | 457/300001 [7:28:25<5495:35:50, 66.05s/it]training loss: 8.467e-03:   0%|          | 458/300001 [7:29:10<4971:17:14, 59.75s/it]training loss: 8.467e-03:   0%|          | 459/300001 [7:29:56<4641:29:33, 55.78s/it]training loss: 8.467e-03:   0%|          | 460/300001 [7:30:41<4351:59:23, 52.30s/it]training loss: 9.491e-03:   0%|          | 460/300001 [7:31:51<4351:59:23, 52.30s/it]training loss: 9.491e-03:   0%|          | 461/300001 [7:31:51<4809:46:18, 57.81s/it]training loss: 9.491e-03:   0%|          | 462/300001 [7:32:53<4909:58:05, 59.01s/it]training loss: 9.491e-03:   0%|          | 463/300001 [7:33:38<4563:25:22, 54.85s/it]training loss: 9.491e-03:   0%|          | 464/300001 [7:34:31<4514:11:42, 54.25s/it]training loss: 9.491e-03:   0%|          | 465/300001 [7:35:31<4665:37:51, 56.07s/it]training loss: 9.491e-03:   0%|          | 466/300001 [7:36:24<4569:00:51, 54.91s/it]training loss: 9.491e-03:   0%|          | 467/300001 [7:37:15<4492:32:35, 53.99s/it]training loss: 9.491e-03:   0%|          | 468/300001 [7:38:20<4752:32:00, 57.12s/it]training loss: 9.491e-03:   0%|          | 469/300001 [7:39:06<4470:45:39, 53.73s/it]training loss: 9.491e-03:   0%|          | 470/300001 [7:39:53<4311:07:38, 51.81s/it]training loss: 9.491e-03:   0%|          | 471/300001 [7:40:28<3895:04:56, 46.81s/it]training loss: 9.491e-03:   0%|          | 472/300001 [7:41:23<4097:14:01, 49.24s/it]training loss: 9.491e-03:   0%|          | 473/300001 [7:42:21<4312:14:51, 51.83s/it]training loss: 9.491e-03:   0%|          | 474/300001 [7:43:37<4920:11:27, 59.14s/it]training loss: 9.491e-03:   0%|          | 475/300001 [7:44:26<4655:45:43, 55.96s/it]training loss: 9.491e-03:   0%|          | 476/300001 [7:45:40<5124:11:20, 61.59s/it]training loss: 9.491e-03:   0%|          | 477/300001 [7:46:44<5175:11:48, 62.20s/it]training loss: 9.491e-03:   0%|          | 478/300001 [7:47:39<4994:14:26, 60.03s/it]training loss: 9.491e-03:   0%|          | 479/300001 [7:48:25<4639:31:16, 55.76s/it]training loss: 9.491e-03:   0%|          | 480/300001 [7:49:19<4611:55:18, 55.43s/it]training loss: 9.263e-03:   0%|          | 480/300001 [7:50:29<4611:55:18, 55.43s/it]training loss: 9.263e-03:   0%|          | 481/300001 [7:50:29<4970:55:52, 59.75s/it]training loss: 9.263e-03:   0%|          | 482/300001 [7:51:19<4732:03:05, 56.88s/it]training loss: 9.263e-03:   0%|          | 483/300001 [7:52:13<4648:41:13, 55.87s/it]training loss: 9.263e-03:   0%|          | 484/300001 [7:53:06<4579:03:48, 55.04s/it]training loss: 9.263e-03:   0%|          | 485/300001 [7:54:00<4548:37:27, 54.67s/it]training loss: 9.263e-03:   0%|          | 486/300001 [7:54:51<4465:07:21, 53.67s/it]training loss: 9.263e-03:   0%|          | 487/300001 [7:55:58<4805:12:02, 57.76s/it]training loss: 9.263e-03:   0%|          | 488/300001 [7:57:28<5604:11:34, 67.36s/it]training loss: 9.263e-03:   0%|          | 489/300001 [7:58:44<5815:52:08, 69.90s/it]training loss: 9.263e-03:   0%|          | 490/300001 [7:59:51<5751:34:04, 69.13s/it]training loss: 9.263e-03:   0%|          | 491/300001 [8:00:48<5435:20:56, 65.33s/it]training loss: 9.263e-03:   0%|          | 492/300001 [8:01:38<5056:18:19, 60.78s/it]training loss: 9.263e-03:   0%|          | 493/300001 [8:02:25<4718:21:13, 56.71s/it]training loss: 9.263e-03:   0%|          | 494/300001 [8:03:11<4453:52:36, 53.53s/it]training loss: 9.263e-03:   0%|          | 495/300001 [8:04:09<4560:09:54, 54.81s/it]training loss: 9.263e-03:   0%|          | 496/300001 [8:05:42<5510:35:34, 66.24s/it]training loss: 9.263e-03:   0%|          | 497/300001 [8:07:06<5945:14:09, 71.46s/it]training loss: 9.263e-03:   0%|          | 498/300001 [8:08:13<5847:53:24, 70.29s/it]training loss: 9.263e-03:   0%|          | 499/300001 [8:09:46<6409:37:55, 77.04s/it]training loss: 9.263e-03:   0%|          | 500/300001 [8:11:00<6331:55:08, 76.11s/it]training loss: 7.550e-03:   0%|          | 500/300001 [8:12:09<6331:55:08, 76.11s/it]training loss: 7.550e-03:   0%|          | 501/300001 [8:12:30<6672:09:08, 80.20s/it]training loss: 7.550e-03:   0%|          | 502/300001 [8:13:13<5758:27:18, 69.22s/it]training loss: 7.550e-03:   0%|          | 503/300001 [8:13:59<5173:39:32, 62.19s/it]training loss: 7.550e-03:   0%|          | 504/300001 [8:14:45<4755:51:49, 57.17s/it]training loss: 7.550e-03:   0%|          | 505/300001 [8:15:31<4478:22:24, 53.83s/it]training loss: 7.550e-03:   0%|          | 506/300001 [8:16:15<4244:44:36, 51.02s/it]training loss: 7.550e-03:   0%|          | 507/300001 [8:16:59<4071:41:57, 48.94s/it]training loss: 7.550e-03:   0%|          | 508/300001 [8:17:51<4142:23:08, 49.79s/it]training loss: 7.550e-03:   0%|          | 509/300001 [8:18:38<4075:38:55, 48.99s/it]training loss: 7.550e-03:   0%|          | 510/300001 [8:19:30<4139:55:11, 49.76s/it]training loss: 7.550e-03:   0%|          | 511/300001 [8:20:13<3987:56:26, 47.94s/it]training loss: 7.550e-03:   0%|          | 512/300001 [8:21:00<3949:38:43, 47.48s/it]training loss: 7.550e-03:   0%|          | 513/300001 [8:21:44<3871:03:17, 46.53s/it]training loss: 7.550e-03:   0%|          | 514/300001 [8:22:36<3994:08:47, 48.01s/it]training loss: 7.550e-03:   0%|          | 515/300001 [8:23:33<4238:52:42, 50.95s/it]training loss: 7.550e-03:   0%|          | 516/300001 [8:24:18<4083:36:54, 49.09s/it]training loss: 7.550e-03:   0%|          | 517/300001 [8:25:03<3983:09:38, 47.88s/it]training loss: 7.550e-03:   0%|          | 518/300001 [8:26:01<4236:52:32, 50.93s/it]training loss: 7.550e-03:   0%|          | 519/300001 [8:27:07<4618:57:09, 55.52s/it]training loss: 7.550e-03:   0%|          | 520/300001 [8:28:04<4643:38:18, 55.82s/it]training loss: 8.955e-03:   0%|          | 520/300001 [8:28:59<4643:38:18, 55.82s/it]training loss: 8.955e-03:   0%|          | 521/300001 [8:28:59<4634:24:31, 55.71s/it]training loss: 8.955e-03:   0%|          | 522/300001 [8:29:44<4348:12:25, 52.27s/it]training loss: 8.955e-03:   0%|          | 523/300001 [8:30:55<4814:48:55, 57.88s/it]training loss: 8.955e-03:   0%|          | 524/300001 [8:31:41<4526:54:26, 54.42s/it]training loss: 8.955e-03:   0%|          | 525/300001 [8:32:43<4718:38:00, 56.72s/it]training loss: 8.955e-03:   0%|          | 526/300001 [8:33:45<4845:11:42, 58.24s/it]training loss: 8.955e-03:   0%|          | 527/300001 [8:34:31<4549:37:18, 54.69s/it]training loss: 8.955e-03:   0%|          | 528/300001 [8:35:46<5040:59:42, 60.60s/it]training loss: 8.955e-03:   0%|          | 529/300001 [8:37:20<5888:40:37, 70.79s/it]training loss: 8.955e-03:   0%|          | 530/300001 [8:38:35<5981:07:49, 71.90s/it]training loss: 8.955e-03:   0%|          | 531/300001 [8:39:35<5699:32:26, 68.52s/it]training loss: 8.955e-03:   0%|          | 532/300001 [8:41:06<6248:18:26, 75.11s/it]training loss: 8.955e-03:   0%|          | 533/300001 [8:42:34<6571:23:27, 79.00s/it]training loss: 8.955e-03:   0%|          | 534/300001 [8:44:06<6899:15:36, 82.94s/it]training loss: 8.955e-03:   0%|          | 535/300001 [8:45:19<6662:48:01, 80.10s/it]training loss: 8.955e-03:   0%|          | 536/300001 [8:47:15<7545:43:54, 90.71s/it]training loss: 8.955e-03:   0%|          | 537/300001 [8:48:31<7190:09:20, 86.44s/it]training loss: 8.955e-03:   0%|          | 538/300001 [8:49:28<6449:14:35, 77.53s/it]training loss: 8.955e-03:   0%|          | 539/300001 [8:50:19<5778:19:40, 69.46s/it]training loss: 8.955e-03:   0%|          | 540/300001 [8:51:10<5327:44:40, 64.05s/it]training loss: 8.234e-03:   0%|          | 540/300001 [8:52:22<5327:44:40, 64.05s/it]training loss: 8.234e-03:   0%|          | 541/300001 [8:52:22<5530:08:59, 66.48s/it]training loss: 8.234e-03:   0%|          | 542/300001 [8:53:14<5147:16:35, 61.88s/it]training loss: 8.234e-03:   0%|          | 543/300001 [8:54:11<5027:24:10, 60.44s/it]training loss: 8.234e-03:   0%|          | 544/300001 [8:54:59<4733:29:23, 56.90s/it]training loss: 8.234e-03:   0%|          | 545/300001 [8:56:08<5033:17:08, 60.51s/it]training loss: 8.234e-03:   0%|          | 546/300001 [8:57:46<5959:30:17, 71.64s/it]training loss: 8.234e-03:   0%|          | 547/300001 [8:58:46<5686:01:35, 68.36s/it]training loss: 8.234e-03:   0%|          | 548/300001 [8:59:39<5293:20:53, 63.64s/it]training loss: 8.234e-03:   0%|          | 549/300001 [9:00:32<5026:15:35, 60.43s/it]training loss: 8.234e-03:   0%|          | 550/300001 [9:01:23<4784:40:27, 57.52s/it]training loss: 8.234e-03:   0%|          | 551/300001 [9:02:18<4737:16:35, 56.95s/it]training loss: 8.234e-03:   0%|          | 552/300001 [9:03:17<4769:55:40, 57.34s/it]training loss: 8.234e-03:   0%|          | 553/300001 [9:04:12<4726:16:50, 56.82s/it]training loss: 8.234e-03:   0%|          | 554/300001 [9:05:14<4852:55:49, 58.34s/it]training loss: 8.234e-03:   0%|          | 555/300001 [9:06:21<5065:28:41, 60.90s/it]training loss: 8.234e-03:   0%|          | 556/300001 [9:07:14<4858:18:20, 58.41s/it]training loss: 8.234e-03:   0%|          | 557/300001 [9:08:19<5033:25:19, 60.51s/it]training loss: 8.234e-03:   0%|          | 558/300001 [9:09:17<4958:10:16, 59.61s/it]training loss: 8.234e-03:   0%|          | 559/300001 [9:10:14<4904:50:55, 58.97s/it]training loss: 8.234e-03:   0%|          | 560/300001 [9:11:02<4641:48:24, 55.81s/it]training loss: 8.382e-03:   0%|          | 560/300001 [9:11:57<4641:48:24, 55.81s/it]training loss: 8.382e-03:   0%|          | 561/300001 [9:11:57<4614:34:14, 55.48s/it]training loss: 8.382e-03:   0%|          | 562/300001 [9:12:41<4332:49:00, 52.09s/it]training loss: 8.382e-03:   0%|          | 563/300001 [9:13:24<4091:04:17, 49.18s/it]training loss: 8.382e-03:   0%|          | 564/300001 [9:14:12<4068:46:27, 48.92s/it]training loss: 8.382e-03:   0%|          | 565/300001 [9:14:55<3927:10:12, 47.21s/it]training loss: 8.382e-03:   0%|          | 566/300001 [9:15:40<3865:13:21, 46.47s/it]training loss: 8.382e-03:   0%|          | 567/300001 [9:16:34<4051:38:00, 48.71s/it]training loss: 8.382e-03:   0%|          | 568/300001 [9:17:27<4170:46:47, 50.14s/it]training loss: 8.382e-03:   0%|          | 569/300001 [9:18:18<4172:30:18, 50.17s/it]training loss: 8.382e-03:   0%|          | 570/300001 [9:19:05<4102:42:35, 49.33s/it]training loss: 8.382e-03:   0%|          | 571/300001 [9:20:04<4333:22:26, 52.10s/it]training loss: 8.382e-03:   0%|          | 572/300001 [9:21:22<5000:22:03, 60.12s/it]training loss: 8.382e-03:   0%|          | 573/300001 [9:22:33<5272:44:24, 63.39s/it]training loss: 8.382e-03:   0%|          | 574/300001 [9:23:33<5178:11:27, 62.26s/it]training loss: 8.382e-03:   0%|          | 575/300001 [9:24:20<4788:01:42, 57.57s/it]training loss: 8.382e-03:   0%|          | 576/300001 [9:25:05<4481:08:22, 53.88s/it]training loss: 8.382e-03:   0%|          | 577/300001 [9:25:50<4254:48:58, 51.16s/it]training loss: 8.382e-03:   0%|          | 578/300001 [9:26:32<4039:56:45, 48.57s/it]training loss: 8.382e-03:   0%|          | 579/300001 [9:27:17<3946:55:20, 47.45s/it]training loss: 8.382e-03:   0%|          | 580/300001 [9:28:05<3949:06:14, 47.48s/it]training loss: 8.041e-03:   0%|          | 580/300001 [9:28:52<3949:06:14, 47.48s/it]training loss: 8.041e-03:   0%|          | 581/300001 [9:28:52<3951:55:17, 47.51s/it]training loss: 8.041e-03:   0%|          | 582/300001 [9:29:37<3880:51:53, 46.66s/it]training loss: 8.041e-03:   0%|          | 583/300001 [9:31:01<4815:00:21, 57.89s/it]training loss: 8.041e-03:   0%|          | 584/300001 [9:32:05<4955:51:02, 59.59s/it]training loss: 8.041e-03:   0%|          | 585/300001 [9:32:51<4626:04:36, 55.62s/it]training loss: 8.041e-03:   0%|          | 586/300001 [9:33:38<4411:08:30, 53.04s/it]training loss: 8.041e-03:   0%|          | 587/300001 [9:34:34<4495:49:46, 54.06s/it]training loss: 8.041e-03:   0%|          | 588/300001 [9:36:18<5724:40:08, 68.83s/it]training loss: 8.041e-03:   0%|          | 589/300001 [9:37:07<5227:27:13, 62.85s/it]training loss: 8.041e-03:   0%|          | 590/300001 [9:38:01<5010:19:59, 60.24s/it]training loss: 8.041e-03:   0%|          | 591/300001 [9:38:47<4663:32:19, 56.07s/it]training loss: 8.041e-03:   0%|          | 592/300001 [9:39:38<4521:57:27, 54.37s/it]training loss: 8.041e-03:   0%|          | 593/300001 [9:40:29<4448:45:49, 53.49s/it]training loss: 8.041e-03:   0%|          | 594/300001 [9:41:22<4432:40:35, 53.30s/it]training loss: 8.041e-03:   0%|          | 595/300001 [9:42:11<4331:50:38, 52.09s/it]training loss: 8.041e-03:   0%|          | 596/300001 [9:43:00<4247:35:51, 51.07s/it]training loss: 8.041e-03:   0%|          | 597/300001 [9:44:11<4738:38:11, 56.98s/it]training loss: 8.041e-03:   0%|          | 598/300001 [9:44:59<4518:05:23, 54.33s/it]training loss: 8.041e-03:   0%|          | 599/300001 [9:45:51<4480:06:29, 53.87s/it]training loss: 8.041e-03:   0%|          | 600/300001 [9:46:36<4251:48:19, 51.12s/it]training loss: 9.452e-03:   0%|          | 600/300001 [9:47:21<4251:48:19, 51.12s/it]training loss: 9.452e-03:   0%|          | 601/300001 [9:47:21<4098:13:04, 49.28s/it]training loss: 9.452e-03:   0%|          | 602/300001 [9:48:54<5197:04:02, 62.49s/it]training loss: 9.452e-03:   0%|          | 603/300001 [9:50:21<5802:56:17, 69.78s/it]training loss: 9.452e-03:   0%|          | 604/300001 [9:51:24<5639:53:47, 67.82s/it]training loss: 9.452e-03:   0%|          | 605/300001 [9:52:45<5966:33:49, 71.74s/it]training loss: 9.452e-03:   0%|          | 606/300001 [9:54:00<6037:08:15, 72.59s/it]training loss: 9.452e-03:   0%|          | 607/300001 [9:54:54<5564:21:33, 66.91s/it]training loss: 9.452e-03:   0%|          | 608/300001 [9:55:39<5023:27:30, 60.40s/it]training loss: 9.452e-03:   0%|          | 609/300001 [9:56:25<4660:04:21, 56.03s/it]training loss: 9.452e-03:   0%|          | 610/300001 [9:57:10<4386:55:44, 52.75s/it]training loss: 9.452e-03:   0%|          | 611/300001 [9:58:11<4594:10:59, 55.24s/it]training loss: 9.452e-03:   0%|          | 612/300001 [9:59:01<4465:13:53, 53.69s/it]training loss: 9.452e-03:   0%|          | 613/300001 [10:00:07<4769:43:47, 57.35s/it]training loss: 9.452e-03:   0%|          | 614/300001 [10:01:05<4779:57:06, 57.48s/it]training loss: 9.452e-03:   0%|          | 615/300001 [10:01:53<4558:11:26, 54.81s/it]training loss: 9.452e-03:   0%|          | 616/300001 [10:02:48<4552:55:00, 54.75s/it]training loss: 9.452e-03:   0%|          | 617/300001 [10:04:14<5345:05:00, 64.27s/it]training loss: 9.452e-03:   0%|          | 618/300001 [10:05:09<5101:59:03, 61.35s/it]training loss: 9.452e-03:   0%|          | 619/300001 [10:06:40<5852:48:14, 70.38s/it]training loss: 9.452e-03:   0%|          | 620/300001 [10:07:52<5884:30:58, 70.76s/it]training loss: 9.456e-03:   0%|          | 620/300001 [10:08:42<5884:30:58, 70.76s/it]training loss: 9.456e-03:   0%|          | 621/300001 [10:08:42<5375:37:54, 64.64s/it]training loss: 9.456e-03:   0%|          | 622/300001 [10:10:07<5882:32:10, 70.74s/it]training loss: 9.456e-03:   0%|          | 623/300001 [10:11:21<5970:34:21, 71.80s/it]training loss: 9.456e-03:   0%|          | 624/300001 [10:12:28<5846:30:51, 70.30s/it]training loss: 9.456e-03:   0%|          | 625/300001 [10:13:26<5530:16:21, 66.50s/it]training loss: 9.456e-03:   0%|          | 626/300001 [10:14:16<5120:02:43, 61.57s/it]training loss: 9.456e-03:   0%|          | 627/300001 [10:15:04<4783:34:27, 57.52s/it]training loss: 9.456e-03:   0%|          | 628/300001 [10:16:07<4917:13:32, 59.13s/it]training loss: 9.456e-03:   0%|          | 629/300001 [10:17:23<5349:11:01, 64.32s/it]training loss: 9.456e-03:   0%|          | 630/300001 [10:18:14<5016:06:31, 60.32s/it]training loss: 9.456e-03:   0%|          | 631/300001 [10:19:36<5554:28:41, 66.79s/it]training loss: 9.456e-03:   0%|          | 632/300001 [10:20:48<5689:19:00, 68.42s/it]training loss: 9.456e-03:   0%|          | 633/300001 [10:22:49<6986:41:33, 84.02s/it]training loss: 9.456e-03:   0%|          | 634/300001 [10:24:11<6945:48:34, 83.53s/it]training loss: 9.456e-03:   0%|          | 635/300001 [10:25:37<7010:32:00, 84.30s/it]training loss: 9.456e-03:   0%|          | 636/300001 [10:26:57<6892:40:27, 82.89s/it]training loss: 9.456e-03:   0%|          | 637/300001 [10:28:43<7472:27:15, 89.86s/it]training loss: 9.456e-03:   0%|          | 638/300001 [10:29:51<6928:40:25, 83.32s/it]training loss: 9.456e-03:   0%|          | 639/300001 [10:31:18<7006:53:36, 84.26s/it]training loss: 9.456e-03:   0%|          | 640/300001 [10:32:39<6934:28:31, 83.39s/it]training loss: 7.615e-03:   0%|          | 640/300001 [10:34:24<6934:28:31, 83.39s/it]training loss: 7.615e-03:   0%|          | 641/300001 [10:34:24<7477:49:57, 89.93s/it]training loss: 7.615e-03:   0%|          | 642/300001 [10:35:56<7521:16:36, 90.45s/it]training loss: 7.615e-03:   0%|          | 643/300001 [10:37:26<7508:16:48, 90.29s/it]training loss: 7.615e-03:   0%|          | 644/300001 [10:38:22<6652:11:27, 80.00s/it]training loss: 7.615e-03:   0%|          | 645/300001 [10:39:52<6909:55:59, 83.10s/it]training loss: 7.615e-03:   0%|          | 646/300001 [10:40:38<5981:30:19, 71.93s/it]training loss: 7.615e-03:   0%|          | 647/300001 [10:41:25<5349:02:06, 64.33s/it]training loss: 7.615e-03:   0%|          | 648/300001 [10:42:12<4920:43:43, 59.18s/it]training loss: 7.615e-03:   0%|          | 649/300001 [10:43:38<5605:37:41, 67.41s/it]training loss: 7.615e-03:   0%|          | 650/300001 [10:44:41<5476:32:18, 65.86s/it]training loss: 7.615e-03:   0%|          | 651/300001 [10:45:53<5649:43:12, 67.94s/it]training loss: 7.615e-03:   0%|          | 652/300001 [10:46:47<5281:56:41, 63.52s/it]training loss: 7.615e-03:   0%|          | 653/300001 [10:47:34<4880:07:13, 58.69s/it]training loss: 7.615e-03:   0%|          | 654/300001 [10:48:20<4573:10:39, 55.00s/it]training loss: 7.615e-03:   0%|          | 655/300001 [10:49:12<4477:34:06, 53.85s/it]training loss: 7.615e-03:   0%|          | 656/300001 [10:50:01<4375:12:23, 52.62s/it]training loss: 7.615e-03:   0%|          | 657/300001 [10:50:49<4247:35:21, 51.08s/it]training loss: 7.615e-03:   0%|          | 658/300001 [10:51:54<4597:00:06, 55.29s/it]training loss: 7.615e-03:   0%|          | 659/300001 [10:53:03<4952:55:19, 59.57s/it]training loss: 7.615e-03:   0%|          | 660/300001 [10:53:58<4819:31:11, 57.96s/it]training loss: 8.086e-03:   0%|          | 660/300001 [10:54:40<4819:31:11, 57.96s/it]training loss: 8.086e-03:   0%|          | 661/300001 [10:54:40<4421:12:31, 53.17s/it]training loss: 8.086e-03:   0%|          | 662/300001 [10:55:26<4260:36:23, 51.24s/it]training loss: 8.086e-03:   0%|          | 663/300001 [10:56:18<4265:05:25, 51.29s/it]training loss: 8.086e-03:   0%|          | 664/300001 [10:57:30<4791:21:04, 57.62s/it]training loss: 8.086e-03:   0%|          | 665/300001 [10:58:46<5238:53:47, 63.01s/it]training loss: 8.086e-03:   0%|          | 666/300001 [10:59:39<5007:20:57, 60.22s/it]training loss: 8.086e-03:   0%|          | 667/300001 [11:00:32<4810:53:01, 57.86s/it]training loss: 8.086e-03:   0%|          | 668/300001 [11:01:43<5145:36:26, 61.88s/it]training loss: 8.086e-03:   0%|          | 669/300001 [11:02:34<4863:30:23, 58.49s/it]training loss: 8.086e-03:   0%|          | 670/300001 [11:03:42<5114:26:17, 61.51s/it]training loss: 8.086e-03:   0%|          | 671/300001 [11:04:50<5267:03:25, 63.35s/it]training loss: 8.086e-03:   0%|          | 672/300001 [11:05:44<5041:03:34, 60.63s/it]training loss: 8.086e-03:   0%|          | 673/300001 [11:06:46<5072:42:04, 61.01s/it]training loss: 8.086e-03:   0%|          | 674/300001 [11:07:49<5131:28:41, 61.72s/it]training loss: 8.086e-03:   0%|          | 675/300001 [11:08:47<5028:29:09, 60.48s/it]training loss: 8.086e-03:   0%|          | 676/300001 [11:10:35<6202:20:59, 74.60s/it]training loss: 8.086e-03:   0%|          | 677/300001 [11:12:35<7349:19:58, 88.39s/it]training loss: 8.086e-03:   0%|          | 678/300001 [11:13:43<6847:19:34, 82.35s/it]training loss: 8.086e-03:   0%|          | 679/300001 [11:14:49<6436:37:52, 77.41s/it]training loss: 8.086e-03:   0%|          | 680/300001 [11:15:37<5700:03:42, 68.56s/it]training loss: 8.547e-03:   0%|          | 680/300001 [11:16:31<5700:03:42, 68.56s/it]training loss: 8.547e-03:   0%|          | 681/300001 [11:16:31<5332:26:05, 64.13s/it]training loss: 8.547e-03:   0%|          | 682/300001 [11:17:44<5550:55:57, 66.76s/it]training loss: 8.547e-03:   0%|          | 683/300001 [11:18:57<5721:44:45, 68.82s/it]training loss: 8.547e-03:   0%|          | 684/300001 [11:20:01<5583:31:12, 67.16s/it]training loss: 8.547e-03:   0%|          | 685/300001 [11:20:53<5207:43:51, 62.64s/it]training loss: 8.547e-03:   0%|          | 686/300001 [11:21:38<4780:47:04, 57.50s/it]training loss: 8.547e-03:   0%|          | 687/300001 [11:22:39<4859:52:34, 58.45s/it]training loss: 8.547e-03:   0%|          | 688/300001 [11:23:47<5109:38:45, 61.46s/it]training loss: 8.547e-03:   0%|          | 689/300001 [11:25:05<5510:51:40, 66.28s/it]training loss: 8.547e-03:   0%|          | 690/300001 [11:26:29<5941:38:29, 71.46s/it]training loss: 8.547e-03:   0%|          | 691/300001 [11:27:57<6360:07:45, 76.50s/it]training loss: 8.547e-03:   0%|          | 692/300001 [11:29:17<6440:21:19, 77.46s/it]training loss: 8.547e-03:   0%|          | 693/300001 [11:30:12<5879:27:44, 70.72s/it]training loss: 8.547e-03:   0%|          | 694/300001 [11:31:35<6201:56:16, 74.60s/it]training loss: 8.547e-03:   0%|          | 695/300001 [11:32:42<6005:31:38, 72.23s/it]training loss: 8.547e-03:   0%|          | 696/300001 [11:33:48<5863:12:37, 70.52s/it]training loss: 8.547e-03:   0%|          | 697/300001 [11:34:57<5814:17:59, 69.93s/it]training loss: 8.547e-03:   0%|          | 698/300001 [11:36:47<6814:06:06, 81.96s/it]training loss: 8.547e-03:   0%|          | 699/300001 [11:37:57<6511:51:25, 78.32s/it]training loss: 8.547e-03:   0%|          | 700/300001 [11:39:09<6352:45:21, 76.41s/it]training loss: 7.364e-03:   0%|          | 700/300001 [11:40:32<6352:45:21, 76.41s/it]training loss: 7.364e-03:   0%|          | 701/300001 [11:40:32<6521:24:43, 78.44s/it]training loss: 7.364e-03:   0%|          | 702/300001 [11:41:35<6138:31:39, 73.83s/it]training loss: 7.364e-03:   0%|          | 703/300001 [11:42:18<5362:15:20, 64.50s/it]training loss: 7.364e-03:   0%|          | 704/300001 [11:42:59<4794:16:03, 57.67s/it]training loss: 7.364e-03:   0%|          | 705/300001 [11:43:45<4493:13:11, 54.05s/it]training loss: 7.364e-03:   0%|          | 706/300001 [11:44:30<4273:37:29, 51.40s/it]training loss: 7.364e-03:   0%|          | 707/300001 [11:45:19<4198:03:16, 50.50s/it]training loss: 7.364e-03:   0%|          | 708/300001 [11:46:08<4171:07:27, 50.17s/it]training loss: 7.364e-03:   0%|          | 709/300001 [11:47:17<4626:50:19, 55.65s/it]training loss: 7.364e-03:   0%|          | 710/300001 [11:48:54<5657:49:13, 68.05s/it]training loss: 7.364e-03:   0%|          | 711/300001 [11:50:15<5997:28:00, 72.14s/it]training loss: 7.364e-03:   0%|          | 712/300001 [11:51:24<5906:53:13, 71.05s/it]training loss: 7.364e-03:   0%|          | 713/300001 [11:52:30<5790:49:23, 69.66s/it]training loss: 7.364e-03:   0%|          | 714/300001 [11:53:46<5942:03:32, 71.47s/it]training loss: 7.364e-03:   0%|          | 715/300001 [11:54:41<5532:34:51, 66.55s/it]training loss: 7.364e-03:   0%|          | 716/300001 [11:55:39<5331:35:09, 64.13s/it]training loss: 7.364e-03:   0%|          | 717/300001 [11:56:39<5213:00:18, 62.71s/it]training loss: 7.364e-03:   0%|          | 718/300001 [11:57:34<5028:05:20, 60.48s/it]training loss: 7.364e-03:   0%|          | 719/300001 [11:58:35<5038:10:05, 60.60s/it]training loss: 7.364e-03:   0%|          | 720/300001 [11:59:25<4778:32:30, 57.48s/it]training loss: 7.611e-03:   0%|          | 720/300001 [12:00:52<4778:32:30, 57.48s/it]training loss: 7.611e-03:   0%|          | 721/300001 [12:00:52<5522:05:40, 66.42s/it]training loss: 7.611e-03:   0%|          | 722/300001 [12:02:23<6115:41:47, 73.57s/it]training loss: 7.611e-03:   0%|          | 723/300001 [12:03:32<5998:07:35, 72.15s/it]training loss: 7.611e-03:   0%|          | 724/300001 [12:05:09<6623:14:18, 79.67s/it]training loss: 7.611e-03:   0%|          | 725/300001 [12:06:41<6938:58:03, 83.47s/it]training loss: 7.611e-03:   0%|          | 726/300001 [12:07:41<6359:43:11, 76.50s/it]training loss: 7.611e-03:   0%|          | 727/300001 [12:08:26<5565:13:43, 66.94s/it]training loss: 7.611e-03:   0%|          | 728/300001 [12:09:27<5423:59:05, 65.25s/it]training loss: 7.611e-03:   0%|          | 729/300001 [12:10:32<5417:34:57, 65.17s/it]training loss: 7.611e-03:   0%|          | 730/300001 [12:11:27<5163:02:40, 62.11s/it]training loss: 7.611e-03:   0%|          | 731/300001 [12:12:26<5078:08:59, 61.09s/it]training loss: 7.611e-03:   0%|          | 732/300001 [12:13:40<5406:42:15, 65.04s/it]training loss: 7.611e-03:   0%|          | 733/300001 [12:14:39<5253:39:03, 63.20s/it]training loss: 7.611e-03:   0%|          | 734/300001 [12:16:00<5692:05:20, 68.47s/it]training loss: 7.611e-03:   0%|          | 735/300001 [12:17:04<5578:24:33, 67.11s/it]training loss: 7.611e-03:   0%|          | 736/300001 [12:18:16<5699:26:42, 68.56s/it]training loss: 7.611e-03:   0%|          | 737/300001 [12:19:34<5944:24:48, 71.51s/it]training loss: 7.611e-03:   0%|          | 738/300001 [12:20:46<5943:11:05, 71.49s/it]training loss: 7.611e-03:   0%|          | 739/300001 [12:21:33<5337:40:27, 64.21s/it]training loss: 7.611e-03:   0%|          | 740/300001 [12:22:20<4920:07:28, 59.19s/it]training loss: 7.225e-03:   0%|          | 740/300001 [12:23:17<4920:07:28, 59.19s/it]training loss: 7.225e-03:   0%|          | 741/300001 [12:23:17<4853:40:19, 58.39s/it]training loss: 7.225e-03:   0%|          | 742/300001 [12:24:21<5000:49:04, 60.16s/it]training loss: 7.225e-03:   0%|          | 743/300001 [12:25:16<4859:23:04, 58.46s/it]training loss: 7.225e-03:   0%|          | 744/300001 [12:26:03<4579:53:05, 55.10s/it]training loss: 7.225e-03:   0%|          | 745/300001 [12:27:11<4894:55:30, 58.89s/it]training loss: 7.225e-03:   0%|          | 746/300001 [12:28:22<5204:21:02, 62.61s/it]training loss: 7.225e-03:   0%|          | 747/300001 [12:29:24<5188:56:09, 62.42s/it]training loss: 7.225e-03:   0%|          | 748/300001 [12:30:47<5705:12:30, 68.63s/it]training loss: 7.225e-03:   0%|          | 749/300001 [12:31:39<5297:59:56, 63.73s/it]training loss: 7.225e-03:   0%|          | 750/300001 [12:32:40<5230:10:02, 62.92s/it]training loss: 7.225e-03:   0%|          | 751/300001 [12:33:34<4993:48:36, 60.08s/it]training loss: 7.225e-03:   0%|          | 752/300001 [12:34:47<5315:31:54, 63.95s/it]training loss: 7.225e-03:   0%|          | 753/300001 [12:35:50<5293:30:19, 63.68s/it]training loss: 7.225e-03:   0%|          | 754/300001 [12:36:53<5293:33:44, 63.68s/it]training loss: 7.225e-03:   0%|          | 755/300001 [12:37:46<5019:25:19, 60.38s/it]training loss: 7.225e-03:   0%|          | 756/300001 [12:38:59<5330:51:31, 64.13s/it]training loss: 7.225e-03:   0%|          | 757/300001 [12:40:17<5669:31:17, 68.21s/it]training loss: 7.225e-03:   0%|          | 758/300001 [12:41:03<5124:17:42, 61.65s/it]training loss: 7.225e-03:   0%|          | 759/300001 [12:41:53<4826:42:37, 58.07s/it]training loss: 7.225e-03:   0%|          | 760/300001 [12:42:55<4923:28:40, 59.23s/it]training loss: 6.461e-03:   0%|          | 760/300001 [12:44:04<4923:28:40, 59.23s/it]training loss: 6.461e-03:   0%|          | 761/300001 [12:44:04<5166:48:13, 62.16s/it]training loss: 6.461e-03:   0%|          | 762/300001 [12:45:23<5587:31:42, 67.22s/it]training loss: 6.461e-03:   0%|          | 763/300001 [12:46:52<6137:07:42, 73.83s/it]training loss: 6.461e-03:   0%|          | 764/300001 [12:48:10<6251:18:49, 75.21s/it]training loss: 6.461e-03:   0%|          | 765/300001 [12:49:10<5852:31:36, 70.41s/it]training loss: 6.461e-03:   0%|          | 766/300001 [12:50:24<5944:34:00, 71.52s/it]training loss: 6.461e-03:   0%|          | 767/300001 [12:51:43<6149:55:52, 73.99s/it]training loss: 6.461e-03:   0%|          | 768/300001 [12:52:58<6163:56:14, 74.16s/it]training loss: 6.461e-03:   0%|          | 769/300001 [12:53:48<5566:07:32, 66.96s/it]training loss: 6.461e-03:   0%|          | 770/300001 [12:54:36<5087:56:20, 61.21s/it]training loss: 6.461e-03:   0%|          | 771/300001 [12:55:36<5062:33:03, 60.91s/it]training loss: 6.461e-03:   0%|          | 772/300001 [12:56:33<4955:58:38, 59.62s/it]training loss: 6.461e-03:   0%|          | 773/300001 [12:57:20<4644:23:43, 55.88s/it]training loss: 6.461e-03:   0%|          | 774/300001 [12:58:10<4505:19:02, 54.20s/it]training loss: 6.461e-03:   0%|          | 775/300001 [12:58:56<4291:34:20, 51.63s/it]training loss: 6.461e-03:   0%|          | 776/300001 [12:59:42<4146:08:13, 49.88s/it]training loss: 6.461e-03:   0%|          | 777/300001 [13:00:41<4382:56:43, 52.73s/it]training loss: 6.461e-03:   0%|          | 778/300001 [13:01:30<4300:37:41, 51.74s/it]training loss: 6.461e-03:   0%|          | 779/300001 [13:02:35<4629:54:16, 55.70s/it]training loss: 6.461e-03:   0%|          | 780/300001 [13:03:47<5034:56:37, 60.58s/it]training loss: 6.563e-03:   0%|          | 780/300001 [13:04:49<5034:56:37, 60.58s/it]training loss: 6.563e-03:   0%|          | 781/300001 [13:04:49<5063:36:04, 60.92s/it]training loss: 6.563e-03:   0%|          | 782/300001 [13:05:44<4924:18:11, 59.25s/it]training loss: 6.563e-03:   0%|          | 783/300001 [13:06:31<4604:23:02, 55.40s/it]training loss: 6.563e-03:   0%|          | 784/300001 [13:07:15<4331:09:19, 52.11s/it]training loss: 6.563e-03:   0%|          | 785/300001 [13:08:05<4276:39:58, 51.45s/it]training loss: 6.563e-03:   0%|          | 786/300001 [13:09:19<4839:45:15, 58.23s/it]training loss: 6.563e-03:   0%|          | 787/300001 [13:10:55<5780:14:27, 69.55s/it]training loss: 6.563e-03:   0%|          | 788/300001 [13:12:48<6855:14:42, 82.48s/it]training loss: 6.563e-03:   0%|          | 789/300001 [13:13:55<6479:23:54, 77.96s/it]training loss: 6.563e-03:   0%|          | 790/300001 [13:15:16<6558:06:51, 78.90s/it]training loss: 6.563e-03:   0%|          | 791/300001 [13:16:13<5995:15:28, 72.13s/it]training loss: 6.563e-03:   0%|          | 792/300001 [13:17:16<5786:21:13, 69.62s/it]training loss: 6.563e-03:   0%|          | 793/300001 [13:18:28<5838:23:49, 70.25s/it]training loss: 6.563e-03:   0%|          | 794/300001 [13:20:14<6714:13:07, 80.78s/it]training loss: 6.563e-03:   0%|          | 795/300001 [13:21:03<5941:33:13, 71.49s/it]training loss: 6.563e-03:   0%|          | 796/300001 [13:21:48<5264:29:19, 63.34s/it]training loss: 6.563e-03:   0%|          | 797/300001 [13:22:29<4709:52:48, 56.67s/it]training loss: 6.563e-03:   0%|          | 798/300001 [13:23:25<4688:06:42, 56.41s/it]training loss: 6.563e-03:   0%|          | 799/300001 [13:24:36<5057:17:57, 60.85s/it]training loss: 6.563e-03:   0%|          | 800/300001 [13:25:30<4901:21:49, 58.97s/it]training loss: 7.561e-03:   0%|          | 800/300001 [13:26:29<4901:21:49, 58.97s/it]training loss: 7.561e-03:   0%|          | 801/300001 [13:26:29<4895:33:42, 58.90s/it]training loss: 7.561e-03:   0%|          | 802/300001 [13:27:13<4513:11:57, 54.30s/it]training loss: 7.561e-03:   0%|          | 803/300001 [13:27:56<4248:12:07, 51.12s/it]training loss: 7.561e-03:   0%|          | 804/300001 [13:28:38<4018:57:47, 48.36s/it]training loss: 7.561e-03:   0%|          | 805/300001 [13:29:22<3895:36:21, 46.87s/it]training loss: 7.561e-03:   0%|          | 806/300001 [13:30:07<3861:48:01, 46.47s/it]training loss: 7.561e-03:   0%|          | 807/300001 [13:30:49<3737:32:50, 44.97s/it]training loss: 7.561e-03:   0%|          | 808/300001 [13:31:33<3726:11:25, 44.83s/it]training loss: 7.561e-03:   0%|          | 809/300001 [13:32:16<3686:19:50, 44.36s/it]training loss: 7.561e-03:   0%|          | 810/300001 [13:33:36<4557:35:55, 54.84s/it]training loss: 7.561e-03:   0%|          | 811/300001 [13:34:26<4444:25:01, 53.48s/it]training loss: 7.561e-03:   0%|          | 812/300001 [13:35:27<4640:05:36, 55.83s/it]training loss: 7.561e-03:   0%|          | 813/300001 [13:36:11<4323:55:59, 52.03s/it]training loss: 7.561e-03:   0%|          | 814/300001 [13:36:54<4101:17:30, 49.35s/it]training loss: 7.561e-03:   0%|          | 815/300001 [13:37:48<4229:14:42, 50.89s/it]training loss: 7.561e-03:   0%|          | 816/300001 [13:38:30<4001:40:39, 48.15s/it]training loss: 7.561e-03:   0%|          | 817/300001 [13:39:13<3883:41:24, 46.73s/it]training loss: 7.561e-03:   0%|          | 818/300001 [13:39:56<3793:16:10, 45.64s/it]training loss: 7.561e-03:   0%|          | 819/300001 [13:40:41<3755:54:31, 45.19s/it]training loss: 7.561e-03:   0%|          | 820/300001 [13:41:22<3651:51:59, 43.94s/it]training loss: 8.347e-03:   0%|          | 820/300001 [13:42:16<3651:51:59, 43.94s/it]training loss: 8.347e-03:   0%|          | 821/300001 [13:42:16<3905:56:10, 47.00s/it]training loss: 8.347e-03:   0%|          | 822/300001 [13:43:05<3962:07:52, 47.68s/it]training loss: 8.347e-03:   0%|          | 823/300001 [13:43:47<3810:43:54, 45.85s/it]training loss: 8.347e-03:   0%|          | 824/300001 [13:44:34<3860:00:58, 46.45s/it]training loss: 8.347e-03:   0%|          | 825/300001 [13:45:49<4570:59:58, 55.00s/it]training loss: 8.347e-03:   0%|          | 826/300001 [13:46:43<4547:24:18, 54.72s/it]training loss: 8.347e-03:   0%|          | 827/300001 [13:47:27<4263:18:47, 51.30s/it]training loss: 8.347e-03:   0%|          | 828/300001 [13:48:54<5169:32:00, 62.21s/it]training loss: 8.347e-03:   0%|          | 829/300001 [13:50:18<5714:16:15, 68.76s/it]training loss: 8.347e-03:   0%|          | 830/300001 [13:51:06<5188:24:51, 62.43s/it]training loss: 8.347e-03:   0%|          | 831/300001 [13:51:59<4953:51:43, 59.61s/it]training loss: 8.347e-03:   0%|          | 832/300001 [13:52:51<4747:50:25, 57.13s/it]training loss: 8.347e-03:   0%|          | 833/300001 [13:54:30<5792:07:30, 69.70s/it]training loss: 8.347e-03:   0%|          | 834/300001 [13:55:17<5226:04:27, 62.89s/it]training loss: 8.347e-03:   0%|          | 835/300001 [13:56:04<4840:09:19, 58.24s/it]training loss: 8.347e-03:   0%|          | 836/300001 [13:57:18<5230:38:14, 62.94s/it]training loss: 8.347e-03:   0%|          | 837/300001 [13:58:33<5545:25:20, 66.73s/it]training loss: 8.347e-03:   0%|          | 838/300001 [13:59:20<5047:44:21, 60.74s/it]training loss: 8.347e-03:   0%|          | 839/300001 [14:00:07<4704:46:58, 56.62s/it]training loss: 8.347e-03:   0%|          | 840/300001 [14:01:31<5388:06:28, 64.84s/it]training loss: 9.889e-03:   0%|          | 840/300001 [14:02:47<5388:06:28, 64.84s/it]training loss: 9.889e-03:   0%|          | 841/300001 [14:02:47<5673:59:50, 68.28s/it]training loss: 9.889e-03:   0%|          | 842/300001 [14:03:34<5124:18:19, 61.66s/it]training loss: 9.889e-03:   0%|          | 843/300001 [14:04:29<4957:03:22, 59.65s/it]training loss: 9.889e-03:   0%|          | 844/300001 [14:05:57<5673:31:42, 68.27s/it]training loss: 9.889e-03:   0%|          | 845/300001 [14:07:12<5851:25:13, 70.42s/it]training loss: 9.889e-03:   0%|          | 846/300001 [14:08:08<5491:02:41, 66.08s/it]training loss: 9.889e-03:   0%|          | 847/300001 [14:09:08<5336:13:13, 64.22s/it]training loss: 9.889e-03:   0%|          | 848/300001 [14:10:13<5357:21:11, 64.47s/it]training loss: 9.889e-03:   0%|          | 849/300001 [14:11:20<5403:34:23, 65.03s/it]training loss: 9.889e-03:   0%|          | 850/300001 [14:12:33<5612:19:59, 67.54s/it]training loss: 9.889e-03:   0%|          | 851/300001 [14:13:18<5047:00:38, 60.74s/it]training loss: 9.889e-03:   0%|          | 852/300001 [14:14:09<4794:53:32, 57.70s/it]training loss: 9.889e-03:   0%|          | 853/300001 [14:15:34<5483:39:54, 65.99s/it]training loss: 9.889e-03:   0%|          | 854/300001 [14:17:19<6469:09:25, 77.85s/it]training loss: 9.889e-03:   0%|          | 855/300001 [14:18:35<6418:20:30, 77.24s/it]training loss: 9.889e-03:   0%|          | 856/300001 [14:19:32<5895:54:04, 70.95s/it]training loss: 9.889e-03:   0%|          | 857/300001 [14:20:31<5613:55:26, 67.56s/it]training loss: 9.889e-03:   0%|          | 858/300001 [14:21:42<5690:10:18, 68.48s/it]training loss: 9.889e-03:   0%|          | 859/300001 [14:22:27<5103:11:26, 61.41s/it]training loss: 9.889e-03:   0%|          | 860/300001 [14:23:22<4958:21:26, 59.67s/it]training loss: 7.202e-03:   0%|          | 860/300001 [14:24:50<4958:21:26, 59.67s/it]training loss: 7.202e-03:   0%|          | 861/300001 [14:24:50<5646:41:27, 67.96s/it]training loss: 7.202e-03:   0%|          | 862/300001 [14:26:05<5834:03:39, 70.21s/it]training loss: 7.202e-03:   0%|          | 863/300001 [14:27:20<5946:22:19, 71.56s/it]training loss: 7.202e-03:   0%|          | 864/300001 [14:28:13<5500:19:45, 66.19s/it]training loss: 7.202e-03:   0%|          | 865/300001 [14:29:12<5311:10:08, 63.92s/it]training loss: 7.202e-03:   0%|          | 866/300001 [14:30:41<5927:28:53, 71.34s/it]training loss: 7.202e-03:   0%|          | 867/300001 [14:31:41<5639:57:28, 67.88s/it]training loss: 7.202e-03:   0%|          | 868/300001 [14:32:38<5386:18:55, 64.82s/it]training loss: 7.202e-03:   0%|          | 869/300001 [14:33:29<5041:50:10, 60.68s/it]training loss: 7.202e-03:   0%|          | 870/300001 [14:34:18<4757:03:06, 57.25s/it]training loss: 7.202e-03:   0%|          | 871/300001 [14:35:04<4472:51:42, 53.83s/it]training loss: 7.202e-03:   0%|          | 872/300001 [14:36:06<4668:03:25, 56.18s/it]training loss: 7.202e-03:   0%|          | 873/300001 [14:37:20<5124:01:20, 61.67s/it]training loss: 7.202e-03:   0%|          | 874/300001 [14:39:21<6584:05:03, 79.24s/it]training loss: 7.202e-03:   0%|          | 875/300001 [14:40:41<6613:39:53, 79.60s/it]training loss: 7.202e-03:   0%|          | 876/300001 [14:41:40<6103:30:39, 73.46s/it]training loss: 7.202e-03:   0%|          | 877/300001 [14:42:53<6073:20:07, 73.09s/it]training loss: 7.202e-03:   0%|          | 878/300001 [14:43:49<5651:48:36, 68.02s/it]training loss: 7.202e-03:   0%|          | 879/300001 [14:45:11<6007:41:44, 72.30s/it]training loss: 7.202e-03:   0%|          | 880/300001 [14:46:04<5523:12:44, 66.47s/it]training loss: 6.681e-03:   0%|          | 880/300001 [14:47:10<5523:12:44, 66.47s/it]training loss: 6.681e-03:   0%|          | 881/300001 [14:47:10<5517:19:12, 66.40s/it]training loss: 6.681e-03:   0%|          | 882/300001 [14:48:37<6030:36:43, 72.58s/it]training loss: 6.681e-03:   0%|          | 883/300001 [14:49:50<6028:50:42, 72.56s/it]training loss: 6.681e-03:   0%|          | 884/300001 [14:50:54<5837:14:29, 70.25s/it]training loss: 6.681e-03:   0%|          | 885/300001 [14:52:20<6210:09:08, 74.74s/it]training loss: 6.681e-03:   0%|          | 886/300001 [14:53:18<5796:31:03, 69.76s/it]training loss: 6.681e-03:   0%|          | 887/300001 [14:54:04<5208:57:29, 62.69s/it]training loss: 6.681e-03:   0%|          | 888/300001 [14:54:50<4788:04:39, 57.63s/it]training loss: 6.681e-03:   0%|          | 889/300001 [14:55:35<4472:06:14, 53.82s/it]training loss: 6.681e-03:   0%|          | 890/300001 [14:56:18<4217:10:00, 50.76s/it]training loss: 6.681e-03:   0%|          | 891/300001 [14:57:24<4597:57:15, 55.34s/it]training loss: 6.681e-03:   0%|          | 892/300001 [14:58:17<4533:54:54, 54.57s/it]training loss: 6.681e-03:   0%|          | 893/300001 [14:59:23<4818:13:34, 57.99s/it]training loss: 6.681e-03:   0%|          | 894/300001 [15:00:14<4642:05:33, 55.87s/it]training loss: 6.681e-03:   0%|          | 895/300001 [15:01:27<5060:13:54, 60.90s/it]training loss: 6.681e-03:   0%|          | 896/300001 [15:02:58<5822:53:17, 70.08s/it]training loss: 6.681e-03:   0%|          | 897/300001 [15:04:04<5714:25:38, 68.78s/it]training loss: 6.681e-03:   0%|          | 898/300001 [15:04:55<5269:22:47, 63.42s/it]training loss: 6.681e-03:   0%|          | 899/300001 [15:05:42<4859:04:00, 58.48s/it]training loss: 6.681e-03:   0%|          | 900/300001 [15:06:30<4593:42:32, 55.29s/it]training loss: 6.935e-03:   0%|          | 900/300001 [15:07:37<4593:42:32, 55.29s/it]training loss: 6.935e-03:   0%|          | 901/300001 [15:07:37<4900:48:05, 58.99s/it]training loss: 6.935e-03:   0%|          | 902/300001 [15:08:35<4857:36:30, 58.47s/it]training loss: 6.935e-03:   0%|          | 903/300001 [15:09:25<4655:07:15, 56.03s/it]training loss: 6.935e-03:   0%|          | 904/300001 [15:10:21<4657:19:28, 56.06s/it]training loss: 6.935e-03:   0%|          | 905/300001 [15:11:53<5560:41:32, 66.93s/it]training loss: 6.935e-03:   0%|          | 906/300001 [15:12:58<5511:07:31, 66.33s/it]training loss: 6.935e-03:   0%|          | 907/300001 [15:14:02<5455:39:53, 65.67s/it]training loss: 6.935e-03:   0%|          | 908/300001 [15:15:08<5466:07:44, 65.79s/it]training loss: 6.935e-03:   0%|          | 909/300001 [15:16:40<6097:29:04, 73.39s/it]training loss: 6.935e-03:   0%|          | 910/300001 [15:18:07<6446:17:07, 77.59s/it]training loss: 6.935e-03:   0%|          | 911/300001 [15:18:57<5746:48:16, 69.17s/it]training loss: 6.935e-03:   0%|          | 912/300001 [15:21:05<7236:48:27, 87.11s/it]training loss: 6.935e-03:   0%|          | 913/300001 [15:22:39<7408:24:53, 89.17s/it]training loss: 6.935e-03:   0%|          | 914/300001 [15:23:28<6396:11:21, 76.99s/it]training loss: 6.935e-03:   0%|          | 915/300001 [15:24:19<5744:36:10, 69.15s/it]training loss: 6.935e-03:   0%|          | 916/300001 [15:25:13<5368:17:44, 64.62s/it]training loss: 6.935e-03:   0%|          | 917/300001 [15:26:14<5270:06:45, 63.44s/it]training loss: 6.935e-03:   0%|          | 918/300001 [15:27:21<5375:00:22, 64.70s/it]training loss: 6.935e-03:   0%|          | 919/300001 [15:28:27<5409:02:03, 65.11s/it]training loss: 6.935e-03:   0%|          | 920/300001 [15:30:20<6590:31:22, 79.33s/it]training loss: 6.445e-03:   0%|          | 920/300001 [15:31:08<6590:31:22, 79.33s/it]training loss: 6.445e-03:   0%|          | 921/300001 [15:31:08<5825:36:54, 70.12s/it]training loss: 6.445e-03:   0%|          | 922/300001 [15:32:09<5582:30:39, 67.20s/it]training loss: 6.445e-03:   0%|          | 923/300001 [15:33:01<5201:58:45, 62.62s/it]training loss: 6.445e-03:   0%|          | 924/300001 [15:34:02<5177:59:39, 62.33s/it]training loss: 6.445e-03:   0%|          | 925/300001 [15:35:31<5822:07:49, 70.08s/it]training loss: 6.445e-03:   0%|          | 926/300001 [15:36:18<5248:06:07, 63.17s/it]training loss: 6.445e-03:   0%|          | 927/300001 [15:37:08<4929:19:59, 59.34s/it]training loss: 6.445e-03:   0%|          | 928/300001 [15:38:14<5091:54:55, 61.29s/it]training loss: 6.445e-03:   0%|          | 929/300001 [15:39:29<5431:57:25, 65.39s/it]training loss: 6.445e-03:   0%|          | 930/300001 [15:40:27<5252:18:09, 63.22s/it]training loss: 6.445e-03:   0%|          | 931/300001 [15:41:20<4998:04:21, 60.16s/it]training loss: 6.445e-03:   0%|          | 932/300001 [15:42:17<4919:51:39, 59.22s/it]training loss: 6.445e-03:   0%|          | 933/300001 [15:43:26<5172:45:20, 62.27s/it]training loss: 6.445e-03:   0%|          | 934/300001 [15:44:37<5371:56:20, 64.66s/it]training loss: 6.445e-03:   0%|          | 935/300001 [15:45:34<5195:05:39, 62.54s/it]training loss: 6.445e-03:   0%|          | 936/300001 [15:47:51<7037:58:11, 84.72s/it]training loss: 6.445e-03:   0%|          | 937/300001 [15:49:38<7595:47:21, 91.43s/it]training loss: 6.445e-03:   0%|          | 938/300001 [15:50:53<7180:14:12, 86.43s/it]training loss: 6.445e-03:   0%|          | 939/300001 [15:52:13<7038:34:02, 84.73s/it]training loss: 6.445e-03:   0%|          | 940/300001 [15:53:49<7301:55:12, 87.90s/it]training loss: 7.748e-03:   0%|          | 940/300001 [15:55:37<7301:55:12, 87.90s/it]training loss: 7.748e-03:   0%|          | 941/300001 [15:55:37<7804:27:58, 93.95s/it]training loss: 7.748e-03:   0%|          | 942/300001 [15:56:33<6862:58:44, 82.61s/it]training loss: 7.748e-03:   0%|          | 943/300001 [15:58:35<7844:34:14, 94.43s/it]training loss: 7.748e-03:   0%|          | 944/300001 [16:00:13<7927:30:19, 95.43s/it]training loss: 7.748e-03:   0%|          | 945/300001 [16:02:10<8478:03:57, 102.06s/it]training loss: 7.748e-03:   0%|          | 946/300001 [16:03:45<8304:59:28, 99.97s/it] training loss: 7.748e-03:   0%|          | 947/300001 [16:04:34<7037:02:37, 84.71s/it]training loss: 7.748e-03:   0%|          | 948/300001 [16:06:04<7166:27:26, 86.27s/it]training loss: 7.748e-03:   0%|          | 949/300001 [16:07:30<7158:07:08, 86.17s/it]training loss: 7.748e-03:   0%|          | 950/300001 [16:08:21<6265:50:59, 75.43s/it]training loss: 7.748e-03:   0%|          | 951/300001 [16:09:56<6753:29:41, 81.30s/it]training loss: 7.748e-03:   0%|          | 952/300001 [16:10:53<6163:56:40, 74.20s/it]training loss: 7.748e-03:   0%|          | 953/300001 [16:12:33<6800:24:13, 81.86s/it]training loss: 7.748e-03:   0%|          | 954/300001 [16:13:41<6449:26:54, 77.64s/it]training loss: 7.748e-03:   0%|          | 955/300001 [16:15:38<7438:12:10, 89.54s/it]training loss: 7.748e-03:   0%|          | 956/300001 [16:17:02<7305:41:34, 87.95s/it]training loss: 7.748e-03:   0%|          | 957/300001 [16:17:56<6464:24:10, 77.82s/it]training loss: 7.748e-03:   0%|          | 958/300001 [16:19:24<6710:12:40, 80.78s/it]training loss: 7.748e-03:   0%|          | 959/300001 [16:20:22<6131:01:38, 73.81s/it]training loss: 7.748e-03:   0%|          | 960/300001 [16:21:41<6266:36:22, 75.44s/it]training loss: 6.207e-03:   0%|          | 960/300001 [16:23:31<6266:36:22, 75.44s/it]training loss: 6.207e-03:   0%|          | 961/300001 [16:23:31<7132:41:53, 85.87s/it]training loss: 6.207e-03:   0%|          | 962/300001 [16:24:24<6298:45:17, 75.83s/it]training loss: 6.207e-03:   0%|          | 963/300001 [16:25:24<5907:33:39, 71.12s/it]training loss: 6.207e-03:   0%|          | 964/300001 [16:26:30<5799:35:07, 69.82s/it]training loss: 6.207e-03:   0%|          | 965/300001 [16:28:11<6565:12:28, 79.04s/it]training loss: 6.207e-03:   0%|          | 966/300001 [16:29:08<6005:41:04, 72.30s/it]training loss: 6.207e-03:   0%|          | 967/300001 [16:30:16<5904:50:37, 71.09s/it]training loss: 6.207e-03:   0%|          | 968/300001 [16:31:51<6494:11:33, 78.18s/it]training loss: 6.207e-03:   0%|          | 969/300001 [16:32:56<6169:28:57, 74.27s/it]training loss: 6.207e-03:   0%|          | 970/300001 [16:33:46<5581:25:05, 67.19s/it]training loss: 6.207e-03:   0%|          | 971/300001 [16:34:33<5067:24:53, 61.01s/it]training loss: 6.207e-03:   0%|          | 972/300001 [16:35:36<5113:47:38, 61.56s/it]training loss: 6.207e-03:   0%|          | 973/300001 [16:36:48<5379:53:14, 64.77s/it]training loss: 6.207e-03:   0%|          | 974/300001 [16:38:05<5681:15:23, 68.40s/it]training loss: 6.207e-03:   0%|          | 975/300001 [16:38:49<5075:02:30, 61.10s/it]training loss: 6.207e-03:   0%|          | 976/300001 [16:39:38<4773:23:27, 57.47s/it]training loss: 6.207e-03:   0%|          | 977/300001 [16:40:25<4513:38:43, 54.34s/it]training loss: 6.207e-03:   0%|          | 978/300001 [16:41:24<4622:09:58, 55.65s/it]training loss: 6.207e-03:   0%|          | 979/300001 [16:42:43<5217:25:02, 62.81s/it]training loss: 6.207e-03:   0%|          | 980/300001 [16:43:24<4677:03:56, 56.31s/it]training loss: 6.293e-03:   0%|          | 980/300001 [16:44:09<4677:03:56, 56.31s/it]training loss: 6.293e-03:   0%|          | 981/300001 [16:44:09<4383:40:22, 52.78s/it]training loss: 6.293e-03:   0%|          | 982/300001 [16:44:58<4283:20:26, 51.57s/it]training loss: 6.293e-03:   0%|          | 983/300001 [16:45:44<4143:12:21, 49.88s/it]training loss: 6.293e-03:   0%|          | 984/300001 [16:46:38<4257:31:00, 51.26s/it]training loss: 6.293e-03:   0%|          | 985/300001 [16:47:38<4484:20:37, 53.99s/it]training loss: 6.293e-03:   0%|          | 986/300001 [16:48:20<4182:52:39, 50.36s/it]training loss: 6.293e-03:   0%|          | 987/300001 [16:49:07<4089:33:49, 49.24s/it]training loss: 6.293e-03:   0%|          | 988/300001 [16:49:51<3947:02:23, 47.52s/it]training loss: 6.293e-03:   0%|          | 989/300001 [16:50:36<3890:25:49, 46.84s/it]training loss: 6.293e-03:   0%|          | 990/300001 [16:51:19<3793:17:24, 45.67s/it]training loss: 6.293e-03:   0%|          | 991/300001 [16:52:14<4039:27:05, 48.63s/it]training loss: 6.293e-03:   0%|          | 992/300001 [16:52:56<3871:56:27, 46.62s/it]training loss: 6.293e-03:   0%|          | 993/300001 [16:53:42<3846:58:33, 46.32s/it]training loss: 6.293e-03:   0%|          | 994/300001 [16:54:38<4091:17:05, 49.26s/it]training loss: 6.293e-03:   0%|          | 995/300001 [16:55:33<4226:56:03, 50.89s/it]training loss: 6.293e-03:   0%|          | 996/300001 [16:56:40<4641:35:16, 55.88s/it]training loss: 6.293e-03:   0%|          | 997/300001 [16:57:38<4678:38:31, 56.33s/it]training loss: 6.293e-03:   0%|          | 998/300001 [16:58:44<4933:03:02, 59.39s/it]training loss: 6.293e-03:   0%|          | 999/300001 [16:59:39<4814:16:50, 57.96s/it]training loss: 6.293e-03:   0%|          | 1000/300001 [17:00:38<4852:09:39, 58.42s/it]training loss: 6.783e-03:   0%|          | 1000/300001 [17:01:27<4852:09:39, 58.42s/it]training loss: 6.783e-03:   0%|          | 1001/300001 [17:01:38<4894:58:48, 58.94s/it]training loss: 6.783e-03:   0%|          | 1002/300001 [17:02:51<5244:25:27, 63.14s/it]training loss: 6.783e-03:   0%|          | 1003/300001 [17:03:42<4945:32:26, 59.55s/it]training loss: 6.783e-03:   0%|          | 1004/300001 [17:04:58<5344:01:02, 64.34s/it]training loss: 6.783e-03:   0%|          | 1005/300001 [17:05:53<5106:06:24, 61.48s/it]training loss: 6.783e-03:   0%|          | 1006/300001 [17:07:16<5647:44:52, 68.00s/it]training loss: 6.783e-03:   0%|          | 1007/300001 [17:08:24<5643:19:45, 67.95s/it]training loss: 6.783e-03:   0%|          | 1008/300001 [17:09:48<6043:06:39, 72.76s/it]training loss: 6.783e-03:   0%|          | 1009/300001 [17:10:59<6000:10:50, 72.24s/it]training loss: 6.783e-03:   0%|          | 1010/300001 [17:11:55<5597:31:16, 67.40s/it]training loss: 6.783e-03:   0%|          | 1011/300001 [17:13:06<5676:48:21, 68.35s/it]training loss: 6.783e-03:   0%|          | 1012/300001 [17:13:50<5072:11:48, 61.07s/it]training loss: 6.783e-03:   0%|          | 1013/300001 [17:14:32<4617:42:04, 55.60s/it]training loss: 6.783e-03:   0%|          | 1014/300001 [17:15:39<4889:46:29, 58.88s/it]training loss: 6.783e-03:   0%|          | 1015/300001 [17:17:00<5452:03:25, 65.65s/it]training loss: 6.783e-03:   0%|          | 1016/300001 [17:17:46<4956:20:26, 59.68s/it]training loss: 6.783e-03:   0%|          | 1017/300001 [17:18:32<4619:57:01, 55.63s/it]training loss: 6.783e-03:   0%|          | 1018/300001 [17:19:48<5110:40:57, 61.54s/it]training loss: 6.783e-03:   0%|          | 1019/300001 [17:20:37<4804:41:15, 57.85s/it]training loss: 6.783e-03:   0%|          | 1020/300001 [17:21:34<4790:20:03, 57.68s/it]training loss: 7.805e-03:   0%|          | 1020/300001 [17:22:23<4790:20:03, 57.68s/it]training loss: 7.805e-03:   0%|          | 1021/300001 [17:22:23<4565:32:27, 54.97s/it]training loss: 7.805e-03:   0%|          | 1022/300001 [17:23:12<4412:56:15, 53.14s/it]training loss: 7.805e-03:   0%|          | 1023/300001 [17:24:15<4667:01:51, 56.20s/it]training loss: 7.805e-03:   0%|          | 1024/300001 [17:25:33<5213:39:20, 62.78s/it]training loss: 7.805e-03:   0%|          | 1025/300001 [17:26:32<5119:11:51, 61.64s/it]training loss: 7.805e-03:   0%|          | 1026/300001 [17:27:50<5526:02:37, 66.54s/it]training loss: 7.805e-03:   0%|          | 1027/300001 [17:29:00<5614:47:50, 67.61s/it]training loss: 7.805e-03:   0%|          | 1028/300001 [17:30:09<5651:31:09, 68.05s/it]training loss: 7.805e-03:   0%|          | 1029/300001 [17:31:33<6031:39:03, 72.63s/it]training loss: 7.805e-03:   0%|          | 1030/300001 [17:32:21<5425:19:49, 65.33s/it]training loss: 7.805e-03:   0%|          | 1031/300001 [17:33:21<5285:35:37, 63.65s/it]training loss: 7.805e-03:   0%|          | 1032/300001 [17:34:35<5553:16:31, 66.87s/it]training loss: 7.805e-03:   0%|          | 1033/300001 [17:35:51<5792:33:42, 69.75s/it]training loss: 7.805e-03:   0%|          | 1034/300001 [17:37:13<6087:18:19, 73.30s/it]training loss: 7.805e-03:   0%|          | 1035/300001 [17:38:01<5450:44:39, 65.64s/it]training loss: 7.805e-03:   0%|          | 1036/300001 [17:38:48<5003:00:26, 60.24s/it]training loss: 7.805e-03:   0%|          | 1037/300001 [17:39:38<4747:07:29, 57.16s/it]training loss: 7.805e-03:   0%|          | 1038/300001 [17:41:10<5601:43:23, 67.45s/it]training loss: 7.805e-03:   0%|          | 1039/300001 [17:41:57<5099:25:03, 61.41s/it]training loss: 7.805e-03:   0%|          | 1040/300001 [17:42:45<4747:59:29, 57.17s/it]training loss: 6.563e-03:   0%|          | 1040/300001 [17:43:39<4747:59:29, 57.17s/it]training loss: 6.563e-03:   0%|          | 1041/300001 [17:43:39<4677:37:52, 56.33s/it]training loss: 6.563e-03:   0%|          | 1042/300001 [17:44:22<4347:51:18, 52.36s/it]training loss: 6.563e-03:   0%|          | 1043/300001 [17:45:30<4744:04:03, 57.13s/it]training loss: 6.563e-03:   0%|          | 1044/300001 [17:46:19<4528:15:08, 54.53s/it]training loss: 6.563e-03:   0%|          | 1045/300001 [17:47:05<4334:51:53, 52.20s/it]training loss: 6.563e-03:   0%|          | 1046/300001 [17:47:56<4282:40:48, 51.57s/it]training loss: 6.563e-03:   0%|          | 1047/300001 [17:48:44<4194:03:21, 50.50s/it]training loss: 6.563e-03:   0%|          | 1048/300001 [17:49:30<4086:13:31, 49.21s/it]training loss: 6.563e-03:   0%|          | 1049/300001 [17:50:17<4032:28:51, 48.56s/it]training loss: 6.563e-03:   0%|          | 1050/300001 [17:51:27<4564:13:21, 54.96s/it]training loss: 6.563e-03:   0%|          | 1051/300001 [17:52:53<5352:43:11, 64.46s/it]training loss: 6.563e-03:   0%|          | 1052/300001 [17:53:36<4805:11:47, 57.87s/it]training loss: 6.563e-03:   0%|          | 1053/300001 [17:54:32<4773:01:51, 57.48s/it]training loss: 6.563e-03:   0%|          | 1054/300001 [17:55:48<5214:41:34, 62.80s/it]training loss: 6.563e-03:   0%|          | 1055/300001 [17:56:32<4764:54:36, 57.38s/it]training loss: 6.563e-03:   0%|          | 1056/300001 [17:57:33<4855:40:24, 58.47s/it]training loss: 6.563e-03:   0%|          | 1057/300001 [17:58:31<4847:14:56, 58.37s/it]training loss: 6.563e-03:   0%|          | 1058/300001 [17:59:20<4594:07:16, 55.32s/it]training loss: 6.563e-03:   0%|          | 1059/300001 [18:00:35<5087:29:13, 61.27s/it]training loss: 6.563e-03:   0%|          | 1060/300001 [18:02:08<5890:23:25, 70.94s/it]training loss: 6.508e-03:   0%|          | 1060/300001 [18:03:23<5890:23:25, 70.94s/it]training loss: 6.508e-03:   0%|          | 1061/300001 [18:03:23<5991:45:32, 72.16s/it]training loss: 6.508e-03:   0%|          | 1062/300001 [18:04:05<5242:05:37, 63.13s/it]training loss: 6.508e-03:   0%|          | 1063/300001 [18:04:49<4762:08:42, 57.35s/it]training loss: 6.508e-03:   0%|          | 1064/300001 [18:05:35<4463:32:26, 53.75s/it]training loss: 6.508e-03:   0%|          | 1065/300001 [18:06:19<4220:09:41, 50.82s/it]training loss: 6.508e-03:   0%|          | 1066/300001 [18:07:20<4487:52:19, 54.05s/it]training loss: 6.508e-03:   0%|          | 1067/300001 [18:08:06<4284:30:32, 51.60s/it]training loss: 6.508e-03:   0%|          | 1068/300001 [18:08:50<4085:10:48, 49.20s/it]training loss: 6.508e-03:   0%|          | 1069/300001 [18:09:36<4007:07:19, 48.26s/it]training loss: 6.508e-03:   0%|          | 1070/300001 [18:10:23<3994:35:23, 48.11s/it]training loss: 6.508e-03:   0%|          | 1071/300001 [18:11:10<3964:49:34, 47.75s/it]training loss: 6.508e-03:   0%|          | 1072/300001 [18:12:05<4125:42:47, 49.69s/it]training loss: 6.508e-03:   0%|          | 1073/300001 [18:12:51<4046:00:56, 48.73s/it]training loss: 6.508e-03:   0%|          | 1074/300001 [18:13:37<3964:20:36, 47.74s/it]training loss: 6.508e-03:   0%|          | 1075/300001 [18:14:27<4037:54:40, 48.63s/it]training loss: 6.508e-03:   0%|          | 1076/300001 [18:15:14<4000:36:39, 48.18s/it]training loss: 6.508e-03:   0%|          | 1077/300001 [18:16:03<4009:08:40, 48.28s/it]training loss: 6.508e-03:   0%|          | 1078/300001 [18:16:50<3989:34:52, 48.05s/it]training loss: 6.508e-03:   0%|          | 1079/300001 [18:17:42<4082:57:59, 49.17s/it]training loss: 6.508e-03:   0%|          | 1080/300001 [18:19:05<4933:22:00, 59.41s/it]training loss: 5.949e-03:   0%|          | 1080/300001 [18:19:51<4933:22:00, 59.41s/it]training loss: 5.949e-03:   0%|          | 1081/300001 [18:19:51<4591:30:56, 55.30s/it]training loss: 5.949e-03:   0%|          | 1082/300001 [18:20:43<4515:26:46, 54.38s/it]training loss: 5.949e-03:   0%|          | 1083/300001 [18:22:04<5175:24:27, 62.33s/it]training loss: 5.949e-03:   0%|          | 1084/300001 [18:23:06<5163:01:19, 62.18s/it]training loss: 5.949e-03:   0%|          | 1085/300001 [18:24:07<5138:54:59, 61.89s/it]training loss: 5.949e-03:   0%|          | 1086/300001 [18:25:11<5186:38:38, 62.47s/it]training loss: 5.949e-03:   0%|          | 1087/300001 [18:26:04<4941:59:17, 59.52s/it]training loss: 5.949e-03:   0%|          | 1088/300001 [18:27:09<5085:47:34, 61.25s/it]training loss: 5.949e-03:   0%|          | 1089/300001 [18:28:04<4917:28:09, 59.22s/it]training loss: 5.949e-03:   0%|          | 1090/300001 [18:29:11<5122:04:04, 61.69s/it]training loss: 5.949e-03:   0%|          | 1091/300001 [18:29:59<4779:11:31, 57.56s/it]training loss: 5.949e-03:   0%|          | 1092/300001 [18:30:45<4481:24:05, 53.97s/it]training loss: 5.949e-03:   0%|          | 1093/300001 [18:31:30<4269:26:34, 51.42s/it]training loss: 5.949e-03:   0%|          | 1094/300001 [18:32:18<4180:26:12, 50.35s/it]training loss: 5.949e-03:   0%|          | 1095/300001 [18:33:01<4006:53:02, 48.26s/it]training loss: 5.949e-03:   0%|          | 1096/300001 [18:33:47<3944:04:55, 47.50s/it]training loss: 5.949e-03:   0%|          | 1097/300001 [18:34:34<3929:00:53, 47.32s/it]training loss: 5.949e-03:   0%|          | 1098/300001 [18:35:23<3973:14:29, 47.85s/it]training loss: 5.949e-03:   0%|          | 1099/300001 [18:36:09<3919:08:28, 47.20s/it]training loss: 5.949e-03:   0%|          | 1100/300001 [18:37:27<4688:12:30, 56.47s/it]training loss: 6.656e-03:   0%|          | 1100/300001 [18:38:50<4688:12:30, 56.47s/it]training loss: 6.656e-03:   0%|          | 1101/300001 [18:38:50<5346:24:10, 64.39s/it]training loss: 6.656e-03:   0%|          | 1102/300001 [18:40:17<5927:04:44, 71.39s/it]training loss: 6.656e-03:   0%|          | 1103/300001 [18:41:14<5553:36:28, 66.89s/it]training loss: 6.656e-03:   0%|          | 1104/300001 [18:42:09<5265:01:42, 63.41s/it]training loss: 6.656e-03:   0%|          | 1105/300001 [18:43:12<5243:32:47, 63.15s/it]training loss: 6.656e-03:   0%|          | 1106/300001 [18:44:05<4992:54:26, 60.14s/it]training loss: 6.656e-03:   0%|          | 1107/300001 [18:45:11<5159:11:52, 62.14s/it]training loss: 6.656e-03:   0%|          | 1108/300001 [18:46:17<5255:05:06, 63.29s/it]training loss: 6.656e-03:   0%|          | 1109/300001 [18:47:10<4995:26:14, 60.17s/it]training loss: 6.656e-03:   0%|          | 1110/300001 [18:48:28<5430:01:32, 65.40s/it]training loss: 6.656e-03:   0%|          | 1111/300001 [18:49:40<5595:45:19, 67.40s/it]training loss: 6.656e-03:   0%|          | 1112/300001 [18:50:59<5888:20:01, 70.92s/it]training loss: 6.656e-03:   0%|          | 1113/300001 [18:52:04<5724:36:05, 68.95s/it]training loss: 6.656e-03:   0%|          | 1114/300001 [18:53:16<5802:35:39, 69.89s/it]training loss: 6.656e-03:   0%|          | 1115/300001 [18:54:27<5836:20:02, 70.30s/it]training loss: 6.656e-03:   0%|          | 1116/300001 [18:55:40<5904:52:08, 71.12s/it]training loss: 6.656e-03:   0%|          | 1117/300001 [18:57:02<6173:27:02, 74.36s/it]training loss: 6.656e-03:   0%|          | 1118/300001 [18:58:00<5760:03:56, 69.38s/it]training loss: 6.656e-03:   0%|          | 1119/300001 [18:59:14<5876:18:18, 70.78s/it]training loss: 6.656e-03:   0%|          | 1120/300001 [18:59:58<5208:50:06, 62.74s/it]training loss: 6.259e-03:   0%|          | 1120/300001 [19:00:56<5208:50:06, 62.74s/it]training loss: 6.259e-03:   0%|          | 1121/300001 [19:00:57<5128:40:22, 61.77s/it]training loss: 6.259e-03:   0%|          | 1122/300001 [19:01:45<4791:33:22, 57.71s/it]training loss: 6.259e-03:   0%|          | 1123/300001 [19:03:10<5458:32:25, 65.75s/it]training loss: 6.259e-03:   0%|          | 1124/300001 [19:04:45<6197:16:38, 74.65s/it]training loss: 6.259e-03:   0%|          | 1125/300001 [19:05:44<5807:43:29, 69.95s/it]training loss: 6.259e-03:   0%|          | 1126/300001 [19:06:51<5734:33:40, 69.07s/it]training loss: 6.259e-03:   0%|          | 1127/300001 [19:08:22<6265:19:28, 75.47s/it]training loss: 6.259e-03:   0%|          | 1128/300001 [19:09:09<5569:51:41, 67.09s/it]training loss: 6.259e-03:   0%|          | 1129/300001 [19:10:01<5188:35:02, 62.50s/it]training loss: 6.259e-03:   0%|          | 1130/300001 [19:10:56<4996:32:53, 60.19s/it]training loss: 6.259e-03:   0%|          | 1131/300001 [19:11:59<5076:40:44, 61.15s/it]training loss: 6.259e-03:   0%|          | 1132/300001 [19:13:21<5588:09:22, 67.31s/it]training loss: 6.259e-03:   0%|          | 1133/300001 [19:14:23<5458:49:16, 65.75s/it]training loss: 6.259e-03:   0%|          | 1134/300001 [19:15:37<5676:42:50, 68.38s/it]training loss: 6.259e-03:   0%|          | 1135/300001 [19:16:57<5961:27:52, 71.81s/it]training loss: 6.259e-03:   0%|          | 1136/300001 [19:18:34<6589:38:19, 79.38s/it]training loss: 6.259e-03:   0%|          | 1137/300001 [19:19:35<6115:20:25, 73.66s/it]training loss: 6.259e-03:   0%|          | 1138/300001 [19:20:31<5679:40:19, 68.42s/it]training loss: 6.259e-03:   0%|          | 1139/300001 [19:21:22<5238:15:28, 63.10s/it]training loss: 6.259e-03:   0%|          | 1140/300001 [19:22:10<4875:49:37, 58.73s/it]training loss: 6.939e-03:   0%|          | 1140/300001 [19:23:03<4875:49:37, 58.73s/it]training loss: 6.939e-03:   0%|          | 1141/300001 [19:23:03<4732:18:44, 57.00s/it]training loss: 6.939e-03:   0%|          | 1142/300001 [19:24:33<5540:31:50, 66.74s/it]training loss: 6.939e-03:   0%|          | 1143/300001 [19:25:43<5640:45:23, 67.95s/it]training loss: 6.939e-03:   0%|          | 1144/300001 [19:26:31<5142:20:14, 61.94s/it]training loss: 6.939e-03:   0%|          | 1145/300001 [19:27:44<5402:22:48, 65.08s/it]training loss: 6.939e-03:   0%|          | 1146/300001 [19:28:39<5169:25:35, 62.27s/it]training loss: 6.939e-03:   0%|          | 1147/300001 [19:29:40<5117:30:20, 61.65s/it]training loss: 6.939e-03:   0%|          | 1148/300001 [19:30:29<4808:29:26, 57.92s/it]training loss: 6.939e-03:   0%|          | 1149/300001 [19:31:30<4902:57:59, 59.06s/it]training loss: 6.939e-03:   0%|          | 1150/300001 [19:32:15<4529:51:16, 54.57s/it]training loss: 6.939e-03:   0%|          | 1151/300001 [19:33:05<4422:51:03, 53.28s/it]training loss: 6.939e-03:   0%|          | 1152/300001 [19:33:50<4216:48:19, 50.80s/it]training loss: 6.939e-03:   0%|          | 1153/300001 [19:34:42<4259:37:19, 51.31s/it]training loss: 6.939e-03:   0%|          | 1154/300001 [19:35:32<4217:35:46, 50.81s/it]training loss: 6.939e-03:   0%|          | 1155/300001 [19:36:18<4098:15:48, 49.37s/it]training loss: 6.939e-03:   0%|          | 1156/300001 [19:37:19<4383:16:44, 52.80s/it]training loss: 6.939e-03:   0%|          | 1157/300001 [19:38:08<4286:30:35, 51.64s/it]training loss: 6.939e-03:   0%|          | 1158/300001 [19:38:56<4210:25:01, 50.72s/it]training loss: 6.939e-03:   0%|          | 1159/300001 [19:39:44<4130:32:41, 49.76s/it]training loss: 6.939e-03:   0%|          | 1160/300001 [19:40:31<4069:59:44, 49.03s/it]training loss: 6.393e-03:   0%|          | 1160/300001 [19:41:22<4069:59:44, 49.03s/it]training loss: 6.393e-03:   0%|          | 1161/300001 [19:41:23<4130:05:23, 49.75s/it]training loss: 6.393e-03:   0%|          | 1162/300001 [19:42:10<4074:25:16, 49.08s/it]training loss: 6.393e-03:   0%|          | 1163/300001 [19:42:51<3879:58:39, 46.74s/it]training loss: 6.393e-03:   0%|          | 1164/300001 [19:43:31<3692:25:39, 44.48s/it]training loss: 6.393e-03:   0%|          | 1165/300001 [19:44:11<3592:43:10, 43.28s/it]training loss: 6.393e-03:   0%|          | 1166/300001 [19:44:51<3504:08:24, 42.21s/it]training loss: 6.393e-03:   0%|          | 1167/300001 [19:45:34<3533:13:38, 42.56s/it]training loss: 6.393e-03:   0%|          | 1168/300001 [19:46:11<3378:21:31, 40.70s/it]training loss: 6.393e-03:   0%|          | 1169/300001 [19:46:54<3445:06:47, 41.50s/it]training loss: 6.393e-03:   0%|          | 1170/300001 [19:47:31<3343:36:19, 40.28s/it]training loss: 6.393e-03:   0%|          | 1171/300001 [19:48:13<3369:09:17, 40.59s/it]training loss: 6.393e-03:   0%|          | 1172/300001 [19:48:52<3351:04:31, 40.37s/it]training loss: 6.393e-03:   0%|          | 1173/300001 [19:49:32<3327:44:41, 40.09s/it]training loss: 6.393e-03:   0%|          | 1174/300001 [19:50:17<3459:32:02, 41.68s/it]training loss: 6.393e-03:   0%|          | 1175/300001 [19:50:56<3392:39:35, 40.87s/it]training loss: 6.393e-03:   0%|          | 1176/300001 [19:51:40<3453:40:52, 41.61s/it]training loss: 6.393e-03:   0%|          | 1177/300001 [19:52:25<3540:17:40, 42.65s/it]training loss: 6.393e-03:   0%|          | 1178/300001 [19:53:04<3464:15:00, 41.73s/it]training loss: 6.393e-03:   0%|          | 1179/300001 [19:53:52<3600:49:10, 43.38s/it]training loss: 6.393e-03:   0%|          | 1180/300001 [19:54:30<3485:15:28, 41.99s/it]training loss: 6.450e-03:   0%|          | 1180/300001 [19:55:10<3485:15:28, 41.99s/it]training loss: 6.450e-03:   0%|          | 1181/300001 [19:55:10<3432:43:57, 41.36s/it]training loss: 6.450e-03:   0%|          | 1182/300001 [19:55:47<3311:52:42, 39.90s/it]training loss: 6.450e-03:   0%|          | 1183/300001 [19:56:25<3261:49:59, 39.30s/it]training loss: 6.450e-03:   0%|          | 1184/300001 [19:57:02<3205:37:14, 38.62s/it]training loss: 6.450e-03:   0%|          | 1185/300001 [19:57:41<3215:27:00, 38.74s/it]training loss: 6.450e-03:   0%|          | 1186/300001 [19:58:21<3268:40:02, 39.38s/it]training loss: 6.450e-03:   0%|          | 1187/300001 [19:59:06<3389:01:02, 40.83s/it]training loss: 6.450e-03:   0%|          | 1188/300001 [19:59:47<3399:40:24, 40.96s/it]training loss: 6.450e-03:   0%|          | 1189/300001 [20:00:28<3406:37:00, 41.04s/it]training loss: 6.450e-03:   0%|          | 1190/300001 [20:01:15<3547:34:49, 42.74s/it]training loss: 6.450e-03:   0%|          | 1191/300001 [20:01:52<3398:28:25, 40.94s/it]training loss: 6.450e-03:   0%|          | 1192/300001 [20:02:32<3387:29:48, 40.81s/it]training loss: 6.450e-03:   0%|          | 1193/300001 [20:03:14<3401:46:15, 40.98s/it]training loss: 6.450e-03:   0%|          | 1194/300001 [20:03:57<3469:45:11, 41.80s/it]training loss: 6.450e-03:   0%|          | 1195/300001 [20:04:37<3409:27:10, 41.08s/it]training loss: 6.450e-03:   0%|          | 1196/300001 [20:05:17<3393:38:45, 40.89s/it]training loss: 6.450e-03:   0%|          | 1197/300001 [20:05:59<3412:39:59, 41.12s/it]training loss: 6.450e-03:   0%|          | 1198/300001 [20:06:41<3433:50:37, 41.37s/it]training loss: 6.450e-03:   0%|          | 1199/300001 [20:07:23<3468:51:12, 41.79s/it]training loss: 6.450e-03:   0%|          | 1200/300001 [20:08:05<3457:02:32, 41.65s/it]training loss: 6.586e-03:   0%|          | 1200/300001 [20:08:45<3457:02:32, 41.65s/it]training loss: 6.586e-03:   0%|          | 1201/300001 [20:08:45<3416:28:45, 41.16s/it]training loss: 6.586e-03:   0%|          | 1202/300001 [20:09:25<3383:12:16, 40.76s/it]training loss: 6.586e-03:   0%|          | 1203/300001 [20:10:05<3376:55:23, 40.69s/it]training loss: 6.586e-03:   0%|          | 1204/300001 [20:10:45<3348:08:21, 40.34s/it]training loss: 6.586e-03:   0%|          | 1205/300001 [20:11:26<3382:33:12, 40.75s/it]training loss: 6.586e-03:   0%|          | 1206/300001 [20:12:14<3561:20:35, 42.91s/it]training loss: 6.586e-03:   0%|          | 1207/300001 [20:12:54<3476:18:46, 41.88s/it]training loss: 6.586e-03:   0%|          | 1208/300001 [20:13:32<3378:39:13, 40.71s/it]training loss: 6.586e-03:   0%|          | 1209/300001 [20:14:09<3293:23:52, 39.68s/it]training loss: 6.586e-03:   0%|          | 1210/300001 [20:14:50<3319:02:09, 39.99s/it]training loss: 6.586e-03:   0%|          | 1211/300001 [20:15:28<3277:10:18, 39.49s/it]training loss: 6.586e-03:   0%|          | 1212/300001 [20:16:07<3265:50:03, 39.35s/it]training loss: 6.586e-03:   0%|          | 1213/300001 [20:16:47<3273:24:35, 39.44s/it]training loss: 6.586e-03:   0%|          | 1214/300001 [20:17:24<3230:00:11, 38.92s/it]training loss: 6.586e-03:   0%|          | 1215/300001 [20:18:02<3191:34:00, 38.45s/it]training loss: 6.586e-03:   0%|          | 1216/300001 [20:18:49<3419:02:15, 41.20s/it]training loss: 6.586e-03:   0%|          | 1217/300001 [20:19:32<3441:29:45, 41.47s/it]training loss: 6.586e-03:   0%|          | 1218/300001 [20:20:13<3439:48:16, 41.45s/it]training loss: 6.586e-03:   0%|          | 1219/300001 [20:20:53<3395:43:27, 40.91s/it]training loss: 6.586e-03:   0%|          | 1220/300001 [20:21:34<3408:18:59, 41.07s/it]training loss: 6.503e-03:   0%|          | 1220/300001 [20:22:12<3408:18:59, 41.07s/it]training loss: 6.503e-03:   0%|          | 1221/300001 [20:22:12<3326:50:08, 40.09s/it]training loss: 6.503e-03:   0%|          | 1222/300001 [20:22:51<3294:26:38, 39.69s/it]training loss: 6.503e-03:   0%|          | 1223/300001 [20:23:29<3261:07:08, 39.29s/it]training loss: 6.503e-03:   0%|          | 1224/300001 [20:24:12<3366:57:37, 40.57s/it]training loss: 6.503e-03:   0%|          | 1225/300001 [20:24:55<3415:57:33, 41.16s/it]training loss: 6.503e-03:   0%|          | 1226/300001 [20:25:42<3561:28:38, 42.91s/it]training loss: 6.503e-03:   0%|          | 1227/300001 [20:26:25<3574:36:42, 43.07s/it]training loss: 6.503e-03:   0%|          | 1228/300001 [20:27:08<3555:33:46, 42.84s/it]training loss: 6.503e-03:   0%|          | 1229/300001 [20:27:52<3601:49:35, 43.40s/it]training loss: 6.503e-03:   0%|          | 1230/300001 [20:28:30<3463:33:55, 41.73s/it]training loss: 6.503e-03:   0%|          | 1231/300001 [20:29:09<3383:52:41, 40.77s/it]training loss: 6.503e-03:   0%|          | 1232/300001 [20:29:52<3454:02:58, 41.62s/it]training loss: 6.503e-03:   0%|          | 1233/300001 [20:30:32<3413:28:48, 41.13s/it]training loss: 6.503e-03:   0%|          | 1234/300001 [20:31:14<3428:11:58, 41.31s/it]training loss: 6.503e-03:   0%|          | 1235/300001 [20:31:53<3372:53:44, 40.64s/it]training loss: 6.503e-03:   0%|          | 1236/300001 [20:32:36<3426:45:37, 41.29s/it]training loss: 6.503e-03:   0%|          | 1237/300001 [20:33:22<3535:26:15, 42.60s/it]training loss: 6.503e-03:   0%|          | 1238/300001 [20:34:06<3581:45:47, 43.16s/it]training loss: 6.503e-03:   0%|          | 1239/300001 [20:34:46<3507:07:22, 42.26s/it]training loss: 6.503e-03:   0%|          | 1240/300001 [20:35:26<3441:29:52, 41.47s/it]training loss: 7.898e-03:   0%|          | 1240/300001 [20:36:13<3441:29:52, 41.47s/it]training loss: 7.898e-03:   0%|          | 1241/300001 [20:36:13<3574:42:55, 43.07s/it]training loss: 7.898e-03:   0%|          | 1242/300001 [20:36:53<3506:27:07, 42.25s/it]training loss: 7.898e-03:   0%|          | 1243/300001 [20:37:34<3467:46:19, 41.79s/it]training loss: 7.898e-03:   0%|          | 1244/300001 [20:38:18<3530:15:48, 42.54s/it]training loss: 7.898e-03:   0%|          | 1245/300001 [20:39:01<3536:48:44, 42.62s/it]training loss: 7.898e-03:   0%|          | 1246/300001 [20:39:44<3547:17:44, 42.74s/it]training loss: 7.898e-03:   0%|          | 1247/300001 [20:40:25<3507:41:02, 42.27s/it]training loss: 7.898e-03:   0%|          | 1248/300001 [20:41:06<3484:19:20, 41.99s/it]training loss: 7.898e-03:   0%|          | 1249/300001 [20:41:47<3443:54:22, 41.50s/it]training loss: 7.898e-03:   0%|          | 1250/300001 [20:42:28<3438:49:36, 41.44s/it]training loss: 7.898e-03:   0%|          | 1251/300001 [20:43:06<3359:02:22, 40.48s/it]training loss: 7.898e-03:   0%|          | 1252/300001 [20:43:48<3383:49:55, 40.78s/it]training loss: 7.898e-03:   0%|          | 1253/300001 [20:44:27<3341:05:31, 40.26s/it]training loss: 7.898e-03:   0%|          | 1254/300001 [20:45:06<3321:33:07, 40.03s/it]training loss: 7.898e-03:   0%|          | 1255/300001 [20:45:50<3403:25:17, 41.01s/it]training loss: 7.898e-03:   0%|          | 1256/300001 [20:46:18<3090:45:58, 37.25s/it]training loss: 7.898e-03:   0%|          | 1257/300001 [20:46:56<3116:19:12, 37.55s/it]training loss: 7.898e-03:   0%|          | 1258/300001 [20:47:34<3106:13:33, 37.43s/it]training loss: 7.898e-03:   0%|          | 1259/300001 [20:48:14<3184:18:59, 38.37s/it]training loss: 7.898e-03:   0%|          | 1260/300001 [20:48:56<3280:37:22, 39.53s/it]training loss: 9.549e-03:   0%|          | 1260/300001 [20:49:37<3280:37:22, 39.53s/it]training loss: 9.549e-03:   0%|          | 1261/300001 [20:49:38<3321:33:50, 40.03s/it]training loss: 9.549e-03:   0%|          | 1262/300001 [20:50:16<3291:03:24, 39.66s/it]training loss: 9.549e-03:   0%|          | 1263/300001 [20:50:57<3309:24:00, 39.88s/it]training loss: 9.549e-03:   0%|          | 1264/300001 [20:51:38<3335:49:25, 40.20s/it]training loss: 9.549e-03:   0%|          | 1265/300001 [20:52:15<3257:19:28, 39.25s/it]training loss: 9.549e-03:   0%|          | 1266/300001 [20:52:53<3227:13:41, 38.89s/it]training loss: 9.549e-03:   0%|          | 1267/300001 [20:53:33<3250:52:04, 39.18s/it]training loss: 9.549e-03:   0%|          | 1268/300001 [20:54:14<3298:20:13, 39.75s/it]training loss: 9.549e-03:   0%|          | 1269/300001 [20:55:08<3658:39:39, 44.09s/it]training loss: 9.549e-03:   0%|          | 1270/300001 [20:55:48<3553:10:11, 42.82s/it]training loss: 9.549e-03:   0%|          | 1271/300001 [20:56:30<3534:13:44, 42.59s/it]training loss: 9.549e-03:   0%|          | 1272/300001 [20:57:11<3495:41:03, 42.13s/it]training loss: 9.549e-03:   0%|          | 1273/300001 [20:57:48<3363:46:42, 40.54s/it]training loss: 9.549e-03:   0%|          | 1274/300001 [20:58:26<3299:45:28, 39.77s/it]training loss: 9.549e-03:   0%|          | 1275/300001 [20:59:12<3455:34:06, 41.64s/it]training loss: 9.549e-03:   0%|          | 1276/300001 [21:00:06<3780:48:56, 45.56s/it]training loss: 9.549e-03:   0%|          | 1277/300001 [21:00:48<3685:59:41, 44.42s/it]training loss: 9.549e-03:   0%|          | 1278/300001 [21:01:29<3587:59:02, 43.24s/it]training loss: 9.549e-03:   0%|          | 1279/300001 [21:02:09<3512:47:08, 42.33s/it]training loss: 9.549e-03:   0%|          | 1280/300001 [21:02:52<3524:48:38, 42.48s/it]training loss: 6.843e-03:   0%|          | 1280/300001 [21:03:39<3524:48:38, 42.48s/it]training loss: 6.843e-03:   0%|          | 1281/300001 [21:03:39<3651:38:38, 44.01s/it]training loss: 6.843e-03:   0%|          | 1282/300001 [21:04:31<3836:46:02, 46.24s/it]training loss: 6.843e-03:   0%|          | 1283/300001 [21:05:21<3942:15:41, 47.51s/it]training loss: 6.843e-03:   0%|          | 1284/300001 [21:06:05<3854:14:02, 46.45s/it]training loss: 6.843e-03:   0%|          | 1285/300001 [21:06:47<3748:19:53, 45.17s/it]training loss: 6.843e-03:   0%|          | 1286/300001 [21:07:30<3691:14:04, 44.49s/it]training loss: 6.843e-03:   0%|          | 1287/300001 [21:08:10<3576:46:20, 43.11s/it]training loss: 6.843e-03:   0%|          | 1288/300001 [21:08:54<3602:22:53, 43.41s/it]training loss: 6.843e-03:   0%|          | 1289/300001 [21:09:43<3735:13:09, 45.02s/it]training loss: 6.843e-03:   0%|          | 1290/300001 [21:10:32<3829:33:30, 46.15s/it]training loss: 6.843e-03:   0%|          | 1291/300001 [21:11:12<3686:00:48, 44.42s/it]training loss: 6.843e-03:   0%|          | 1292/300001 [21:11:55<3641:20:16, 43.88s/it]training loss: 6.843e-03:   0%|          | 1293/300001 [21:12:36<3570:41:53, 43.03s/it]training loss: 6.843e-03:   0%|          | 1294/300001 [21:13:19<3580:34:09, 43.15s/it]training loss: 6.843e-03:   0%|          | 1295/300001 [21:14:04<3612:14:59, 43.53s/it]training loss: 6.843e-03:   0%|          | 1296/300001 [21:14:42<3488:40:30, 42.05s/it]training loss: 6.843e-03:   0%|          | 1297/300001 [21:15:22<3421:19:52, 41.23s/it]training loss: 6.843e-03:   0%|          | 1298/300001 [21:16:02<3407:17:28, 41.07s/it]training loss: 6.843e-03:   0%|          | 1299/300001 [21:16:42<3361:33:48, 40.51s/it]training loss: 6.843e-03:   0%|          | 1300/300001 [21:17:20<3314:14:27, 39.94s/it]training loss: 6.348e-03:   0%|          | 1300/300001 [21:17:57<3314:14:27, 39.94s/it]training loss: 6.348e-03:   0%|          | 1301/300001 [21:17:57<3243:44:38, 39.09s/it]training loss: 6.348e-03:   0%|          | 1302/300001 [21:18:37<3251:27:46, 39.19s/it]training loss: 6.348e-03:   0%|          | 1303/300001 [21:19:17<3280:48:35, 39.54s/it]training loss: 6.348e-03:   0%|          | 1304/300001 [21:19:54<3210:40:06, 38.70s/it]training loss: 6.348e-03:   0%|          | 1305/300001 [21:20:32<3194:08:19, 38.50s/it]training loss: 6.348e-03:   0%|          | 1306/300001 [21:21:08<3135:24:46, 37.79s/it]training loss: 6.348e-03:   0%|          | 1307/300001 [21:21:45<3112:42:05, 37.52s/it]training loss: 6.348e-03:   0%|          | 1308/300001 [21:22:24<3165:53:36, 38.16s/it]training loss: 6.348e-03:   0%|          | 1309/300001 [21:23:02<3160:56:38, 38.10s/it]training loss: 6.348e-03:   0%|          | 1310/300001 [21:23:43<3220:37:48, 38.82s/it]training loss: 6.348e-03:   0%|          | 1311/300001 [21:24:22<3233:00:24, 38.97s/it]training loss: 6.348e-03:   0%|          | 1312/300001 [21:24:57<3136:54:09, 37.81s/it]training loss: 6.348e-03:   0%|          | 1313/300001 [21:25:33<3077:48:30, 37.10s/it]training loss: 6.348e-03:   0%|          | 1314/300001 [21:26:13<3146:53:34, 37.93s/it]training loss: 6.348e-03:   0%|          | 1315/300001 [21:26:50<3142:13:33, 37.87s/it]training loss: 6.348e-03:   0%|          | 1316/300001 [21:27:25<3061:38:30, 36.90s/it]training loss: 6.348e-03:   0%|          | 1317/300001 [21:28:01<3040:32:34, 36.65s/it]training loss: 6.348e-03:   0%|          | 1318/300001 [21:28:39<3063:52:01, 36.93s/it]training loss: 6.348e-03:   0%|          | 1319/300001 [21:29:17<3104:29:17, 37.42s/it]training loss: 6.348e-03:   0%|          | 1320/300001 [21:29:58<3192:00:32, 38.47s/it]training loss: 6.270e-03:   0%|          | 1320/300001 [21:30:36<3192:00:32, 38.47s/it]training loss: 6.270e-03:   0%|          | 1321/300001 [21:30:36<3187:59:06, 38.42s/it]training loss: 6.270e-03:   0%|          | 1322/300001 [21:31:16<3210:36:32, 38.70s/it]training loss: 6.270e-03:   0%|          | 1323/300001 [21:31:56<3244:37:13, 39.11s/it]training loss: 6.270e-03:   0%|          | 1324/300001 [21:32:31<3149:53:26, 37.97s/it]training loss: 6.270e-03:   0%|          | 1325/300001 [21:33:08<3110:37:57, 37.49s/it]training loss: 6.270e-03:   0%|          | 1326/300001 [21:33:45<3118:34:48, 37.59s/it]training loss: 6.270e-03:   0%|          | 1327/300001 [21:34:26<3197:57:09, 38.55s/it]training loss: 6.270e-03:   0%|          | 1328/300001 [21:35:07<3254:12:07, 39.22s/it]training loss: 6.270e-03:   0%|          | 1329/300001 [21:35:45<3218:18:50, 38.79s/it]training loss: 6.270e-03:   0%|          | 1330/300001 [21:36:25<3244:40:32, 39.11s/it]training loss: 6.270e-03:   0%|          | 1331/300001 [21:37:00<3159:16:22, 38.08s/it]training loss: 6.270e-03:   0%|          | 1332/300001 [21:37:38<3161:01:40, 38.10s/it]training loss: 6.270e-03:   0%|          | 1333/300001 [21:38:21<3261:25:15, 39.31s/it]training loss: 6.270e-03:   0%|          | 1334/300001 [21:38:59<3237:38:50, 39.03s/it]training loss: 6.270e-03:   0%|          | 1335/300001 [21:39:40<3281:27:10, 39.55s/it]training loss: 6.270e-03:   0%|          | 1336/300001 [21:40:17<3236:05:53, 39.01s/it]training loss: 6.270e-03:   0%|          | 1337/300001 [21:41:00<3314:33:56, 39.95s/it]training loss: 6.270e-03:   0%|          | 1338/300001 [21:41:44<3428:55:34, 41.33s/it]training loss: 6.270e-03:   0%|          | 1339/300001 [21:42:25<3408:44:20, 41.09s/it]training loss: 6.270e-03:   0%|          | 1340/300001 [21:43:01<3300:08:02, 39.78s/it]training loss: 6.632e-03:   0%|          | 1340/300001 [21:43:42<3300:08:02, 39.78s/it]training loss: 6.632e-03:   0%|          | 1341/300001 [21:43:42<3318:47:26, 40.00s/it]training loss: 6.632e-03:   0%|          | 1342/300001 [21:44:23<3338:05:38, 40.24s/it]training loss: 6.632e-03:   0%|          | 1343/300001 [21:45:07<3427:48:54, 41.32s/it]training loss: 6.632e-03:   0%|          | 1344/300001 [21:45:48<3428:17:09, 41.32s/it]training loss: 6.632e-03:   0%|          | 1345/300001 [21:46:29<3426:32:35, 41.30s/it]training loss: 6.632e-03:   0%|          | 1346/300001 [21:47:12<3460:35:32, 41.71s/it]training loss: 6.632e-03:   0%|          | 1347/300001 [21:47:50<3377:32:43, 40.71s/it]training loss: 6.632e-03:   0%|          | 1348/300001 [21:48:32<3394:02:24, 40.91s/it]training loss: 6.632e-03:   0%|          | 1349/300001 [21:49:12<3370:40:20, 40.63s/it]training loss: 6.632e-03:   0%|          | 1350/300001 [21:49:52<3369:07:47, 40.61s/it]training loss: 6.632e-03:   0%|          | 1351/300001 [21:50:30<3306:03:33, 39.85s/it]training loss: 6.632e-03:   0%|          | 1352/300001 [21:51:08<3252:44:24, 39.21s/it]training loss: 6.632e-03:   0%|          | 1353/300001 [21:51:48<3279:52:17, 39.54s/it]training loss: 6.632e-03:   0%|          | 1354/300001 [21:52:33<3411:52:21, 41.13s/it]training loss: 6.632e-03:   0%|          | 1355/300001 [21:53:11<3344:41:32, 40.32s/it]training loss: 6.632e-03:   0%|          | 1356/300001 [21:53:53<3376:58:32, 40.71s/it]training loss: 6.632e-03:   0%|          | 1357/300001 [21:54:29<3270:00:19, 39.42s/it]training loss: 6.632e-03:   0%|          | 1358/300001 [21:55:17<3475:39:38, 41.90s/it]training loss: 6.632e-03:   0%|          | 1359/300001 [21:56:02<3537:00:03, 42.64s/it]training loss: 6.632e-03:   0%|          | 1360/300001 [21:56:40<3423:17:46, 41.27s/it]training loss: 5.925e-03:   0%|          | 1360/300001 [21:57:23<3423:17:46, 41.27s/it]training loss: 5.925e-03:   0%|          | 1361/300001 [21:57:23<3476:03:44, 41.90s/it]training loss: 5.925e-03:   0%|          | 1362/300001 [21:58:02<3393:59:46, 40.91s/it]training loss: 5.925e-03:   0%|          | 1363/300001 [21:58:44<3423:50:02, 41.27s/it]training loss: 5.925e-03:   0%|          | 1364/300001 [21:59:22<3362:40:35, 40.54s/it]training loss: 5.925e-03:   0%|          | 1365/300001 [21:59:58<3249:26:22, 39.17s/it]training loss: 5.925e-03:   0%|          | 1366/300001 [22:00:37<3236:59:35, 39.02s/it]training loss: 5.925e-03:   0%|          | 1367/300001 [22:01:17<3268:36:18, 39.40s/it]training loss: 5.925e-03:   0%|          | 1368/300001 [22:01:54<3189:47:21, 38.45s/it]training loss: 5.925e-03:   0%|          | 1369/300001 [22:02:32<3194:59:21, 38.52s/it]training loss: 5.925e-03:   0%|          | 1370/300001 [22:03:08<3126:56:46, 37.70s/it]training loss: 5.925e-03:   0%|          | 1371/300001 [22:03:45<3112:09:46, 37.52s/it]training loss: 5.925e-03:   0%|          | 1372/300001 [22:04:25<3180:30:54, 38.34s/it]training loss: 5.925e-03:   0%|          | 1373/300001 [22:05:03<3154:30:45, 38.03s/it]training loss: 5.925e-03:   0%|          | 1374/300001 [22:05:42<3195:12:11, 38.52s/it]training loss: 5.925e-03:   0%|          | 1375/300001 [22:06:20<3175:27:43, 38.28s/it]training loss: 5.925e-03:   0%|          | 1376/300001 [22:06:59<3200:43:05, 38.59s/it]training loss: 5.925e-03:   0%|          | 1377/300001 [22:07:37<3183:27:57, 38.38s/it]training loss: 5.925e-03:   0%|          | 1378/300001 [22:08:18<3248:56:55, 39.17s/it]training loss: 5.925e-03:   0%|          | 1379/300001 [22:08:56<3212:04:47, 38.72s/it]training loss: 5.925e-03:   0%|          | 1380/300001 [22:09:32<3132:08:56, 37.76s/it]training loss: 5.798e-03:   0%|          | 1380/300001 [22:10:09<3132:08:56, 37.76s/it]training loss: 5.798e-03:   0%|          | 1381/300001 [22:10:09<3118:11:29, 37.59s/it]training loss: 5.798e-03:   0%|          | 1382/300001 [22:10:54<3303:44:28, 39.83s/it]training loss: 5.798e-03:   0%|          | 1383/300001 [22:11:31<3244:11:50, 39.11s/it]training loss: 5.798e-03:   0%|          | 1384/300001 [22:12:08<3195:40:52, 38.53s/it]training loss: 5.798e-03:   0%|          | 1385/300001 [22:12:45<3139:42:54, 37.85s/it]training loss: 5.798e-03:   0%|          | 1386/300001 [22:13:25<3205:31:54, 38.64s/it]training loss: 5.798e-03:   0%|          | 1387/300001 [22:14:09<3330:18:09, 40.15s/it]training loss: 5.798e-03:   0%|          | 1388/300001 [22:15:04<3708:00:54, 44.70s/it]training loss: 5.798e-03:   0%|          | 1389/300001 [22:16:00<3983:18:15, 48.02s/it]training loss: 5.798e-03:   0%|          | 1390/300001 [22:16:42<3839:32:46, 46.29s/it]training loss: 5.798e-03:   0%|          | 1391/300001 [22:17:27<3800:03:31, 45.81s/it]training loss: 5.798e-03:   0%|          | 1392/300001 [22:18:07<3645:55:36, 43.95s/it]training loss: 5.798e-03:   0%|          | 1393/300001 [22:18:51<3658:01:40, 44.10s/it]training loss: 5.798e-03:   0%|          | 1394/300001 [22:19:33<3600:04:14, 43.40s/it]training loss: 5.798e-03:   0%|          | 1395/300001 [22:20:12<3500:24:38, 42.20s/it]training loss: 5.798e-03:   0%|          | 1396/300001 [22:20:51<3414:05:27, 41.16s/it]training loss: 5.798e-03:   0%|          | 1397/300001 [22:21:31<3389:30:53, 40.86s/it]training loss: 5.798e-03:   0%|          | 1398/300001 [22:22:12<3399:12:00, 40.98s/it]training loss: 5.798e-03:   0%|          | 1399/300001 [22:22:55<3438:29:15, 41.46s/it]training loss: 5.798e-03:   0%|          | 1400/300001 [22:23:35<3410:19:59, 41.12s/it]training loss: 5.472e-03:   0%|          | 1400/300001 [22:24:16<3410:19:59, 41.12s/it]training loss: 5.472e-03:   0%|          | 1401/300001 [22:24:16<3394:19:57, 40.92s/it]training loss: 5.472e-03:   0%|          | 1402/300001 [22:25:00<3480:50:49, 41.97s/it]training loss: 5.472e-03:   0%|          | 1403/300001 [22:25:41<3443:22:39, 41.51s/it]training loss: 5.472e-03:   0%|          | 1404/300001 [22:26:19<3364:19:59, 40.56s/it]training loss: 5.472e-03:   0%|          | 1405/300001 [22:26:57<3311:15:50, 39.92s/it]training loss: 5.472e-03:   0%|          | 1406/300001 [22:27:36<3269:28:24, 39.42s/it]training loss: 5.472e-03:   0%|          | 1407/300001 [22:28:16<3302:44:58, 39.82s/it]training loss: 5.472e-03:   0%|          | 1408/300001 [22:28:52<3202:39:17, 38.61s/it]training loss: 5.472e-03:   0%|          | 1409/300001 [22:29:33<3251:54:59, 39.21s/it]training loss: 5.472e-03:   0%|          | 1410/300001 [22:30:17<3391:07:53, 40.89s/it]training loss: 5.472e-03:   0%|          | 1411/300001 [22:31:02<3476:08:22, 41.91s/it]training loss: 5.472e-03:   0%|          | 1412/300001 [22:31:47<3549:33:18, 42.80s/it]training loss: 5.472e-03:   0%|          | 1413/300001 [22:32:26<3457:09:23, 41.68s/it]training loss: 5.472e-03:   0%|          | 1414/300001 [22:33:43<4352:36:25, 52.48s/it]training loss: 5.472e-03:   0%|          | 1415/300001 [22:34:27<4130:38:48, 49.80s/it]training loss: 5.472e-03:   0%|          | 1416/300001 [22:35:11<3992:59:22, 48.14s/it]training loss: 5.472e-03:   0%|          | 1417/300001 [22:36:08<4218:28:31, 50.86s/it]training loss: 5.472e-03:   0%|          | 1418/300001 [22:36:52<4040:24:41, 48.72s/it]training loss: 5.472e-03:   0%|          | 1419/300001 [22:37:38<3959:48:20, 47.74s/it]training loss: 5.472e-03:   0%|          | 1420/300001 [22:38:21<3842:20:24, 46.33s/it]training loss: 6.064e-03:   0%|          | 1420/300001 [22:39:15<3842:20:24, 46.33s/it]training loss: 6.064e-03:   0%|          | 1421/300001 [22:39:15<4054:32:46, 48.89s/it]training loss: 6.064e-03:   0%|          | 1422/300001 [22:39:57<3883:34:56, 46.82s/it]training loss: 6.064e-03:   0%|          | 1423/300001 [22:40:44<3883:42:51, 46.83s/it]training loss: 6.064e-03:   0%|          | 1424/300001 [22:41:30<3865:28:11, 46.61s/it]training loss: 6.064e-03:   0%|          | 1425/300001 [22:42:14<3796:33:33, 45.78s/it]training loss: 6.064e-03:   0%|          | 1426/300001 [22:42:55<3681:44:55, 44.39s/it]training loss: 6.064e-03:   0%|          | 1427/300001 [22:43:40<3686:42:31, 44.45s/it]training loss: 6.064e-03:   0%|          | 1428/300001 [22:44:23<3662:18:00, 44.16s/it]training loss: 6.064e-03:   0%|          | 1429/300001 [22:45:02<3532:36:02, 42.59s/it]training loss: 6.064e-03:   0%|          | 1430/300001 [22:45:44<3509:48:04, 42.32s/it]training loss: 6.064e-03:   0%|          | 1431/300001 [22:46:22<3404:40:13, 41.05s/it]training loss: 6.064e-03:   0%|          | 1432/300001 [22:47:01<3342:13:34, 40.30s/it]training loss: 6.064e-03:   0%|          | 1433/300001 [22:47:41<3347:07:46, 40.36s/it]training loss: 6.064e-03:   0%|          | 1434/300001 [22:48:18<3263:51:20, 39.35s/it]training loss: 6.064e-03:   0%|          | 1435/300001 [22:49:00<3333:52:55, 40.20s/it]training loss: 6.064e-03:   0%|          | 1436/300001 [22:49:40<3312:22:26, 39.94s/it]training loss: 6.064e-03:   0%|          | 1437/300001 [22:50:22<3380:46:03, 40.76s/it]training loss: 6.064e-03:   0%|          | 1438/300001 [22:51:03<3377:40:58, 40.73s/it]training loss: 6.064e-03:   0%|          | 1439/300001 [22:51:39<3269:09:05, 39.42s/it]training loss: 6.064e-03:   0%|          | 1440/300001 [22:52:18<3246:36:15, 39.15s/it]training loss: 6.121e-03:   0%|          | 1440/300001 [22:53:02<3246:36:15, 39.15s/it]training loss: 6.121e-03:   0%|          | 1441/300001 [22:53:02<3361:17:21, 40.53s/it]training loss: 6.121e-03:   0%|          | 1442/300001 [22:53:45<3432:13:47, 41.39s/it]training loss: 6.121e-03:   0%|          | 1443/300001 [22:54:23<3350:56:36, 40.41s/it]training loss: 6.121e-03:   0%|          | 1444/300001 [22:55:04<3363:10:40, 40.55s/it]training loss: 6.121e-03:   0%|          | 1445/300001 [22:55:43<3309:14:41, 39.90s/it]training loss: 6.121e-03:   0%|          | 1446/300001 [22:56:21<3266:01:41, 39.38s/it]training loss: 6.121e-03:   0%|          | 1447/300001 [22:57:01<3285:27:58, 39.62s/it]training loss: 6.121e-03:   0%|          | 1448/300001 [22:57:44<3374:08:50, 40.69s/it]training loss: 6.121e-03:   0%|          | 1449/300001 [22:58:27<3425:33:02, 41.31s/it]slurmstepd: error: *** JOB 9913544 ON gpu018 CANCELLED AT 2026-05-15T15:20:01 DUE TO TIME LIMIT ***
diff --git a/slurm/logs/pidm_darcy_pg_9913544.out b/slurm/logs/pidm_darcy_pg_9913544.out
new file mode 100644
index 0000000..4b80c77
--- /dev/null
+++ b/slurm/logs/pidm_darcy_pg_9913544.out
@@ -0,0 +1 @@
+Number of trainable parameters: 10386482
diff --git a/slurm/logs/pidm_toy_9908779.err b/slurm/logs/pidm_toy_9908779.err
new file mode 100644
index 0000000..da791d6
--- /dev/null
+++ b/slurm/logs/pidm_toy_9908779.err
@@ -0,0 +1,7 @@
+Traceback (most recent call last):
+  File "<string>", line 6, in <module>
+  File "main_toy.py", line 7, in <module>
+    from src.denoising_toy_utils import *
+  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/src/denoising_toy_utils.py", line 1, in <module>
+    import os, dill
+ModuleNotFoundError: No module named 'dill'
diff --git a/slurm/logs/pidm_toy_9908779.out b/slurm/logs/pidm_toy_9908779.out
new file mode 100644
index 0000000..e69de29
diff --git a/slurm/logs/pidm_toy_9912059.err b/slurm/logs/pidm_toy_9912059.err
new file mode 100644
index 0000000..322d4c1
--- /dev/null
+++ b/slurm/logs/pidm_toy_9912059.err
@@ -0,0 +1,2 @@
+  0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.5152:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.3789:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.2946:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.2986:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1994:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0912:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0367:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1352:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1058:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0884:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0338:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0145:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1622:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0615:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0173:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0301:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0258:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0413:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0343:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0964:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0162:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9760:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9718:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0519:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9114:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9289:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9336:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0006:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9296:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0271:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9249:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8873:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9933:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9360:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9202:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9836:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8683:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9113:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9114:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7995:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8778:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9115:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8789:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8656:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8538:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9382:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8543:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9284:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9010:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8267:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8483:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7410:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7821:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7964:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8175:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7951:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8026:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7574:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7594:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7234:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8132:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7521:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7649:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7512:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7854:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7253:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7691:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7200:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7329:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6241:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7410:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7128:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7229:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7586:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7287:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6686:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6742:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6595:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0171:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0171:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6374:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6249:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6663:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.7210:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6649:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6854:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6189:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6717:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6249:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6469:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6700:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5936:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6072:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6156:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5700:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5883:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5557:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5855:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5374:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5767:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5291:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5217:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5500:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5624:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4962:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5129:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4655:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5036:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5223:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4714:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4957:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5240:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4823:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4659:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4415:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4376:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4509:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4644:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4519:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4596:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4566:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4783:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4499:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4547:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3599:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3756:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4632:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4386:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3603:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3798:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3933:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3881:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3732:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3522:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3576:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4307:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3738:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3357:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3961:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3725:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4162:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3291:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3322:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3497:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3744:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3528:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3355:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3822:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3706:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4346:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3244:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3953:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3114:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3752:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3561:   0%|          | 1/401 [00:04<24:42,  3.71s/it]training loss: 0.3542:   0%|          | 1/401 [00:04<24:42,  3.71s/it]training loss: 0.4224:   0%|          | 1/401 [00:04<24:42,  3.71s/it]training loss: 0.3633:   0%|          | 1/401 [00:04<24:42,  3.71s/it]training loss: 0.2147:   0%|          | 1/401 [00:04<24:42,  3.71s/it]training loss: 0.2147:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3845:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3693:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3577:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3713:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3821:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3625:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2946:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3450:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3979:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.4316:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3301:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3451:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2920:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3189:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3521:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3802:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3334:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2673:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3271:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3839:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.4021:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2882:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3578:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3489:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3275:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.4010:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.4039:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3388:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3710:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3292:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3677:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3953:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3414:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3305:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3477:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3261:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3771:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3604:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3249:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3791:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3320:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3247:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2592:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3405:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3072:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3682:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3582:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2835:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3406:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3310:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3523:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3634:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2810:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.4075:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2655:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3663:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3028:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3374:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2897:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3823:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3022:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3918:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3126:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3212:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2820:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2836:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2957:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3013:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3636:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3284:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3091:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3655:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3522:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3744:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3992:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3626:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2875:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3349:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.4077:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.4077:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3424:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3990:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3607:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3316:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2497:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3547:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3185:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3593:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3463:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3468:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3027:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2752:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3321:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3308:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3072:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3342:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2876:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3406:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3054:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2590:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2911:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3846:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3155:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3330:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2765:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3410:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3079:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2835:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3051:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3354:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3531:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2541:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3650:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3455:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2858:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3101:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3473:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2787:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2944:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2806:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3480:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3276:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3044:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3267:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3467:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2451:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3267:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3559:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3378:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2999:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3034:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2999:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3185:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3073:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3412:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3302:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2587:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3440:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3271:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2529:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2944:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2907:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2845:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2346:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2846:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3240:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2908:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2569:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3222:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3345:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3578:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3175:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2664:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3073:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2798:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2930:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3096:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3338:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3785:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3785:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2921:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2701:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2517:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2829:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2677:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2732:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3492:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3776:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2839:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2795:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2809:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3082:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2823:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3096:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3089:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3165:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2604:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2795:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3347:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2986:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2537:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3302:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2627:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3029:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2753:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3603:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2633:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2769:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3185:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2667:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3233:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3425:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2895:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3051:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2802:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3600:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3136:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2254:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3810:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2373:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3007:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2902:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2936:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3135:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2800:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2653:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3468:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2617:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2748:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2999:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3400:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3338:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2719:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3330:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3345:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3263:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3196:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2848:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3135:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3131:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2589:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3065:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2976:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3452:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3025:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3033:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2651:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2757:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2662:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2917:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2671:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3028:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3448:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3581:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2578:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2906:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2932:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3125:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2585:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2585:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2738:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2862:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2702:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2572:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2483:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2947:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3033:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3003:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3106:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2813:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3487:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2540:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2927:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2677:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2868:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3114:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3708:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3127:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3087:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2481:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3036:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3212:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2769:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2844:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2469:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3430:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2651:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3458:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2313:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2946:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2810:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3234:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3108:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2653:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2560:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3292:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3457:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3469:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3623:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2652:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3577:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3132:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2586:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3138:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2777:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2708:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2890:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3088:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3459:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3163:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2859:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.1935:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3018:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2812:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2930:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2976:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2899:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2830:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2343:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2675:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2589:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2490:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2925:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2594:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2664:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3099:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3023:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3144:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3879:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3242:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2976:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3268:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2418:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3767:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3026:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2627:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3506:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3499:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3329:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3329:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2961:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3042:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2929:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3308:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2746:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3128:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2987:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2791:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3032:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2023:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3625:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3294:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2796:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3582:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3112:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3010:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2395:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3572:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3115:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3162:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2984:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2988:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3141:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2684:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3336:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2964:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2712:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3123:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2670:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2803:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2586:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2848:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3024:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3315:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3082:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2684:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2989:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2881:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2708:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2806:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3007:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2805:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2755:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3068:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3310:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2396:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3349:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3342:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3907:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2982:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2749:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3045:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2680:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2660:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2692:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3101:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2820:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2769:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3461:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3115:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2572:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2928:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2707:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2880:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3076:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2733:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3123:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3517:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2964:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3110:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3477:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3007:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3231:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2873:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3096:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3459:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3345:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3172:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2325:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2325:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.3423:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.2606:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.2509:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.3133:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.3275:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.2838:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.3062:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.3076:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.2921:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.2709:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.2037:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.2723:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2883:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2380:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3028:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3438:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2467:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3084:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2915:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3472:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3510:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2773:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3127:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2836:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2809:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2585:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3079:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2686:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3180:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3034:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3056:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3111:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2614:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2765:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3055:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2628:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2834:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2736:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3396:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.4051:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2766:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3604:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2764:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2859:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2690:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3101:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2874:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2069:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3167:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2459:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3157:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2435:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3134:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3483:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3135:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3418:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3517:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2995:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3282:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2817:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2481:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3048:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2772:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2627:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3083:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2880:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3151:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2532:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2887:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2417:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2719:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2891:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3127:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2747:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3123:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2471:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2599:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2887:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.4381:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.4381:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2746:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2848:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2641:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2924:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3372:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2419:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2871:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2930:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2606:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3557:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2613:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2536:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3257:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2771:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2375:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3111:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3150:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3060:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2748:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3282:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2904:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3221:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.4045:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2695:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3089:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3610:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2901:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3433:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3229:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2531:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2645:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2876:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2764:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3086:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2686:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3152:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3106:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3033:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2855:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2865:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3316:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2778:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.1981:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2586:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2704:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3218:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2039:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3509:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2685:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2531:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2930:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2892:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2839:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2552:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3535:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2882:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3109:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2991:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2516:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2783:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2499:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3095:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3174:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2985:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2909:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2499:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2212:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3089:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3196:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3273:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2539:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2534:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2979:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2500:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2909:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2664:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2633:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2269:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3809:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3809:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2241:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2214:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2789:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3018:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3126:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2844:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2983:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2988:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2683:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2665:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3073:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2965:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2670:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2857:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2765:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2634:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3097:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3103:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2878:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3881:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2621:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3371:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2858:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3187:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2436:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2922:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3154:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2826:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2591:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2730:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3063:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3292:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3193:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2821:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2588:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2400:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3437:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2754:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2945:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3488:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2650:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2952:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3538:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3202:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3132:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3376:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2190:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2886:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2915:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3248:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3039:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3083:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2823:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2409:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2905:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2824:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3067:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3339:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3317:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3389:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2735:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2327:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2520:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3247:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2371:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2662:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3715:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2964:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2798:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2565:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3268:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2836:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3010:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2415:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3004:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2716:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3422:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2597:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2006:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2006:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2761:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2705:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3304:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2800:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2990:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3032:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3059:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2845:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2675:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3613:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2441:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3349:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3250:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2937:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3339:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2421:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3120:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2726:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2566:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2624:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3023:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2710:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2622:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3155:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3696:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2751:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2600:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3059:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3151:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3098:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2607:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3067:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2453:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2746:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2191:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2555:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2721:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.4218:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3244:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3046:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3004:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2753:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3007:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3426:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2645:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2425:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3052:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2732:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2456:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2853:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2646:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3034:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3099:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3390:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3277:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2919:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3114:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2838:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3035:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2470:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2586:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3310:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2411:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2936:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3381:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3199:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3734:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2201:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2525:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3452:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3278:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2683:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2871:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2945:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2835:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3178:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2827:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3407:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3258:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3258:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2356:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2739:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3495:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2647:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2650:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3064:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3343:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2957:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3016:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2482:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2976:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2254:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2462:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3540:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3438:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2867:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3427:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2467:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2522:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2888:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3750:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2827:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2609:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2349:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3100:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3069:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2881:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2347:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3218:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2811:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3395:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3361:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2860:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2492:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2689:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2592:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2984:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2598:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3535:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3005:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2814:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2764:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2572:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2592:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2650:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3480:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3019:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3180:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2955:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3150:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2981:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3108:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3377:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2717:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3330:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3016:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2929:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3177:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3004:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3235:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2513:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3024:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3130:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3054:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2666:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2826:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2923:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3159:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2639:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2570:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2801:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2754:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2275:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2667:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2684:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3570:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3112:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2730:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2926:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2926:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2246:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3657:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3284:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2139:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2158:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2665:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2603:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3354:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2691:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2730:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2573:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2920:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3040:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3323:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3043:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3053:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2745:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3165:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3038:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2794:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2574:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3204:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3573:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2572:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2846:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3140:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3163:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2806:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2573:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2587:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3098:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2788:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2598:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2872:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2433:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3087:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2636:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3002:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3049:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2881:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2715:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3117:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2670:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3296:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2748:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2629:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3233:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3089:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2972:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2706:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2898:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2619:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2491:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3203:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2825:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2375:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2937:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2721:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2684:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3418:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3055:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2563:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2845:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3210:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2626:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3155:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3457:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2711:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2838:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3139:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2835:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3489:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3277:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2745:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3165:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3172:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2520:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2566:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3143:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3143:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2540:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3532:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3289:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3401:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2790:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3160:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2975:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2864:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3275:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2859:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2500:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2721:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2605:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2792:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2929:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2382:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3169:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2836:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2989:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3156:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2845:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3118:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2230:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3041:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2360:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2186:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3053:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2933:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3012:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2876:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2758:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2772:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2698:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2900:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3586:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2889:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2370:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2546:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2980:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2790:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3550:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2542:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3271:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2512:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2644:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2854:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2649:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2598:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2532:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2658:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2493:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3258:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2946:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2709:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2866:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2831:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2723:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3409:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3028:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3004:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2945:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2389:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3244:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3189:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3122:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3012:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3073:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2990:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2938:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3201:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2499:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2727:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2739:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3155:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3348:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3092:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2749:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3018:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2511:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2511:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2909:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2733:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2746:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3017:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2997:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2995:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2734:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3258:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2643:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3039:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3573:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2829:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3049:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2832:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2694:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2590:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3208:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2384:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2728:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3080:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2840:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2397:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2864:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2725:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2690:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3301:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2993:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2572:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2841:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2578:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3012:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2154:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3139:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2402:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2306:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2782:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2902:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2512:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3025:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2921:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2886:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2477:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3106:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2554:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2298:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2432:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2753:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3109:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2644:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3210:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3212:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2611:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3111:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2895:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2898:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2822:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3240:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2904:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2696:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2954:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3463:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2823:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3623:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2950:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2525:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2515:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3072:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2121:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2785:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2634:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3124:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3064:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2612:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3051:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3078:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3471:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3040:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3121:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2752:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2752:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2343:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2583:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2398:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2475:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2932:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2555:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2499:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2825:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2835:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2913:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2995:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2754:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2449:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3134:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3284:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2922:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2673:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2632:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2393:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3045:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2706:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2849:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3023:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2385:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3163:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2950:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3263:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2686:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2504:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2829:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3534:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2742:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2817:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3081:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2916:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3460:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3385:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2928:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2984:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2086:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2528:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2885:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3003:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2360:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.4150:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3027:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2975:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2584:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2994:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3195:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2828:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2929:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2841:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2969:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3318:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2772:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3302:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2618:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.3014:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2265:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2942:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.3011:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2821:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2535:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2620:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2677:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.3132:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2716:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2413:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2646:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.3658:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2831:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.3135:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.3130:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2657:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2995:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2735:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.3114:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2878:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2878:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3071:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2904:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2250:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2688:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3187:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2906:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2856:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2951:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3114:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2814:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2943:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2998:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2717:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2716:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3051:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2808:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2507:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2378:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3084:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2471:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2720:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2914:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2883:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2837:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2681:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2331:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2872:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3128:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2905:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2518:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3132:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3558:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3690:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2930:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2270:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2914:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2840:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2796:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3070:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3220:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3013:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2885:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2991:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3170:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2332:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2903:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2478:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2919:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2891:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2473:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2480:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3124:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3219:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2754:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2723:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2659:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3045:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3098:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2838:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2930:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3243:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3154:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2758:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3258:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3071:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2981:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3391:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3590:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3295:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2848:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3516:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3179:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3087:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2941:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2661:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2815:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2443:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2883:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3526:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3526:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2816:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3045:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2363:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2597:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2717:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3471:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3170:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2356:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2581:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2563:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3113:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2845:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3060:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2988:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2855:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2913:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3881:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2873:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2893:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2978:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2050:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2128:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2954:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3112:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3135:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2959:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2522:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2516:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2600:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3172:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2868:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2719:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3321:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3075:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3134:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3296:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2397:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2563:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3006:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3160:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2614:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3398:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2896:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2799:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2859:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2708:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2554:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2847:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2854:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2403:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2918:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2294:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3375:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2573:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3430:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2949:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2685:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2569:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2724:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3017:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2525:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2969:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2787:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2731:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3445:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2925:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3432:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2538:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2825:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2547:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2649:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2892:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2464:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2598:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3104:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2956:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2435:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2704:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2451:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2451:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2962:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3713:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2479:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3109:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2365:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2975:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2646:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2601:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2719:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2546:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2396:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3107:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3462:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2704:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2652:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3090:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3048:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2352:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3142:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3106:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2653:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3145:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2528:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2844:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3231:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2724:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2421:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3541:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3242:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2608:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3606:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3101:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2983:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3419:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3555:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2542:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2964:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2768:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2867:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2592:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2594:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2968:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3413:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3194:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2613:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3130:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2811:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2350:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3034:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2738:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2843:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2507:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2670:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3011:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2826:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3041:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3488:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2881:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2664:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2932:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2786:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2950:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2703:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2909:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2739:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3191:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2641:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2307:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2379:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2912:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.3071:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.3151:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2877:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2528:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.3055:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.3024:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.3419:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2452:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2906:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2906:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3281:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2865:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2448:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2967:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2953:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3073:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2878:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2690:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3187:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3064:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2325:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2654:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2411:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2596:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2237:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2544:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3342:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2802:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2808:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2530:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2630:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2819:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2633:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3242:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2686:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3047:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2970:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2673:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2983:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2544:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2783:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2660:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2508:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2364:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2797:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3105:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2797:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3173:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3245:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2214:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2867:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3052:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2679:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3085:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2891:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2748:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2796:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2558:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3325:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2453:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2913:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3278:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2914:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3282:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2640:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3201:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2813:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2904:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3113:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2744:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3715:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2723:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3202:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3125:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2241:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2915:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2561:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2135:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2731:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3051:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2639:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2685:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2775:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2723:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2486:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2902:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2612:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3138:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3449:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3449:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2626:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3964:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2514:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2252:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2916:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2951:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2964:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2642:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2764:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3201:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3051:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2129:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2532:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2572:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2490:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2512:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2118:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2940:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.4087:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3178:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3455:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2466:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2791:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3372:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2608:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2897:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2546:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2927:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2394:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2479:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2184:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3002:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3109:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3337:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2516:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2712:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3161:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3019:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2342:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3096:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2648:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2836:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2856:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3144:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2969:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2667:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3227:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3305:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2984:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2429:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2632:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2595:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3032:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2593:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2712:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2877:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2646:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2988:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2980:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2779:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2809:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3233:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2262:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2944:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3452:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2625:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2435:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2858:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2865:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2890:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2884:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2943:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2758:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3169:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3025:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3057:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2683:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3039:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3801:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3801:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2903:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2801:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2538:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3136:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2931:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3255:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3140:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2957:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3370:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2751:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2802:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2759:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3064:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3174:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3107:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2395:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3313:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2790:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3162:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3109:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2866:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3188:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3033:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2776:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2371:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2410:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2328:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2904:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2874:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2207:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2469:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2717:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2574:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2852:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2831:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3406:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2852:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3226:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2857:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2469:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2900:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2351:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2588:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2149:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2390:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2740:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2320:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2585:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2794:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2872:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2689:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2986:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2524:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2571:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2842:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3198:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2848:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2824:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3191:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2777:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2928:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2905:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2357:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2440:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3307:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2550:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2565:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2461:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2634:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2614:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2184:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2578:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2776:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2700:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2783:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3523:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2946:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2537:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2994:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2994:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2907:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3059:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3104:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2883:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3011:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2802:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3037:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3502:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3375:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3103:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2845:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2822:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3464:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2770:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3514:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2555:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3583:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3344:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3106:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2266:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2663:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2719:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2525:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3274:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2791:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3090:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2903:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2598:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2734:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2802:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2641:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3329:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2593:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3384:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2649:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2614:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3000:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2936:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2704:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2957:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2487:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2712:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2686:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2869:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2981:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2495:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2732:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2694:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3055:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3137:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2850:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2447:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2903:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3117:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2484:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3370:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2793:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2948:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3234:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2877:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3724:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2715:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2746:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2896:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.3103:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2667:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2943:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2728:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.3445:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2890:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2772:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2224:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2565:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.3837:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2191:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2839:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.3672:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.3213:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.3159:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.3159:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2554:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2479:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3664:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2739:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2413:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2701:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2377:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3342:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2685:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2874:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3453:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2908:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3220:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2994:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2804:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2640:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3165:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2705:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2356:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3090:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2748:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2819:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2346:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2727:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2546:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3070:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3096:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2805:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3538:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2464:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2566:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2780:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2828:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3049:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3426:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3399:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2569:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2956:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2789:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2561:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2576:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3179:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2415:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3845:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2861:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2441:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3284:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2988:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2812:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2867:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3511:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2830:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2680:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3267:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2410:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2999:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3075:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3155:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2884:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2611:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2869:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2557:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2794:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2969:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2573:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3248:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3037:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2900:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3069:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3313:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2625:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3545:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2790:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2905:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3060:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2943:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2320:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2807:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3142:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3142:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3134:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2856:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2782:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2862:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2850:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2521:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3159:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3046:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2278:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2928:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3047:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2522:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2656:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2502:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3010:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2775:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2756:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2605:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3085:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3160:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2343:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2367:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2853:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2614:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2807:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2445:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2696:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3381:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2547:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2683:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2976:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3196:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2731:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3152:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2530:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2896:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2756:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2728:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3113:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2897:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2583:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2648:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2702:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2530:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3188:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2341:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2906:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2969:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3075:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3331:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3659:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2653:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2936:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2625:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2708:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2897:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2730:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2678:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2619:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2808:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2703:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3019:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2867:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2953:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2741:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2936:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2170:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3149:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3025:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3065:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2571:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2564:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2999:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3346:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2875:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2653:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2674:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2608:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.4335:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.4335:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2852:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2621:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2633:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2720:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3435:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2895:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2645:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2525:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2548:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3064:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2667:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2481:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3089:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2671:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2822:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2630:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2579:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2955:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3104:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2756:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2688:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3035:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2687:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2795:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2862:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2617:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2704:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3518:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3063:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2469:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2726:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2640:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2854:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2871:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3364:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2698:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2964:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2677:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2705:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2788:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2770:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3113:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2946:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3016:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3089:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3112:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2763:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2756:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2685:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3060:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2735:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2575:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2461:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2793:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2820:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3326:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2675:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2659:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2992:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2983:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2299:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3656:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2539:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3110:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3044:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2909:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2684:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2802:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3363:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.1982:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2635:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.4445:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2623:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2637:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3018:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2913:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2823:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2712:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3692:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3692:   6%|▋         | 26/401 [00:17<02:51,  2.19it/s]training loss: 0.2860:   6%|▋         | 26/401 [00:17<02:51,  2.19it/s]training loss: 0.2624:   6%|▋         | 26/401 [00:17<02:51,  2.19it/s]training loss: 0.2845:   6%|▋         | 26/401 [00:17<02:51,  2.19it/s]training loss: 0.2892:   6%|▋         | 26/401 [00:17<02:51,  2.19it/s]training loss: 0.2590:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2707:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3080:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2967:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2930:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3357:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2806:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3094:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2836:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3356:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2106:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2504:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3415:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3736:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2617:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3080:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3083:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2515:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2779:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2537:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3074:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2830:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2762:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2576:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2282:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3248:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2636:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2628:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2749:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2656:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2904:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2414:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3003:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3105:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3045:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2846:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3154:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2512:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2233:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2590:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2651:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3553:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2482:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3529:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3597:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2287:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2661:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2696:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2813:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3083:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3250:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2894:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3469:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3127:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2653:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2644:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2608:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3052:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2942:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2521:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2618:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2834:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2768:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2401:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3458:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2949:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2483:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3072:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3222:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2400:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3072:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3093:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3041:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2613:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.5369:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.5369:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3176:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2531:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2663:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2764:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2853:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2731:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2687:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2586:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3058:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2441:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2581:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2785:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3544:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2945:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2892:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2820:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3012:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2926:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2954:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2533:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2525:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2875:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3367:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3558:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3174:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2899:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2871:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2568:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3293:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2193:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2964:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3124:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2422:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2947:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2584:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3235:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2966:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3019:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2892:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2757:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2649:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2643:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3194:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2781:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2809:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2655:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2241:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2540:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2928:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3346:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2638:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2540:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3017:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3324:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3096:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2969:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2763:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2985:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2790:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3007:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2658:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2790:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2779:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3172:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3427:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2702:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2724:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2369:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2565:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3269:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3562:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3314:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3109:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2910:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2749:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2981:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3201:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3405:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.1673:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.1673:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2706:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2352:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2751:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3119:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2601:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2510:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2315:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3374:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3293:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2775:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2450:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3094:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2623:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2868:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3411:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2625:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2463:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3396:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3025:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2908:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3393:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3009:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2511:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2565:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2997:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3077:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2879:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2432:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2804:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3004:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2881:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2779:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2684:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2262:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2772:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3370:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3220:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2905:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2633:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2322:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2533:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3316:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2481:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3084:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3012:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2946:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2090:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2666:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3029:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3132:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3144:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2534:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2976:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3101:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3343:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3213:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2930:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2968:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2808:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3083:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2829:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2445:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2907:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3186:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3117:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2850:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2794:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3092:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3119:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2616:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2808:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2618:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3029:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2619:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3247:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2681:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2857:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3184:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.1945:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.1945:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3023:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3138:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3280:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3415:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2596:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3426:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2793:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2919:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3686:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2762:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2778:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3266:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3200:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2716:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2672:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2979:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2913:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3192:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3248:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3148:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2826:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2307:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2531:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2301:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.1986:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2823:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2703:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3108:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3364:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3051:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3485:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2795:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2832:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2725:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2515:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2453:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2517:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3214:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3042:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2805:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3180:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2926:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2547:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2514:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2650:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2957:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2517:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2861:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2771:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3068:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2627:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2803:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2593:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3148:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3052:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2638:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2734:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3601:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2702:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3118:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3422:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2328:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2803:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3412:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2914:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2779:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2839:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3264:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2515:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2908:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2874:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3124:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2721:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2795:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2645:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2715:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2635:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2629:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3279:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3279:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2580:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2636:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2861:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2816:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3030:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2987:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3026:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3446:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2842:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2922:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3118:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2473:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2781:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3483:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2817:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2993:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3257:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2590:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2352:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3036:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2525:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2450:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3120:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3277:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2555:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2653:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2849:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2932:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3230:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2573:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2966:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2850:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2787:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3309:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3549:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2936:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3012:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2534:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2638:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2661:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3000:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2539:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2633:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3423:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3186:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2836:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2860:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2547:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2760:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3457:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2386:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3473:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3401:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3292:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3289:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2940:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2819:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3062:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3202:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2707:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3211:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2727:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3404:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2747:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3108:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2680:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2723:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2977:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2543:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2337:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2983:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2233:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2722:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2775:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2469:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2902:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3097:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2676:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.1875:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.1875:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.3457:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.2577:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.3240:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.2329:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.2806:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.3152:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.3022:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.2842:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.3033:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.2486:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.2874:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2246:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2864:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2854:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3270:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2640:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2280:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2729:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3612:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2972:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3423:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3337:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3011:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3032:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3393:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3074:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2469:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3576:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2740:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3284:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2932:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2806:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2735:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3339:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2626:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3004:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3178:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3141:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2835:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2974:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3031:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2572:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3421:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2436:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2626:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2776:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2953:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2977:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2554:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3437:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3345:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3097:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3754:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2881:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3106:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2788:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3050:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2516:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2917:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3380:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2525:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3209:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3182:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3068:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3024:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2967:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3156:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2594:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3250:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2769:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2620:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2801:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2574:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2964:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2866:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2679:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2568:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2551:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.1966:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.1966:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2826:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2556:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2785:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2274:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2492:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3417:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2570:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2857:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3345:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2268:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3164:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3090:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3009:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2789:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3081:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2909:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2893:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2257:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3340:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2841:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2767:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3082:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3391:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2928:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3207:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3117:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2866:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3359:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2797:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2980:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2847:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2349:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2855:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2390:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2812:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2718:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2345:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2963:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2801:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2810:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2621:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2811:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2880:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2797:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2793:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2274:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3086:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2633:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2334:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3190:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3111:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2987:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2802:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3160:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2834:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3097:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3285:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2923:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2779:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2674:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3378:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2298:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2559:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2188:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2823:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3480:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2581:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2472:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3005:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3171:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2965:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2729:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2718:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3000:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2894:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2796:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2698:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2497:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3111:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3111:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2778:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2881:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2588:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3302:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3180:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2645:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2983:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3039:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2894:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2790:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2910:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2859:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3312:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2193:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2760:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2615:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2964:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3738:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3025:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2877:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2840:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3128:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2498:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3341:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3231:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3087:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2262:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3130:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2936:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2734:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2616:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2525:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2869:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2937:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3322:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2543:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3001:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2782:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2833:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2581:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3055:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2579:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3010:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2835:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2465:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2530:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2791:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3127:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2945:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3045:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2290:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3077:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2954:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2468:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2897:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2944:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2581:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2369:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3305:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2404:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2574:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2895:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2757:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3648:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2679:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3435:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2447:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3614:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2684:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2517:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2710:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2900:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3020:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3494:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2365:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2251:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2760:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2384:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2010:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2010:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2929:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3187:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3249:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3066:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2924:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3123:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2333:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3490:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3219:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3302:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2604:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2768:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2914:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2860:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2850:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2394:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2648:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2876:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2993:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2528:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2894:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2367:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2893:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2854:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3154:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2828:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3343:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.1949:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3384:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2498:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3148:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3080:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2918:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2396:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2891:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3226:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2868:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2329:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3224:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2423:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2919:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2456:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2615:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2715:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2430:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3075:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2941:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2494:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2825:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2813:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2732:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3206:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2520:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3166:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2817:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3222:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2504:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3798:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3280:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3490:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3197:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3115:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2665:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2728:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2672:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2974:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2668:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2594:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2324:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3069:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2496:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.1867:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2290:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2971:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3404:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2721:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2742:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3487:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2527:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2527:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2731:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3008:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2634:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3216:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2483:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3144:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2351:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2511:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3202:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3441:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2597:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2541:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2453:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2193:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2473:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2714:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2856:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3276:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2621:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2772:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2981:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2970:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3124:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2903:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2928:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2938:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2857:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2410:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2881:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2927:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2907:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2883:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2313:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3259:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2762:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2473:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2461:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2485:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3002:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3069:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2746:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2658:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2693:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2920:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3147:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2607:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2910:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2140:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2853:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2403:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2626:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2926:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2541:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2372:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2972:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3379:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2582:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2580:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2706:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3292:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2736:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2692:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2897:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2184:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2737:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3054:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3547:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2872:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2784:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2478:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2789:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3313:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2155:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3027:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3095:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2610:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2835:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3088:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.0900:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.0900:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2633:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3208:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2697:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2827:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2882:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2168:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2929:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2495:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2924:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2853:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2808:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2508:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2423:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3030:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2529:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2463:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2804:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2991:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2875:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2935:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2674:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2628:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2463:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3157:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2853:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2648:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2522:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2281:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3041:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2506:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2479:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2905:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2859:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2627:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2819:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2795:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2961:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2791:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3276:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2646:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2951:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3386:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2944:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3000:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2310:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2941:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2845:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2899:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3063:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2724:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2936:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2976:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3102:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2251:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3076:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3321:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2746:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3473:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3267:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2531:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2328:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2653:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2710:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2239:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3130:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3306:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2938:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3291:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2661:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2477:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2535:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2935:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2725:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2807:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2837:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2537:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2653:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3053:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.1270:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.1270:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2673:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2600:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2530:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2951:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2406:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2579:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2965:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2551:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3187:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2826:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2969:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2776:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3005:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3012:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3143:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2907:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2637:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3000:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2713:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2445:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3061:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2601:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3056:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2864:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2704:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2530:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2317:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3050:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3070:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2824:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2064:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2623:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2474:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2628:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2521:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2479:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2473:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2792:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2319:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2547:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2478:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2794:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3048:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2442:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3083:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2273:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2856:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2535:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2746:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3272:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2611:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3290:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2458:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2733:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2773:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2202:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2936:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2705:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2826:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2957:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2863:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3194:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2432:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2207:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2762:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2959:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3445:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2578:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2665:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3082:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2652:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2915:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2571:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2857:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2374:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3440:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3261:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2735:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2721:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2721:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2734:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2371:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2898:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3010:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2556:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2872:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2799:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2755:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2706:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2727:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2356:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3015:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2731:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3074:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2351:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2312:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2806:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2363:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2987:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2722:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3142:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2848:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3061:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2211:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3119:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2982:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3036:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2841:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2489:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2700:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2998:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2639:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2188:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2596:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2482:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2723:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2323:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3246:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3020:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2374:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3014:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2368:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3016:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2361:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2975:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2816:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2814:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2357:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2478:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2846:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2882:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2233:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3232:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2506:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2594:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2425:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2731:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2920:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2683:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2605:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2978:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2737:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2755:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2936:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2617:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3444:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2577:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2508:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2967:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2738:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2933:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2759:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3340:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2962:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3232:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3451:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3340:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2567:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.1734:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.1734:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2640:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2933:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2961:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3037:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3498:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2797:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2809:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2587:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2863:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3003:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2804:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2793:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2589:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2775:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2551:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3032:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2875:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2440:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3197:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2893:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3038:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3067:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2734:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2484:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2709:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2961:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2229:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2592:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3125:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2849:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3537:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2925:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3583:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2619:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3736:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2778:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3318:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2964:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2831:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2802:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2845:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2967:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3192:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2279:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2472:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2776:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2614:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2518:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2394:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2987:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2842:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3058:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2690:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3260:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3261:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3272:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2795:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2707:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3150:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2802:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2859:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3125:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2805:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2872:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2854:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3020:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2393:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3405:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2440:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2227:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3038:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2572:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3065:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3020:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2491:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2608:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2699:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3135:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3323:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3323:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2734:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3106:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3410:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2720:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2774:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2848:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2815:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3182:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2694:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3312:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2833:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2518:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3242:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2242:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3116:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3276:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3052:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2764:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2811:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2328:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3139:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2567:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2992:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2594:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2587:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3144:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2438:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2811:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2528:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2603:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3136:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3026:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3048:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2638:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3069:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2776:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2469:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3949:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2971:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3131:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2780:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3300:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2780:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3010:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2758:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2882:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2622:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3012:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2816:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2275:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2640:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2843:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2391:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2635:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3526:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3038:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2878:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3308:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2795:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2536:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3066:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2569:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2977:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3084:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2825:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3199:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2671:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2713:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2889:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2639:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3049:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2689:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2469:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3523:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3172:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3566:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2322:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2868:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2027:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2027:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2452:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3025:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2916:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2912:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3005:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2691:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2646:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2451:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2484:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2529:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3546:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3047:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3213:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2725:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3380:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3301:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3221:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2570:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3091:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2526:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2691:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2559:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2661:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2723:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2794:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3057:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3409:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2511:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2858:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2719:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2671:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2821:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2725:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3274:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2350:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2688:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2434:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2902:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2712:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2843:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2604:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2803:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2910:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2237:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2817:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2777:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3242:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3304:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3057:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2432:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2250:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2905:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2335:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2514:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3447:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2789:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2335:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2746:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2722:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3097:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2844:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3314:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2802:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2283:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2823:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2534:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3584:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2613:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2739:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2280:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2736:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3248:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3096:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2728:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3218:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2725:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2887:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2766:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2540:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2540:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2399:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.3202:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.3147:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2466:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2575:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2424:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2916:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.3057:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2612:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.3290:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2786:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2953:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2370:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.3051:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2285:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2532:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2620:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2791:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2583:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2733:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3471:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2828:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2807:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2809:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2856:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2972:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2737:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2835:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3421:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3668:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2863:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2549:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2943:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2233:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3047:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2171:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2896:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2942:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3399:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2505:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2467:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3163:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3356:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3073:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2315:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2450:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2889:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3065:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2639:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2690:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3735:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2859:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3060:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2420:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2884:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2764:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2795:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3135:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2527:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2873:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3208:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2750:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2424:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3031:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3027:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3607:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2799:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3119:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2535:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2720:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2777:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2513:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3183:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2833:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2764:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2701:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3174:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2771:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3004:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3004:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2017:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2807:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2857:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2597:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3021:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3120:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3024:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2925:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2823:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2814:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2744:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2757:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3156:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2934:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2370:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2646:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3169:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3332:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2906:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2865:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3246:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2751:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2930:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2652:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2653:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3565:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2398:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3056:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2452:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3150:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2739:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2983:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2474:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3038:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3012:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2931:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2710:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3070:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2938:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3035:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3091:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2718:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3014:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2422:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3034:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2787:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2871:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3139:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2589:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2560:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2778:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2812:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2693:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2509:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3099:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3253:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2873:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2571:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3007:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2631:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2622:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2456:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2754:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2847:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3022:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3257:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3309:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2762:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2612:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2476:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2980:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2474:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2051:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3676:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2590:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2566:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2672:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2468:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3759:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3759:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2582:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2593:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3057:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2425:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3187:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2325:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3047:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2959:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2691:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2696:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3062:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2823:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3118:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3785:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3232:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2549:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2803:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3714:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2691:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2785:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3376:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2962:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2238:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2991:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3299:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2504:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2497:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2815:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2479:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2763:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2635:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3172:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2465:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2840:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2556:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2686:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3135:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2945:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2608:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2950:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2899:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2455:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2709:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3373:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3008:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2890:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2714:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2878:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3010:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2663:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2589:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2633:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2964:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3431:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2744:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2983:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2833:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2536:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2692:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2480:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2182:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3072:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2937:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2764:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2907:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3013:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2781:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2948:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3029:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2815:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3072:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2488:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2798:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2482:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2822:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2583:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2969:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3791:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.1954:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.1954:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3288:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3243:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3454:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2914:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3719:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2558:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2371:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3156:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2656:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3125:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2736:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2852:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2569:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3133:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3495:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2318:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2466:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2886:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3016:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3426:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2968:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2724:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3306:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3801:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2628:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2864:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2345:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3530:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2538:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3536:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2500:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2882:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3112:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2677:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3224:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2813:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2838:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2882:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2436:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2347:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2933:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2352:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3055:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2399:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2597:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2402:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2577:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2935:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2610:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2828:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2706:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2517:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3769:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3426:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2617:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2503:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2906:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3008:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2778:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2304:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2963:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3145:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2811:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2857:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2800:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3378:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2609:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2234:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3572:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2612:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2434:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2709:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2410:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2953:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2442:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2706:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3128:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3225:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.1517:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.1517:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2708:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2933:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2844:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2381:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2721:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2243:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3051:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2444:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2907:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2189:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2643:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3784:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2439:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2742:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2647:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3228:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2213:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2932:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2926:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3221:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2286:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2945:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3178:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3229:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3354:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3033:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2749:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2770:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3073:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3344:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2907:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3015:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3088:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2491:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2283:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2605:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2950:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2711:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3285:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2523:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3121:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2505:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3018:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2864:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3200:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3134:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3478:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2864:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3423:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2323:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2792:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2762:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2904:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2530:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2095:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3255:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2431:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2826:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2793:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2859:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3019:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2686:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3744:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2635:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2550:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2932:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2454:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2597:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2470:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3120:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2446:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2507:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2364:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3229:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2737:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2942:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2570:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2432:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2295:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2295:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3328:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3460:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3272:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2759:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2587:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3048:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2606:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3079:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3348:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3997:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3132:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3055:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2527:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2385:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3311:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3349:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2683:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3507:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2843:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2795:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3065:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3086:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2699:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2929:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2772:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3097:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2446:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2150:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2686:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2900:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3310:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2696:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2928:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2503:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2626:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3082:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2858:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3134:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2226:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3661:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2813:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2676:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2746:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2529:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2866:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3121:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3028:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2792:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2923:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2693:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2945:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3005:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2837:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3139:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2138:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2928:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2950:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3091:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2748:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2815:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2404:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2965:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3076:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2321:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2895:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2410:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2857:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2781:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3296:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3124:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2902:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2707:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3124:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3426:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2261:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2705:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2834:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2699:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3166:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3166:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3167:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2729:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3052:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2736:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3374:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3602:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2976:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3060:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2479:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2725:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2378:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2841:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2950:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2827:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3204:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2574:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2355:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2445:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2843:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2332:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3279:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3001:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2516:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3077:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3011:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3220:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2599:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3532:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2884:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.1982:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2843:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3097:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2457:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3427:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3267:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2948:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3488:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2838:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2809:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3038:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2778:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2449:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2919:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2841:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3077:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2878:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2964:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2861:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2166:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2498:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2688:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3110:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2910:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2394:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2979:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3254:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2832:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3177:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2418:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2377:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2527:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2719:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2912:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.3394:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2885:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.3005:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.3023:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2793:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2932:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2953:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.3055:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2805:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2950:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2970:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2445:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2808:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2888:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2852:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.3417:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.3417:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3453:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2499:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2803:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2867:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3063:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2610:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3103:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2790:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2847:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2410:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3343:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2482:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3161:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2797:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2786:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3533:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2694:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3106:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2650:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3043:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2854:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2767:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3220:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3067:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2786:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3704:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3213:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2702:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3614:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2595:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2707:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2981:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2703:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2407:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3311:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2692:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2318:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2618:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3217:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2667:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2364:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2766:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3446:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2406:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2824:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3019:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3397:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2663:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2993:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2287:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2544:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2589:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2733:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2669:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2770:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2928:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3214:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2254:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2588:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3407:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2825:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3047:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2743:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3331:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2813:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2743:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3162:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2993:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3172:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2949:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3079:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3286:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3844:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2509:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2556:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3177:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3258:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2786:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2906:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2906:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2444:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3049:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2893:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2589:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2585:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2525:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3354:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2940:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2824:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2308:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2906:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2729:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2977:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3030:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2855:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2983:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3001:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2323:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2811:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2538:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2423:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2919:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3305:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2919:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2575:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2705:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3091:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3155:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2741:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3029:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2801:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3036:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2839:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2839:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2626:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2602:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2734:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2647:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2809:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3343:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2410:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2683:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3256:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3563:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2862:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3410:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2689:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2788:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2260:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2757:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2808:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3290:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2579:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2861:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2811:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3088:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2572:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3081:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2872:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3063:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2535:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2819:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2352:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2047:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2471:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2590:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2908:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2850:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2733:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2256:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2749:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2470:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3373:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3121:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2960:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2678:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2511:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3048:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2688:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2688:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2364:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2719:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3188:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2969:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2467:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2707:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2504:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3120:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3166:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2806:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2575:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2609:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2555:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2444:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2975:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2676:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3214:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2766:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2876:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2787:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2565:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2356:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2897:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3023:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3022:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2929:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2843:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2825:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2730:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2274:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2505:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2894:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2787:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2623:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2439:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2585:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2757:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2187:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2453:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2585:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2839:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2980:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2292:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2894:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2932:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2560:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3163:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2547:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2309:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3115:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2964:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2941:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2799:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2834:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2470:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2758:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3019:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3028:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3134:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2908:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3259:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3173:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2856:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3217:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3051:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2942:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3178:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3637:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2958:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2775:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2726:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2807:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2494:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2442:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2732:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2836:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2778:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3111:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.1885:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.1885:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3113:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2692:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2799:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3347:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2766:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3275:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3288:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2427:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2373:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2819:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2951:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2729:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2867:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2083:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2244:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2267:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3323:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3010:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2669:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2786:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2925:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2730:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2751:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2819:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2781:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3306:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2472:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2254:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3251:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3113:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3247:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2422:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2631:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2287:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2762:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2552:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2981:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2888:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3020:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3058:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2272:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2324:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2526:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3197:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2564:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3187:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3350:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2815:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2880:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2922:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2637:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2337:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2692:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3027:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3220:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3125:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2935:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2635:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2551:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2622:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2713:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3117:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2667:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3235:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3079:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3551:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2805:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3130:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3085:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2832:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3280:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2705:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2460:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2816:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3299:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2617:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2572:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2939:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3195:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3195:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2466:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2595:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2497:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3462:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2689:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2614:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3007:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2838:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2907:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2823:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2317:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3472:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2925:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2587:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2608:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2993:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2938:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2855:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2887:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3554:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2538:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2565:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2722:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2735:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2866:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3011:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2736:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3103:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3223:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3391:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2697:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2509:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2983:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2792:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3304:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2323:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3160:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2464:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3366:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2931:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2933:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2676:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2878:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3165:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2504:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2445:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2677:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2608:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3436:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2371:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2494:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2382:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2889:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2941:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2964:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2805:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3117:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3198:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3282:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3344:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3354:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2909:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2535:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2525:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2714:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2363:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3122:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2656:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2965:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3364:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3014:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3065:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3198:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3222:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2453:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2476:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3219:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2471:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.1854:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.1854:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2488:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2610:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2942:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2822:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3062:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2601:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2523:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2544:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2316:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2686:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2730:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2321:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2296:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2758:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2413:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2357:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3070:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2454:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2401:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2707:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2967:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2174:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2660:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3626:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2536:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2748:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2814:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2601:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3170:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2756:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3561:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2897:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3039:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2497:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2572:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2196:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2769:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2278:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3535:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2738:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3158:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3218:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2825:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3204:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2866:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2839:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2304:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2887:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3401:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2493:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2427:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2573:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3120:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2993:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3152:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3293:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2772:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2285:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3570:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2876:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3294:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2799:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3034:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3028:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3225:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2758:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2605:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3128:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2457:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2967:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2228:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3208:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2809:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2539:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2820:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2500:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2669:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2450:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3506:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3506:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3018:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3127:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2442:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3463:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3120:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2630:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2519:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3113:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3655:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2342:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3076:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2840:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3666:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2497:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.4190:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2530:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2761:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2498:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2731:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3765:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3342:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3341:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2690:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2146:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2694:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2439:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2615:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2643:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2607:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2414:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2667:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3021:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3063:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2968:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3222:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2956:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3184:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2966:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3098:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3171:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3002:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3296:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2410:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2614:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2431:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3157:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3005:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3001:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2768:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2596:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3310:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2937:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2427:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3130:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2543:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2462:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2477:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3477:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2565:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2651:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2550:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3347:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2613:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2366:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2827:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3588:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2566:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2802:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2788:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2395:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3133:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2844:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2958:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2697:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2588:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2660:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3413:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2581:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3425:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3425:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3100:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2895:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2642:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3116:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3123:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2854:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3540:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2690:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3191:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2898:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2653:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2752:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2808:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2936:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3116:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2544:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2804:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2253:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2678:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3260:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2658:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2865:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2982:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2841:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2690:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2539:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2195:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2821:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3155:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2906:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2632:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2484:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2808:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2770:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3194:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2701:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2578:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3043:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2847:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2829:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2963:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3253:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2975:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3033:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2558:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2537:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3106:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3034:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2462:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2383:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2277:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2955:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2017:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2939:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2873:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2912:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3925:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2817:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2549:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2789:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2630:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.3203:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.3333:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2715:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2395:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2669:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2684:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2544:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2769:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.3084:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2758:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2657:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2814:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2206:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2653:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2610:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2635:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2948:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2918:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2918:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3342:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2950:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2780:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2535:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2557:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2266:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3177:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3152:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3274:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3070:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2963:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2815:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3137:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2785:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2371:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2487:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3027:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2728:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3151:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2533:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2640:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2337:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2802:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2116:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2872:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2862:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2931:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3586:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2295:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3035:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2539:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3815:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2492:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2806:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2431:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3023:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2230:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3244:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3188:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3333:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2885:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2923:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2571:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2544:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2375:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3221:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2907:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2564:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2617:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3069:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2634:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2752:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2946:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3063:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2273:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2935:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3111:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2499:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2748:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2849:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2871:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2961:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2259:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2343:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2920:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3414:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3135:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2927:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3519:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2830:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2679:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2822:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3641:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3110:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2483:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3369:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3375:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2443:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3644:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3644:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2938:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3112:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2806:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2896:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3534:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2532:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2856:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3202:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2835:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3088:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2990:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2494:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3118:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2617:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2495:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2370:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2413:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2411:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3458:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2433:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2701:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2949:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2152:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2308:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2351:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2562:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3567:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2836:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2521:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3119:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3268:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2575:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2268:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2707:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3125:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2981:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2771:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2489:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2595:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2458:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2899:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2762:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2223:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2315:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3422:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2674:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2758:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3359:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2144:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3449:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2228:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2764:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2915:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3625:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3423:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2771:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2564:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3134:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2210:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2890:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3124:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2998:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2467:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2749:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2823:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2870:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2455:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2938:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3144:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2616:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2580:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2984:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3115:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3120:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2256:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2873:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2914:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3109:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3143:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3143:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2417:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2121:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2623:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3020:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3363:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3293:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3011:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2689:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3025:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3092:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3314:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3317:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3339:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3600:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2734:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2859:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2754:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2396:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2905:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2971:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3118:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2837:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2317:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2774:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2394:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3112:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2650:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2806:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3074:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2945:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3282:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2700:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3403:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2521:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2234:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3209:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2647:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2552:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2865:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2404:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2531:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.1956:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2910:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2583:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2748:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3126:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2518:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2512:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2317:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3338:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2490:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2769:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2923:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2717:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3052:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2513:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2962:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2842:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2460:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2853:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2550:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3088:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2772:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3484:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.3081:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2410:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2689:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.3076:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.3292:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.3108:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.3374:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2694:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.3240:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2497:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2912:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2929:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2956:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2381:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2759:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2759:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3565:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3025:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3016:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3263:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2467:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2798:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2062:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2827:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2508:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2600:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2725:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2844:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2798:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2280:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2529:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2878:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2783:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3128:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2656:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2313:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2791:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2562:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3035:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2768:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2912:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3223:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2822:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2559:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2578:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2548:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2999:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2802:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2660:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2166:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2493:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2777:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3147:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2760:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2736:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2895:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2217:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2769:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3188:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2360:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3070:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2671:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2870:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2792:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3063:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2539:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2127:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2477:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2926:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2845:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2726:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3225:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2793:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2230:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2665:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3020:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2882:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3104:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2586:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2644:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2843:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2675:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2654:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3038:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3029:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3179:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3173:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2864:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2342:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2286:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2773:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2975:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2783:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2429:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2413:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2413:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2991:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2875:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2661:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3733:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2674:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2426:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2616:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2755:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3335:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2493:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2634:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2688:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2721:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2831:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2734:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2939:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2863:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2994:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2350:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3046:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2581:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2791:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3128:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2777:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2768:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2857:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3410:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2376:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2967:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2884:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2861:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2793:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2514:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2770:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3016:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3168:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3069:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2827:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2379:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3145:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2492:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2756:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3088:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2501:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2735:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2848:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2825:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3281:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3360:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3067:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2857:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3174:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2745:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2778:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2936:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2925:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3492:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2699:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3167:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2283:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2929:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2657:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3552:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3178:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2845:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3268:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2962:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2571:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3158:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2788:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3214:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2877:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3170:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3028:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2428:  15%|█▌        | 61/401 [00:39<05:54,  1.04s/it]training loss: 0.2530:  15%|█▌        | 61/401 [00:39<05:54,  1.04s/it]training loss: 0.2525:  15%|█▌        | 61/401 [00:39<05:54,  1.04s/it]training loss: 0.2762:  15%|█▌        | 61/401 [00:39<05:54,  1.04s/it]training loss: 0.2437:  15%|█▌        | 61/401 [00:39<05:54,  1.04s/it]training loss: 0.2437:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2219:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3288:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2399:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2793:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2581:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3102:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2688:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3095:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2928:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3152:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2342:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2622:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2917:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3013:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2174:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3017:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2977:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2832:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3630:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2594:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2812:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2605:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3868:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2807:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3227:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2618:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2196:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3025:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2861:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2773:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2838:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3265:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2857:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3136:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3029:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2379:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2829:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3220:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2984:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3037:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3178:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2428:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3016:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3137:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3066:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2845:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2505:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2387:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2819:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3054:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3170:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2783:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2463:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2716:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2508:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3190:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2231:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2849:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2562:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2786:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3517:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2872:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3100:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2755:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2681:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3008:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2911:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3490:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2709:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3403:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2671:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2843:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2803:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2528:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2868:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2705:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3154:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3351:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.4136:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.4136:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3026:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3220:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2550:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2511:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2582:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2784:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3197:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2517:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2827:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2663:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2566:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2990:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2940:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2673:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.1975:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2710:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2434:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2880:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3000:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2688:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2536:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2897:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3173:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2653:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2481:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2560:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2840:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2536:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2940:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2825:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3125:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2909:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3041:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3171:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2834:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2255:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2371:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2640:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3116:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2736:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2199:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2710:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2695:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2851:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2577:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2435:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2450:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2727:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3060:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2854:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2790:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2686:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3128:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3084:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2394:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2582:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2478:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2495:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3089:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2580:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2639:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2792:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3043:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2885:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3043:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3529:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3225:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2316:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2714:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2978:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2926:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3048:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2914:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2857:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3164:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2597:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2787:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2752:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3794:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3794:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2678:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2874:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3038:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2679:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2301:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3009:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2688:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2950:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3031:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2851:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3012:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2550:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3110:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3127:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2812:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3022:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2841:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2697:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3227:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2716:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2842:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2748:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3272:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2436:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2706:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2369:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2745:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3035:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3047:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3044:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2931:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2988:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2817:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3389:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3673:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2770:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2856:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2786:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2371:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2714:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2748:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2583:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3687:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3193:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3187:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2336:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3336:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2523:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2587:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2833:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2837:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2986:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3458:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2530:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2275:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2516:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2980:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2746:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2737:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3287:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3469:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2513:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2899:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2908:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2934:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2939:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3000:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2633:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2710:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3249:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2625:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2908:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3119:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2146:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2592:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2848:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2186:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3119:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2727:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2727:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.2743:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.3034:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.2609:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.3211:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.2942:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.3227:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.2674:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.2846:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.2836:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.3591:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.2575:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3217:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2593:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2116:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2799:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2456:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2931:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2486:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2864:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2774:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2627:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2884:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2909:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3169:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2870:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3545:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2838:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2727:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2918:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2360:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2242:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2718:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2628:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3427:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2872:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3276:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2421:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2915:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2889:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3415:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2927:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2186:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2318:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2306:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2706:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2512:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3171:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3313:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2798:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2440:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2547:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2615:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2607:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2383:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2685:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2634:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3368:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2261:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2790:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2488:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2616:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3226:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2699:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3228:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2604:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2929:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2796:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2781:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2626:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2316:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2080:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2765:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3518:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2251:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2982:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2758:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3076:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2686:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3337:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3337:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2492:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3001:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2975:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2869:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2865:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2933:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3466:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3047:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3387:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2873:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2631:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2222:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3095:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3367:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2925:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3414:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3150:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2655:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2877:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2153:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3663:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3255:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3214:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2386:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2526:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3182:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2617:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3113:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2666:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2604:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2250:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3579:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3211:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2753:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2716:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3466:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2506:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2712:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3596:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2861:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3322:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2611:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2988:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2882:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3252:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2141:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3451:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2290:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3007:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3096:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2378:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2614:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2366:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2928:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2610:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3086:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2432:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2765:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3106:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2694:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2678:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2957:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3783:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2837:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2555:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2450:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2302:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2367:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3258:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2818:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2859:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2868:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3684:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2664:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2607:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3020:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2931:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2747:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3731:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3731:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3204:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2574:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3271:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3045:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3054:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3515:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2374:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2738:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2242:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2620:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2886:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3255:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2459:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2609:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2426:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3170:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2686:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3127:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2635:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2839:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3170:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2580:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2920:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2425:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2489:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2975:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2171:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2776:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2990:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2605:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2622:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2094:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2948:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2714:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2550:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3594:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2843:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2954:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2941:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2211:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2752:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2790:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2680:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2870:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2908:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2882:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2779:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2862:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2510:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2899:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2263:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2987:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3410:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2787:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2956:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2474:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3081:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3031:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2324:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2553:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2454:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2989:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3033:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2484:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2449:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2491:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2610:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3064:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2605:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2577:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3230:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3170:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2868:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2734:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2690:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2468:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2837:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2928:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.6044:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.6044:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2995:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2568:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2891:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2819:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2765:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2768:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2782:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2204:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.3029:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.3481:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2903:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.3208:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.3075:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2409:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2956:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2655:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.3261:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2586:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2565:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2780:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2548:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2732:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2896:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2897:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2438:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2738:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2812:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2525:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2414:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2343:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2978:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3027:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3084:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2222:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2754:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3614:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2427:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3299:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2987:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3163:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2530:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3695:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2644:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2759:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2782:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3057:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2444:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2846:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3127:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2781:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2547:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2869:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2298:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2800:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2764:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2832:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2888:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2736:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2505:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2732:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2810:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3205:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3000:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2916:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2294:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2877:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2764:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2666:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3003:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2402:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3029:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2629:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3441:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2659:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2682:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3255:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2902:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2683:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.1955:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.1955:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2276:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2784:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3445:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2789:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2752:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2471:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2694:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2225:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3202:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2048:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3020:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2810:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2589:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3001:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3065:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3030:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2528:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2766:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2393:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2367:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2939:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2475:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2539:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2832:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3138:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2534:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3112:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3138:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3147:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3188:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2877:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3657:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3172:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2388:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3373:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2353:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2317:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2338:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2481:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2504:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2310:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2844:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3101:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2768:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2788:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2247:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2410:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2078:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2929:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2879:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2679:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2157:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3192:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2715:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3158:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3029:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3112:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2297:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2822:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2982:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2602:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3233:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2949:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2230:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2620:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3069:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2550:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2535:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2813:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2851:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3369:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2799:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2705:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2724:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2908:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2471:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3208:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2305:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.1962:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.1962:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3158:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2778:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2427:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3701:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3348:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2615:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3002:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3212:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3022:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3009:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3140:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2226:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2713:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3245:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2904:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3016:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3471:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2798:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3130:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2452:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2583:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2154:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3009:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2529:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2629:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2738:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3052:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3459:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3625:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3029:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3025:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2766:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3102:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2420:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2613:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2660:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2709:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2962:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2707:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2344:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2577:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2635:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2878:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.1998:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2831:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3152:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2737:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2999:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2699:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2978:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2761:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2485:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3132:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3534:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2649:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3046:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2540:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2705:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2669:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3286:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2600:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2934:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2579:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3077:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3345:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2853:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2849:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2790:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3155:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2695:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3382:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2965:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2933:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2248:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2378:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2607:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2518:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3042:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2665:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2665:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2816:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2925:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2886:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3246:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2730:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2798:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3727:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2797:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2876:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2698:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3543:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2520:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2968:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2870:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3073:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2493:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2825:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2164:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2704:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2717:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2569:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2525:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2769:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2954:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2695:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2769:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2717:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2151:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2667:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3253:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2731:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2732:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2712:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2884:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2658:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3454:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2762:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2677:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3121:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2917:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2405:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3674:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3447:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3306:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2998:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3102:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2858:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2517:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2723:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2438:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2848:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2950:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2474:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2642:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3163:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2521:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2285:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2671:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2920:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2128:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3254:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2793:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2440:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2905:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2892:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2950:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3202:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2636:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2623:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3027:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2556:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2164:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2813:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2342:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2412:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2597:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2445:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2218:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2100:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2100:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2880:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2700:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2531:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2904:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3132:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3073:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2713:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3564:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3394:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2169:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2470:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2914:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2903:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2802:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2549:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3225:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2960:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2905:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2718:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2969:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2656:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3407:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2376:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2886:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2556:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2405:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3064:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3419:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2336:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2875:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2840:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2289:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3015:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2581:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3139:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3282:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2729:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2783:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2675:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2693:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2480:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3244:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3132:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2584:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2497:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2918:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3572:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3484:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3061:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2547:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2852:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2496:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3011:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3086:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3277:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2867:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2816:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2587:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2648:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3153:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2725:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2653:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2674:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2727:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3079:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3072:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2871:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3713:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2535:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2338:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2687:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2697:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2508:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2662:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2531:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2657:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2746:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2629:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2411:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2411:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2971:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2481:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2937:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2370:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2515:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2538:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2852:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2842:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2040:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3108:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2848:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2774:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2889:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2464:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3308:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2901:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3739:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2573:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2908:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2755:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2639:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3347:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2663:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3197:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2822:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2987:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2586:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2261:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2779:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2587:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2569:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2788:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3206:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2977:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3344:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2602:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2981:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2755:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3224:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2649:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2819:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3180:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3016:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2845:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2501:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2766:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3075:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3026:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3160:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2701:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3371:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2721:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2568:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2483:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3009:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2889:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3123:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2627:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2648:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3220:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2528:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2491:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2754:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.3715:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2945:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2662:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2325:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2629:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2890:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.3384:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.3191:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2672:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2923:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2606:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2639:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2309:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.3205:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.3213:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.3678:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.3678:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3438:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2593:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3094:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3010:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3062:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2300:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2746:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2593:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2879:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2470:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3025:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3328:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.1934:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2531:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2515:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2828:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2555:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2830:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2529:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2911:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2592:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3061:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2563:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2757:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2897:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3069:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3012:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3320:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3128:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2804:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3025:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2383:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2702:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2695:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2391:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2863:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2339:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2830:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2712:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3379:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3347:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2566:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2462:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3273:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2687:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3269:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2614:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2653:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3399:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2661:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3179:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3165:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2743:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2937:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3234:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2882:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3320:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2672:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2815:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2887:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2718:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2606:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3052:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2388:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2737:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2887:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2406:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2861:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2523:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3085:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2915:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2859:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3072:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3455:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2727:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2350:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3208:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2391:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2395:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2395:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2649:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2856:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2779:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2531:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3138:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2362:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2970:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2867:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2461:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3450:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2856:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2789:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2918:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2441:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2390:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2696:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2670:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2564:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3519:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3140:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2605:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3123:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2613:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2539:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2855:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3113:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3452:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2728:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2913:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2866:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3148:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2527:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2791:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2680:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2641:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2710:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3661:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2759:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2864:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2536:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3339:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3226:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2369:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2787:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2915:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3164:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3070:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3208:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2864:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2699:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2694:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2667:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2858:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2771:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2782:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3127:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2558:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2688:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2842:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3160:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3124:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2804:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2603:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2781:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2669:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2917:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2655:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2695:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2396:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2173:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2618:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2193:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.1998:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2749:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2602:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3162:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2742:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2671:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3383:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3383:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3037:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2181:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2984:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2938:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3083:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3064:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2636:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2966:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2851:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2456:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3389:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2992:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2896:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2355:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2949:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3329:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3003:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2167:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2960:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2541:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3127:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3131:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3077:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2722:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2419:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2462:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3201:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2864:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3087:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3113:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2889:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2529:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2519:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2614:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2520:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2675:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3097:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2773:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2109:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2727:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2402:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3109:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2910:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3250:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3013:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3058:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2428:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3350:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2943:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2712:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2610:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3202:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2736:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3478:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3014:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2528:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2768:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.3098:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2513:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2711:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2790:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2913:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2752:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2325:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2504:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2514:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2406:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2474:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2518:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2449:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.3021:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2630:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.3255:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.3037:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2818:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2788:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2675:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.3150:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.3285:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.3285:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2922:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2974:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3173:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2927:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2065:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2007:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2567:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2208:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2819:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2779:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2678:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3144:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3177:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2947:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2238:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2329:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3034:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2985:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2889:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3267:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2415:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3371:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2800:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2923:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2671:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2869:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2567:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2937:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2659:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3098:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2931:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3528:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3034:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3337:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2379:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2360:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2681:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2973:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2848:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2896:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2866:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2175:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2960:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2525:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2380:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2549:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2599:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2726:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3079:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2434:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3647:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2457:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3740:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2961:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3382:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2505:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3194:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2890:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2396:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2653:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2285:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3316:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2936:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3247:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3270:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2441:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2426:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2862:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3257:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2790:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2320:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2573:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2557:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2972:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2902:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3172:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2674:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2692:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3934:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3934:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2739:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2907:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2751:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2922:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2189:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3418:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2337:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2762:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2672:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2900:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2988:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2925:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2835:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2527:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2884:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3273:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2460:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3038:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2506:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2916:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3083:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3413:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3240:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2806:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3123:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3143:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2795:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3147:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2774:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2153:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2781:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2988:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3440:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2627:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2825:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2414:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3174:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3036:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2478:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2960:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2899:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3087:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3395:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2842:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2809:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3054:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2930:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2358:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.1910:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3264:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3224:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2637:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2788:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3095:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3424:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2848:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3007:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2805:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2620:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2670:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2622:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3253:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2573:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3086:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3629:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2332:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2756:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3323:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3043:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2144:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2970:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2847:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2877:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2717:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2967:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2589:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2414:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2955:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2844:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2844:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2891:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2751:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.3124:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.3384:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2653:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2930:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2872:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2445:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2940:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2672:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.3487:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2622:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2626:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2765:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.3884:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2795:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2440:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2831:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2488:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2551:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2680:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2258:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3175:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2956:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3339:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2586:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2562:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3029:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3006:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3252:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2882:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3199:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2444:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2684:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2806:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2476:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2580:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2082:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2753:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3492:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2699:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3034:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2453:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3054:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2755:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2497:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2755:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2914:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2631:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3196:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2811:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2632:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2190:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2773:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3144:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3237:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2880:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2057:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2959:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2833:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3053:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3127:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3066:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2894:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3180:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2860:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2155:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3455:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2697:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3675:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2738:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2551:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3941:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2455:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2711:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3413:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2592:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2470:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.5860:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.5860:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2951:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3085:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2115:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2465:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2604:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2546:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3607:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2077:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3409:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3108:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2432:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2617:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3139:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2778:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2918:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2329:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2589:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3295:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3035:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2606:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2479:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3045:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2352:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2355:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2916:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2801:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2736:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2880:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3074:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2964:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3311:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2864:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2371:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2791:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3018:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3070:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2750:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2834:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2524:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3179:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2707:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2798:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3035:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2816:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3154:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2665:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2678:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2654:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2745:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3310:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2940:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2929:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3246:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2987:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3004:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2480:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3233:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2374:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3084:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2665:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3115:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2823:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2418:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2746:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3347:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2733:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2835:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2691:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2815:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2831:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2666:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2292:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2804:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2487:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2808:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2924:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2608:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3024:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.6963:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.6963:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2794:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2958:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2826:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2767:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2285:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2550:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2694:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3044:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2555:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2544:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3140:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2999:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2765:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2111:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2752:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2938:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2728:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2501:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2381:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2960:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3136:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2375:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2514:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2890:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2795:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2813:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2051:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2570:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2252:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2548:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2693:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2654:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2694:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2840:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3042:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2430:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2493:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2651:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3244:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2780:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2851:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2889:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3002:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3221:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2965:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2767:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3634:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3500:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3077:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2993:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2892:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3012:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2664:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2576:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2807:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2942:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2306:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2444:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2038:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3276:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2591:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3308:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2617:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3210:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2666:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2514:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3459:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3078:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2548:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2831:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2796:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2925:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3216:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2787:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2430:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2680:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2242:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2943:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.1554:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.1554:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2394:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2195:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2414:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3319:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3268:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2920:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2813:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2984:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3433:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2406:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2866:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2958:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2646:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2750:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2536:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3275:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2098:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2502:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2157:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2684:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2800:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2362:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3213:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2595:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3075:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2720:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2793:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3563:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2884:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2031:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2768:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3305:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.1962:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2494:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3219:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2726:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2626:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2986:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2476:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2633:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2175:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2751:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2782:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2786:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2707:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2061:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2395:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2660:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2659:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3105:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2877:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3228:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3373:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3302:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2789:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2536:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2264:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2934:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3511:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2503:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2812:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2324:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2845:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3078:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2569:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2556:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2951:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2989:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2658:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3471:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2748:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3074:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2732:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3030:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2321:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3053:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3248:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3012:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2281:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2281:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2956:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2737:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2848:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.3103:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.3656:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2438:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2937:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.3234:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2707:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2951:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2443:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2778:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2819:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.3009:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2544:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2629:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2545:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2996:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2974:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2792:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2830:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2811:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2419:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2874:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.3155:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2951:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2641:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2945:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2892:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2250:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.3509:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2842:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.3279:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2253:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2442:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2249:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.3218:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2575:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.3006:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.3282:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2533:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2497:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2076:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2616:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2694:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2599:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2572:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2957:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2555:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2480:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.3045:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2545:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2600:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.3373:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.3214:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2643:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2503:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2645:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.3155:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2571:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2325:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2828:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2340:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2773:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2987:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2678:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2928:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2547:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2937:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2985:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2519:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2760:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2710:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2717:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2737:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2872:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2344:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2816:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.1488:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.1488:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3259:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2302:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2361:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2624:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2522:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2508:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2323:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2692:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2711:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2457:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2668:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2734:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3511:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3330:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2769:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2520:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2741:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2839:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2417:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2500:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3049:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2768:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2685:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2565:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2690:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2741:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2816:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3006:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2833:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2982:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2662:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2579:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2866:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2153:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2524:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3442:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2248:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2627:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2611:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2399:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3287:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2305:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2708:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3235:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2610:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2481:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3381:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2312:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3062:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2791:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2823:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2642:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2671:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3042:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2688:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3016:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2226:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2898:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2952:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2988:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2570:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2602:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2604:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2722:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3125:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2968:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2973:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3023:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2739:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3182:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2715:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2064:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2211:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2652:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2944:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2886:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3172:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2629:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.1981:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.1981:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2751:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2964:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2672:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2698:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2516:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3416:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2873:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2624:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2698:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2507:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3011:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2318:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2460:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2883:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2943:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2708:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3140:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2952:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2824:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3105:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2614:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3081:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2823:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2348:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3403:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3155:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3299:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3138:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2566:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2426:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2843:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3176:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2809:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3616:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2869:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3013:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3052:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2617:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2524:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2491:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2838:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2500:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3007:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2522:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2801:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2658:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3259:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2841:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2773:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2874:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2670:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2522:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2784:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2895:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2339:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2551:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2556:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2420:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3403:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2980:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3073:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3012:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2723:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2992:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3190:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2577:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2589:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3312:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3044:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3164:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2568:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2904:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2536:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2922:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2399:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2637:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2675:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3169:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.4063:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.4063:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2864:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2441:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2618:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2931:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3190:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3044:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2231:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2474:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3036:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2179:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2590:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3371:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2704:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3020:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3404:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3025:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3048:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2269:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3153:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3471:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2919:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2627:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2028:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2149:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2563:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2785:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3029:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2499:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3344:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3117:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2854:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2407:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2911:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2834:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3157:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2551:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3082:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2956:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2508:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2759:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2411:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2520:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2301:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2890:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2198:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2824:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2708:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2886:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2561:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2641:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2836:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2850:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2896:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2835:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2457:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.3012:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2597:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2916:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2494:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2752:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.3278:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2612:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2567:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2720:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2063:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2779:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2128:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2730:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2870:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2960:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.3521:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2798:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2686:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.3311:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2512:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.3083:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2581:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2355:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2971:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2971:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2706:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2867:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2855:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2540:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2733:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2460:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2912:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2932:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2866:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2761:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2550:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2774:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3096:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2699:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2896:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2502:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2077:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2026:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2433:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2738:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2086:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3040:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.1962:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3354:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2234:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2821:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2689:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2661:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2770:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2888:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2933:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2924:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2456:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2576:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3029:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2999:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3043:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3272:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2672:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2750:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3415:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2986:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3391:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3014:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2661:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2453:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2645:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2620:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3229:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2585:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2947:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2596:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2445:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2561:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3035:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2640:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2761:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2988:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2801:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2874:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2576:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2740:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2251:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2376:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2939:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2823:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2682:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2446:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2719:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2501:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2438:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2430:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2754:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2482:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2587:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2356:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2428:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2784:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.4874:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.4874:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2110:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2849:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2434:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3328:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2224:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2365:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2943:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2467:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2517:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2930:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3026:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2778:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2811:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2782:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2923:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3322:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3206:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2623:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3173:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2849:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2539:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2637:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2680:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2607:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2769:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2115:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2838:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2454:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2684:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2854:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3225:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3415:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2984:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2401:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3124:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3515:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2594:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2967:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2268:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2763:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3281:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2504:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3016:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2796:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3502:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2944:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3006:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2557:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2919:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2985:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2744:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3002:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2472:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2856:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2497:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2832:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2825:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2549:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2689:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2789:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3194:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2467:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2533:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3248:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3118:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2588:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2849:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2783:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2857:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3050:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.1920:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2559:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2850:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2416:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3299:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3514:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2833:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3276:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.1644:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.1644:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2761:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2862:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2806:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2422:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2853:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2775:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.3038:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2950:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.3505:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2503:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2267:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2715:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2879:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2445:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.3665:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2927:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2158:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2590:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.3663:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2791:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2582:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.3016:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.3069:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.3308:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2390:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2790:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2388:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.1771:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2387:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.3164:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2844:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2400:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2785:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3323:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2544:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3436:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3068:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3042:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2456:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2102:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2335:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2902:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2508:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2673:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2897:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3294:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2605:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2716:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2673:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3330:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3140:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2880:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2611:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3268:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2655:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2762:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3338:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2591:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3317:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2918:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3197:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2858:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3650:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3197:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2863:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2765:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2943:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2816:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3302:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3029:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2845:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2883:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3511:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2860:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3157:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2901:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2592:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3111:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2811:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2811:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2565:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2398:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2423:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2028:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2932:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3396:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3145:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3038:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2995:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3528:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3225:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3348:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2958:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3333:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3294:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2413:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2836:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2842:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3260:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2728:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2743:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3035:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3309:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2885:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2692:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3356:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2002:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2387:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2725:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2589:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2941:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2396:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2426:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3164:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2525:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2592:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2938:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2931:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2239:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2847:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2399:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2062:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2061:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2994:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2934:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2671:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2602:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3017:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2736:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2434:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2868:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2631:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2633:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2559:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2480:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2330:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3306:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3082:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2846:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2743:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2791:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2576:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2986:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3266:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2700:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2545:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2704:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3140:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2665:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2711:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2868:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3152:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2739:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2888:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2588:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2796:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2512:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3248:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.1959:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.1959:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2686:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2698:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2588:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2430:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3020:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3142:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2863:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2236:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3319:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2621:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3115:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3088:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3193:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2231:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2764:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3217:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2387:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2748:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2299:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2798:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2589:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2800:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2520:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2690:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2581:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2924:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3451:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2628:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2868:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2985:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2300:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.1841:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2699:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2877:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2817:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2756:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2471:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2900:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2815:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2754:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2758:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2575:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2588:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2823:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2877:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3043:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2946:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2436:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2541:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3239:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3121:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2434:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2779:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2389:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2926:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2628:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2384:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2362:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2988:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3303:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3580:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2466:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3033:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3152:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2894:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2848:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3342:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2879:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2726:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2855:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2847:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2438:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2999:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2830:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2003:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2542:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3003:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2651:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3529:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3529:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3085:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2260:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2598:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2712:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2635:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3253:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2464:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2764:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2701:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2952:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2310:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2803:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2785:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2721:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2888:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2710:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2302:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2643:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3091:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2436:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2941:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3146:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2989:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2869:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3158:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2846:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3289:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2632:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2509:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2251:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2531:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2588:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2490:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2814:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2738:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3250:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2768:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2682:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2386:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2628:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3303:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2829:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3249:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2366:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2094:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2416:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2985:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2768:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3367:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3029:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2801:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2844:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2961:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2437:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2791:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2955:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2794:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2614:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2722:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3428:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2386:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2522:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2104:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3085:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2697:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2755:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2657:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3056:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2558:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2114:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2904:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2691:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2930:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3006:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2004:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2497:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3131:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3484:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2110:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2110:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2312:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2065:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2970:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2142:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2331:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3356:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2889:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2635:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2351:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2488:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2579:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2639:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3032:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2534:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2714:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2988:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2869:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2135:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3179:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2519:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2744:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2626:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2931:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2557:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3016:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2526:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3130:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2249:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2738:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2636:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2917:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3273:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3178:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2397:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2771:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3239:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2845:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2593:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2829:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2416:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2786:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3423:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2304:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3166:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2971:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2845:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3053:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2402:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3176:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2809:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3239:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2861:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2279:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2588:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2394:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2965:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2607:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2942:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2946:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.3254:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.3501:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2993:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2591:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2928:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.3334:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2781:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2716:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2568:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2744:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2732:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2662:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2974:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.3344:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2442:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.3150:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2767:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2702:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2778:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.3918:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.3918:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2353:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2496:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2727:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2703:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2482:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2564:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3066:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2632:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2734:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2031:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2873:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3212:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2789:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3673:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2581:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2655:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2925:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2612:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2769:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2236:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3199:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2840:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2291:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2483:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2396:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2256:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3397:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2754:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2867:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3298:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2762:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2684:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3125:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3263:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3115:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2565:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2567:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2983:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2424:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3167:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2367:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2661:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2294:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2844:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2649:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3105:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3018:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2095:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2969:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2908:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2806:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3032:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2474:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2867:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2911:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3238:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2900:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3140:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2894:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2197:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2471:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2018:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2716:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2964:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2546:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2330:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3728:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2488:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2913:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2352:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2812:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2373:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2522:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2302:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3004:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2146:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2946:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2951:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.0794:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.0794:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2313:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3228:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2771:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2741:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2450:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2499:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2752:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2654:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2921:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3119:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2678:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3264:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2653:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2584:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2221:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2443:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3360:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2985:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2531:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3132:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2721:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2558:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2891:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2151:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3091:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3195:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2401:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2996:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3140:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2676:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2322:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2478:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2866:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2223:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2873:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2569:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2688:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2814:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2651:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2687:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2477:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3503:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2814:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2558:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3306:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2580:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3423:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3023:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2035:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2576:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2433:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2750:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2509:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2618:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2485:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2924:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3098:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2705:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2827:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2406:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2961:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2521:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2583:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2126:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2543:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2986:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2829:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2326:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2701:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2984:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3286:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3511:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2810:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3197:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2552:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2961:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3090:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3027:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.1564:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.1564:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2500:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2334:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2810:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2897:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2716:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3200:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2462:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2690:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2870:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2803:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3655:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3200:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2647:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3301:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2462:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2746:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2613:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2534:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2904:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2127:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2462:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2657:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2779:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2983:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3367:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2701:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2728:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3145:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2954:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2349:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2748:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2484:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2413:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2482:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2940:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2915:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2268:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2350:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2677:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2420:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2990:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2511:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2724:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2467:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2676:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2823:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2750:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2711:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3039:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3058:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2596:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3328:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3010:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2726:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2209:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2455:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2479:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2564:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2504:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.3184:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2716:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2629:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2925:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2598:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2767:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2876:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2957:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2233:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2604:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2104:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2809:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2758:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2757:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2279:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2372:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2516:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2352:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.3077:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2461:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2461:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2890:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2553:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3503:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3080:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3091:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2732:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2934:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2522:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3085:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2931:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3018:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2478:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3034:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2327:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3301:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2773:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2863:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2475:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3711:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2928:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2729:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2866:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2413:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2816:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2555:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2799:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2305:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2660:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3437:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3358:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2700:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3437:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2908:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2887:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2238:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2907:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2652:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2826:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2549:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2408:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2988:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2287:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2640:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2738:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2541:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2786:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2959:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2825:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3197:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3006:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2553:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3589:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2651:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2749:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3002:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2778:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3124:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2921:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2783:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2898:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2350:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2554:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2705:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2710:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3242:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2318:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2660:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2662:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2927:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2297:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2888:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2430:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2469:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2970:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2237:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2518:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2549:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2988:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.1410:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.1410:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2660:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2830:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2614:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2814:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2302:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3461:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2239:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3654:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2931:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2792:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2282:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2504:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3240:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2350:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2443:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2885:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2679:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2989:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2989:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3124:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2798:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2776:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2215:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2817:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2433:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2840:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2718:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2228:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2522:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2658:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2681:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2343:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2993:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2993:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2581:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2623:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2640:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2712:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2702:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2606:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2659:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2710:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2948:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3486:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2549:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2755:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2800:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2815:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2796:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2992:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2559:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2357:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2912:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2870:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3230:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2656:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2863:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2698:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2743:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2604:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2563:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2556:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2782:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.1827:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2946:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3173:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.1974:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2187:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2800:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2503:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2510:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2614:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3071:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2800:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2703:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3395:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2236:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3002:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.1788:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.1788:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3216:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2525:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3023:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2733:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2438:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3372:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2739:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3592:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2272:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2907:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2664:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2180:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2811:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2458:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3360:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2916:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2344:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2933:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2620:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2794:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3030:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2541:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2744:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2844:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2995:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2935:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2737:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3366:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2397:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2907:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2626:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2646:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2525:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2502:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2464:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3322:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2842:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2394:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2823:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2483:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3002:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3008:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3068:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2764:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2308:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2677:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3293:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2821:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2564:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2571:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2982:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2679:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2234:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2760:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2374:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2040:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2717:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2614:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2914:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3066:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2683:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2588:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2477:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2698:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2715:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2295:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2695:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2101:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2564:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2048:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2904:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2990:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2939:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2360:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.3029:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2588:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2450:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2665:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.1755:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.1755:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2408:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2686:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3363:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3219:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2475:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2493:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2757:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2261:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2774:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2515:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2699:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2972:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2971:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3022:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2527:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2170:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2665:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2575:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2688:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2755:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2631:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2900:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3443:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3229:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2003:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2930:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2701:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2836:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2737:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3009:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2449:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3389:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2377:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3013:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2599:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2598:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2303:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2655:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2952:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2785:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2965:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2821:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3020:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2585:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2505:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2762:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2918:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2516:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2461:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2723:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2713:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2848:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2637:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2925:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2262:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2716:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2543:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2691:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2982:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2812:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2503:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2386:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2672:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3367:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3124:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2783:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2907:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2460:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2902:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3278:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2527:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3074:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2659:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2502:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2910:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2379:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2998:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2999:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3249:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3249:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2666:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2737:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3071:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2899:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2653:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2311:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2560:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2931:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2764:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3232:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2894:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2220:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2917:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2764:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2759:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2552:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2534:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2480:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2837:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2379:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3120:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3084:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2832:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2768:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3799:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2909:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3330:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2817:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2168:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2691:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2884:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2708:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2644:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3143:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2936:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2546:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2910:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2731:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3112:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2105:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2771:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3288:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2800:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3035:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3150:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2131:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2266:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2516:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3081:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2525:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2725:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2537:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2675:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3117:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2336:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2593:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2598:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.1920:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2876:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2690:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3031:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2480:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2955:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2845:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3265:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2612:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2294:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2389:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2331:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2847:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2474:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2432:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2995:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3168:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2665:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2145:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3385:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2547:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2083:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2083:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.3167:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2834:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.3020:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2702:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2469:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2564:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2723:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2599:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2702:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.3277:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.3286:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2452:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2594:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2651:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2756:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2737:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2461:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2288:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2311:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2366:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2929:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2684:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.3120:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.3100:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2337:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2467:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2253:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2920:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2964:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2658:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2624:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2994:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2707:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2416:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2621:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2663:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2584:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2768:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.3035:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2731:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2308:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.3046:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2895:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2347:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2353:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2778:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2574:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2727:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2586:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2519:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.3124:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2867:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2501:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2418:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2625:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2773:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2652:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2621:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2619:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2076:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2907:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2600:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2294:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2890:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2754:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2894:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2987:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.3196:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2985:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.3509:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2742:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2962:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2778:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2846:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2350:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.3052:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2508:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2830:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.4553:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.4553:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2542:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2785:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2379:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2682:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2348:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2243:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2325:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2620:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2973:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2733:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2988:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3294:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2488:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2836:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2946:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2761:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2616:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2895:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2170:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2348:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2372:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2601:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3107:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2178:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2623:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3027:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2355:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2350:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2860:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2252:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2728:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2687:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2365:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3168:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2768:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3044:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2103:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2881:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2878:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2913:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2228:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3873:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2779:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2916:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2252:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2334:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2497:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2719:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2730:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2387:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2354:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2039:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2730:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3124:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2538:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2636:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2938:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2816:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2578:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2665:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.1942:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2100:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2619:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2900:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3041:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3123:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2876:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2516:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2315:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2159:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2323:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2406:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2967:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.1912:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2942:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2024:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2950:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2893:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.1902:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.1902:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2389:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2913:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3041:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2876:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3009:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2629:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2610:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2775:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2966:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2046:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2700:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2836:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2406:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3403:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2952:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2553:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2374:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3156:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3289:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2496:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2921:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2825:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2976:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2858:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2092:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3053:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2179:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3129:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2359:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.1998:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3457:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2369:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2438:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3024:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2710:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3617:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2878:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2503:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2399:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2164:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2184:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2772:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2789:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2440:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3141:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2080:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3205:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2487:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2709:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2556:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2662:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2948:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2413:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2639:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2566:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2245:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2565:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2459:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2149:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2508:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2824:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3266:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3086:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2664:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3244:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2939:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2780:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3242:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2561:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3141:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2566:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2902:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2247:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2772:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3263:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2696:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2156:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2572:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.4402:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.4402:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2788:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2594:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3005:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2280:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2821:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3258:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2693:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2862:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3337:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2745:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2827:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2674:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2695:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2579:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2946:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2728:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3300:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3116:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2728:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2296:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3212:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3339:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2771:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2591:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2832:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2672:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2737:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2249:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2389:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2194:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2762:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2817:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2756:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3343:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2675:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3221:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3008:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2832:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2774:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3092:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2326:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3291:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2389:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2258:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3160:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2555:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2811:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2698:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2548:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2837:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3156:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2529:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2816:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2759:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2488:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2660:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2723:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2579:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2977:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2619:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2202:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3008:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2491:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2597:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2957:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2223:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2688:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2390:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.3424:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2971:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2355:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2355:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.3045:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.3239:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2185:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2419:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2353:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2733:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2674:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2674:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2363:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3048:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2412:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2854:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2206:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.1983:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2659:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3022:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3097:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2584:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3124:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2620:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2621:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2593:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2589:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2948:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2684:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2395:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2360:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2714:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3301:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2787:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2413:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3491:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2655:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2269:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2672:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2874:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2257:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2972:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2287:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2313:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2290:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2627:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2418:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2058:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2479:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3108:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2648:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2527:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2842:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2620:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2915:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2595:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2768:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2334:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2538:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2493:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2926:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2830:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2408:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2527:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3005:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2671:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2876:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2476:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2579:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2759:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2173:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2880:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2591:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2843:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2470:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3122:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3265:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2747:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3014:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2925:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3195:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2415:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2384:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2837:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2769:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3248:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3037:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2092:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2478:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2711:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3760:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3760:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2352:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2739:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2273:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3112:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2445:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3130:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3043:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2777:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3281:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2653:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2794:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2501:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2984:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2548:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2428:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3056:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2587:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2776:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2872:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3118:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3058:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2428:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2797:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3400:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2363:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2427:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2829:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2740:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2972:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2837:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2978:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2540:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2876:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2301:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2173:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2539:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2948:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2486:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2395:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2775:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2237:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2312:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2645:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2852:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3301:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2606:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2695:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2753:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2776:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2788:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2704:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2906:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2680:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2454:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2617:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2471:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2941:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2738:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2545:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2808:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2686:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2761:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2437:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2459:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2560:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2569:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2704:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2758:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2477:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2578:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3028:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3060:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2779:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.1761:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2943:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2793:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2882:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2229:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.1532:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.1532:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2874:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2757:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.3076:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2749:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2566:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2920:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2400:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2874:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2645:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2619:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2665:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.3120:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2492:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2676:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.3190:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2892:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2316:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2793:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2591:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2424:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2360:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2654:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2173:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2788:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2730:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.3204:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.1654:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2699:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2763:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2823:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2608:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2804:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2167:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.3473:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2354:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2621:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2483:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2999:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2962:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2789:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2779:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.3016:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2991:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2750:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3103:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2672:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2893:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2556:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2532:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2199:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2707:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2491:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2358:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2990:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2761:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2331:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2884:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2988:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2761:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3101:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3203:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2565:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2815:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2930:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2258:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2652:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2560:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3000:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3065:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3011:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2969:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2822:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3140:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2801:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3592:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3018:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2557:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2643:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2458:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2458:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3215:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2485:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2216:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2503:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2672:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2821:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2503:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2657:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2942:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2706:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2368:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2589:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2761:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3036:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2918:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2553:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2734:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2904:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2748:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2577:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2569:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3078:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2497:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2795:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2791:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3102:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2845:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2793:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2753:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2277:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3282:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2839:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2633:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2289:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2474:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2769:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2110:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2597:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2695:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2872:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2745:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2577:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2197:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2590:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2768:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2764:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2638:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2808:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3041:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2461:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2720:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2793:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2674:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2727:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2536:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2847:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2321:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2900:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2630:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2836:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3059:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2579:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2615:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2565:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2311:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3482:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2283:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2962:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3208:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2633:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3030:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2660:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2617:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2621:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2913:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3036:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2308:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2574:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3838:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3838:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2963:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2233:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.3058:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2318:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2510:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.3129:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2615:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2527:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2472:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2623:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2738:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2515:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.1875:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2221:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2695:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2558:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2464:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2971:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2158:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2610:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2464:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2824:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.3134:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2624:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2426:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2408:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2712:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2597:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.3329:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2694:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2784:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2842:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2740:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2788:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2351:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2795:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2759:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2580:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2697:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2711:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.3044:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2449:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2497:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2668:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2508:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2965:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2385:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.1935:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2598:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.3108:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.3122:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2156:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2861:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2383:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2646:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2442:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2147:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2267:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2302:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2565:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2475:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2776:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2277:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2485:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2493:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2608:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2168:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2449:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2781:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2409:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.3004:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2539:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2485:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2581:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2630:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2401:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2247:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.1983:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.1262:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.1262:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2977:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2619:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2804:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2480:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2734:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2211:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2387:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2908:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2750:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2610:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3636:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2520:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2677:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2372:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2606:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2298:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2523:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2186:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2594:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2436:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2911:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2992:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2012:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2550:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2625:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2205:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2787:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2925:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2725:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3275:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3300:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2515:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2509:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2426:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2728:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2421:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2821:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2381:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2629:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2619:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2691:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2325:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2230:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3074:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2179:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2992:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2682:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2741:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2768:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3096:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.1976:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2601:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2616:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2626:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2753:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3084:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2487:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3227:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2847:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2681:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3281:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2479:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3029:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3290:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2653:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3168:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2395:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2542:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3074:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2751:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2758:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2946:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2654:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2710:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2192:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2826:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2823:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3134:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.4118:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.4118:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2160:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3118:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2818:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2742:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2493:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2399:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2579:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3512:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2735:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3238:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2440:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2520:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2875:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2522:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.1897:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2072:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2255:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2679:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3633:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2801:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2690:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2898:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2415:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2420:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2420:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2975:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2560:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2467:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2963:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2155:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2536:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2052:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2829:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3123:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2407:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2453:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2435:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2864:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2672:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2496:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2137:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2447:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2356:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2170:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2734:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3131:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2155:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3427:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3076:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2464:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2295:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2526:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2736:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2780:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3158:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2772:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2691:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2507:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2480:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2738:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2530:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2485:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2767:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3013:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.1986:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2559:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2888:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2455:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2657:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2790:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2109:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2737:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2608:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3034:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2462:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2390:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2478:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2145:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2458:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2458:  28%|██▊       | 113/401 [01:07<03:24,  1.41it/s]training loss: 0.2527:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2625:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2148:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2577:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2384:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2221:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2710:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2733:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2961:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2681:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2227:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3436:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2300:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2529:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2746:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3189:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2229:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2467:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2210:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2811:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2566:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3119:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3072:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2839:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2939:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2791:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2887:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2426:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3406:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2765:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2502:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2376:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2484:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2552:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2661:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2644:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2676:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2171:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2392:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3472:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2497:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3150:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2320:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2276:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2585:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2644:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2225:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3040:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2975:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2284:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2359:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2302:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2541:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3036:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3209:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2727:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3110:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2871:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3354:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2910:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2733:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2472:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2392:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2552:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3180:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2820:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2776:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2822:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3335:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2203:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2687:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2378:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3003:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2649:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2519:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2650:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2375:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2155:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2211:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2211:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2426:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2292:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2728:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2806:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.3094:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2658:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2123:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2613:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2695:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.1797:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2398:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2062:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2347:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2396:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2486:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.3042:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2496:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2210:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2408:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2492:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2241:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2071:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2886:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2543:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2802:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2985:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]slurmstepd: error: *** JOB 9912059 ON gpu012 CANCELLED AT 2026-05-14T10:50:09 ***
+training loss: 0.2993:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]
\ No newline at end of file
diff --git a/slurm/logs/pidm_toy_9912059.out b/slurm/logs/pidm_toy_9912059.out
new file mode 100644
index 0000000..e69de29
diff --git a/slurm/logs/pidm_toy_9912070.err b/slurm/logs/pidm_toy_9912070.err
new file mode 100644
index 0000000..0703182
--- /dev/null
+++ b/slurm/logs/pidm_toy_9912070.err
@@ -0,0 +1 @@
+  0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.2551:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1176:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1060:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1632:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1818:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0338:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1002:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0983:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0812:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0331:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0574:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0444:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9588:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0914:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0291:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0121:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9731:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9560:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0103:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9386:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9856:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9452:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9396:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9620:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9623:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9229:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9432:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9279:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9292:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8801:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8585:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9653:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9662:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8867:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9096:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9265:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8645:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8828:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8600:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8572:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8554:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8367:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8476:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8754:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8526:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8306:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7750:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7980:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7936:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7926:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7810:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7994:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7928:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8409:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7598:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8015:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6955:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7742:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8142:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7444:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6679:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6853:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7115:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7299:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6961:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7344:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6457:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6683:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6733:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6842:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6885:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7089:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6253:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6443:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6088:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6275:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6551:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.5678:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6039:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6039:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.6093:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5775:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5579:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.6020:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5859:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5814:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5573:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5129:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5302:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5351:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5318:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5398:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5146:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5093:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5481:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5132:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5026:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4681:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4820:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4638:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4943:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4588:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4837:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4216:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4526:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4499:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4998:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4547:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4344:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4219:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4697:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4456:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4492:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3905:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3912:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4068:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4049:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3884:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4446:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4242:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3773:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4253:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3726:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4104:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4030:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3557:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3865:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3053:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3985:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3683:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3541:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4177:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3863:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3775:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3682:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3662:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3357:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4027:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3493:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3336:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3701:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3362:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4137:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3368:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4069:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3933:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3370:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3304:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4235:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3191:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3769:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3863:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.2603:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3528:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3548:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3779:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.2995:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3698:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.1826:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.1826:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3406:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.4033:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2978:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3100:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3001:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3360:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2874:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3243:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3403:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3685:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3251:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3131:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3668:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2817:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3275:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3150:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2796:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3481:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3502:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3211:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3261:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2969:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2918:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2998:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3303:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3013:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3277:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3485:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3230:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3760:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2999:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2846:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2725:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3087:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3666:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3036:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3759:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3327:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2803:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2855:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3307:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3205:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3134:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3100:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3055:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3335:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2834:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3343:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2551:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3027:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3176:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3016:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3485:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3647:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3548:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2989:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3743:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3236:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3336:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3316:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3150:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3782:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3572:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3283:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3295:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2868:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2498:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2644:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2787:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2525:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3200:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3202:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3047:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3130:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2600:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3730:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2763:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3245:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2876:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2876:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3222:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3313:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2932:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2620:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3152:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2789:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3206:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3138:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3368:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3158:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2743:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2646:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.4446:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3172:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3743:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3078:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3206:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3121:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2688:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3185:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2757:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3557:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3379:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3845:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2807:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2882:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3009:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3291:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2848:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3242:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2943:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2648:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3348:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2971:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2864:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3064:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3603:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2276:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3285:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2944:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3606:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3466:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3188:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3116:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2715:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2997:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2782:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2857:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3182:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3087:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3168:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3054:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2711:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2884:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2947:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2813:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3648:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2694:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3033:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3250:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2909:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2823:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3153:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2209:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3097:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3287:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3619:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3301:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3090:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2924:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3115:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2933:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2427:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3063:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2988:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2700:   1%|          | 3/401 [00:05<07:39,  1.16s/it]training loss: 0.3348:   1%|          | 3/401 [00:05<07:39,  1.16s/it]training loss: 0.3275:   1%|          | 3/401 [00:05<07:39,  1.16s/it]training loss: 0.3833:   1%|          | 3/401 [00:05<07:39,  1.16s/it]training loss: 0.3833:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3421:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3302:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3214:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2663:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3354:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3254:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3018:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3114:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3121:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3085:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2907:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3136:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3857:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3473:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3223:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3586:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2834:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2495:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3246:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3369:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2825:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2988:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2835:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3110:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3056:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3108:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3130:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2989:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2374:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2707:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3493:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3094:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2934:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3422:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2672:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3233:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3056:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2745:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2732:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3253:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2982:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2929:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3145:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2667:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2999:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2690:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3765:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3242:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2605:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2888:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2923:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3959:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2501:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2485:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3118:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3320:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2923:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3189:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3007:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2874:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3386:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3509:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3332:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2946:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3235:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2901:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3197:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2793:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2591:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2935:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3051:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2868:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2592:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3329:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3065:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2875:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2750:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2295:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2113:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2113:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2494:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3078:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2854:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2562:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3316:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3228:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3198:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3428:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2418:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3122:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3161:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2644:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2982:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2881:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3203:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3128:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2532:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3023:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3625:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2784:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3473:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3108:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2413:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3028:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2463:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3183:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2429:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2714:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3238:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3323:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3294:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2892:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2522:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2849:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3340:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2748:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2744:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3038:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2698:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2852:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2447:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2426:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3496:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2672:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2335:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2083:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2579:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3166:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3165:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3215:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2544:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3191:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2743:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3789:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2939:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2951:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3007:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3145:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2628:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2420:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2662:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3233:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3252:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3096:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3019:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3269:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3325:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3041:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2983:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3060:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2583:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3188:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2667:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2840:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2912:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2318:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3957:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2703:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.1804:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.1804:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3265:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2912:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2467:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3311:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3107:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2685:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2406:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2725:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3334:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3307:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3357:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2739:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3018:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3364:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2795:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3512:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3072:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3228:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3162:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3217:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2708:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3341:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3721:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3690:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2988:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3073:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2952:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2688:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3351:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3211:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2556:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2854:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.4159:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3638:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3166:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3240:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2247:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3069:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2814:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3041:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2623:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3507:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2997:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2286:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2859:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2847:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3047:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2593:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3184:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3640:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2629:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3427:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2549:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3281:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2970:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3098:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3252:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2706:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2568:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3245:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3117:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3059:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2745:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3136:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2791:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2412:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2698:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2950:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2422:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2782:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2830:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2582:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3387:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3433:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3699:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2650:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3413:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2554:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3423:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3423:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.3494:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.2927:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.2622:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.3348:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.3118:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.2451:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.3203:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.2648:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.3459:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2430:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2822:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3079:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2567:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3494:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2544:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2850:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2729:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2840:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2881:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2654:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3117:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3194:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2811:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3649:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2228:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3752:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3068:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2873:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2929:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2992:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3903:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3295:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3421:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3544:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2509:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2239:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2733:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3004:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3278:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3558:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3227:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2763:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2868:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3095:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2602:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3038:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2847:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2834:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3103:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2577:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3064:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2764:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2376:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2520:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3311:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2809:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2779:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3127:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2799:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2676:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3043:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3016:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3215:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2801:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3681:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3146:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2400:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3282:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2977:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3134:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2775:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3142:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3035:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3095:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3074:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2872:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3238:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2736:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3917:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3917:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3532:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3028:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2657:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2582:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2594:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2798:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3335:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2665:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3620:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2799:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2475:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2944:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3286:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2751:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2721:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3125:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3027:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3153:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2594:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3140:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2380:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2753:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3147:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2379:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3213:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3248:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2771:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2848:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3407:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2976:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2437:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2837:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3062:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3115:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3205:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3028:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2692:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2814:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2783:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2605:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2723:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2742:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3424:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3513:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2976:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3228:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2964:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2626:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3150:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3226:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2508:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3415:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3034:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2909:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2645:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2840:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3719:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3222:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2315:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2767:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2454:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2023:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2844:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3524:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2647:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2844:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2745:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3747:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2785:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2900:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3504:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2616:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3676:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2511:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3012:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2687:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2899:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2970:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3719:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3719:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2494:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2739:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2410:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2892:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2638:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3148:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2944:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3039:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2952:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2879:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3002:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2920:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2757:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2693:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2701:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3228:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3346:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2943:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2531:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3016:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3291:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2848:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2623:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2517:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2858:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2377:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2831:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2893:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2843:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3101:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2579:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2626:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3221:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3177:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2875:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3420:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2920:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3063:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3288:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2685:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2838:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3090:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3151:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2341:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2593:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3075:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3040:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.1999:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2806:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3962:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3176:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2483:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3119:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2784:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2697:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2660:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2835:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2665:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2874:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2428:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2426:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2856:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2559:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2642:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2717:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3125:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2911:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2815:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2996:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3697:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2477:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2468:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3656:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3478:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2860:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2026:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2364:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2403:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.1503:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.1503:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3332:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3023:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3072:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3217:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2153:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2813:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2323:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3262:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3357:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2530:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3350:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2614:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2983:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3336:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2255:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2725:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2848:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2790:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3760:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2672:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2796:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2745:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2724:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2291:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2866:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3111:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3137:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2943:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3375:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2777:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2898:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2878:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2534:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2652:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3055:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2232:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2676:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3370:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2797:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2481:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2692:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2062:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3087:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2949:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2831:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3322:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3236:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3101:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3115:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2606:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2450:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3572:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2792:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2325:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2692:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2414:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2775:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2436:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2198:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2524:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2846:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2685:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2660:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2426:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3069:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3064:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2923:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2903:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3050:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2935:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2969:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2750:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2458:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3200:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2722:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3300:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2685:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3361:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3115:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3115:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3474:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2435:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2788:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2840:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2689:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2502:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3291:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3467:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3497:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2471:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2567:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2723:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3139:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3026:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2649:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3102:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2622:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3278:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3066:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2027:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2368:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3609:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3159:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3096:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3120:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2585:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2813:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3354:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2846:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2869:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2694:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2740:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2993:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2528:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2650:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2795:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2917:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3231:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2381:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3213:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3054:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2958:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3052:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2616:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3160:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2141:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2679:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2917:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2763:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3547:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3279:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2615:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3187:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3537:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2803:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2683:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2634:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2894:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2931:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2461:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2359:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2589:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2953:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2997:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3685:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2642:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3208:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3248:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.4181:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2824:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3087:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2631:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2655:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3020:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3555:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3393:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3080:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2764:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3536:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3536:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2706:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.3502:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2697:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.3017:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2395:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2291:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2985:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2351:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2738:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.3148:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2838:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2379:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2968:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2636:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2620:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.3608:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2549:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.3007:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2795:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2471:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2733:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2745:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3133:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2544:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2400:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2611:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3353:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2668:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2811:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2678:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3161:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2805:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2553:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2570:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2643:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3262:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2576:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2866:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2941:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2487:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2635:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2679:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2817:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2892:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2839:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3234:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2904:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2392:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3113:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2749:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2886:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2585:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2740:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2510:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2815:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2851:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2760:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2390:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2859:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2421:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2519:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2762:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2847:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2722:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2466:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2364:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3217:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3526:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2689:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2893:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2494:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2486:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2706:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2883:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2270:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3307:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3558:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2924:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2134:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2134:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2857:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2598:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2579:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2290:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2646:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3269:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3034:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2661:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3138:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3165:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2460:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3246:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2584:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2748:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2737:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2754:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2945:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3191:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2533:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2793:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2479:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2603:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2989:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2627:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3246:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3157:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3105:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3834:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2996:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3105:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2924:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2545:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3293:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2981:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2813:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2659:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2659:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2904:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3197:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3433:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3465:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3139:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2727:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3066:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2998:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3307:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2812:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3810:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2703:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2405:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3179:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2774:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2735:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3288:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2472:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2219:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3099:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2835:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2868:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3319:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3303:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3457:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2763:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2675:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2511:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3718:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3179:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3191:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3071:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2857:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2851:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2810:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2549:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2723:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3701:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3147:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2940:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2141:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2938:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2938:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3248:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2750:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2715:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3084:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3017:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2721:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2840:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3188:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2410:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2433:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3250:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3628:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2702:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2649:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2486:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2982:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2554:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3225:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2950:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2822:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2891:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2713:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2678:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2370:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2758:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2783:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2972:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3415:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3386:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2832:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2407:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2982:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2593:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2958:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2707:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2651:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2882:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2802:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3612:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2904:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3240:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2933:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2306:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2653:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2951:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3461:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2559:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3125:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2462:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2767:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3124:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3094:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3382:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2416:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2841:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2841:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2360:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3005:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2868:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3082:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2888:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2637:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2316:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2737:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2836:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3165:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2448:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2952:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3072:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3513:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2945:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2263:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2918:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2786:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3586:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2848:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2781:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3297:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.5124:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.5124:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2624:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3187:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2536:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2992:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2326:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2675:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2777:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3070:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3179:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3442:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3192:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3161:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3493:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2955:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2730:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2912:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3781:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2344:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2973:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2583:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2921:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2746:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3362:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2210:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2546:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2931:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2864:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2570:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3646:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3338:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2924:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3037:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2559:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3370:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2603:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3353:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2567:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3012:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2309:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2748:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3070:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2842:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2834:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2831:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2909:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2965:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2620:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3094:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2695:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2804:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2963:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2601:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3076:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3719:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2581:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2757:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3032:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2809:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2573:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2484:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2749:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2684:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3118:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3117:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2979:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3232:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2741:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2967:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2803:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3154:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2556:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2568:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2576:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3119:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3480:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3199:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2501:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2705:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.1609:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.1609:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2685:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3007:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2483:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2272:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2971:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2559:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2699:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2965:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2825:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2935:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3091:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2962:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3914:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2621:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2236:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2919:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2652:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2843:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2574:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2560:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3068:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2578:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3103:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2615:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2218:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3113:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3267:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2460:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2990:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2291:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3222:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3289:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2905:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2722:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3130:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2844:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3011:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2677:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3243:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3176:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3084:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2220:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2694:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2949:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2494:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2576:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2444:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2927:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2793:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2865:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2583:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3094:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3125:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2823:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3204:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3273:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3679:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2686:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3463:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2997:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2661:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2891:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2965:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2529:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2883:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2148:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3124:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2545:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3366:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3342:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2669:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2864:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2763:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2650:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2805:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2908:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2370:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2979:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.1921:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.1921:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3300:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3032:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3105:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2902:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3464:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2922:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3076:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3055:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2485:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3281:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3000:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2571:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2339:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2687:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2868:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2684:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2649:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3060:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2513:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2755:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2545:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3004:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2436:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2617:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3110:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3273:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2673:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3222:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2739:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2274:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2903:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2505:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2989:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3127:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2460:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3570:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2469:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2523:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2653:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2861:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2692:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3339:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2771:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2742:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3023:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3042:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3259:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3046:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3023:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2704:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2889:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2763:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2764:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2946:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3058:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2780:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2862:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3045:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3480:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3164:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2463:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2633:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2750:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3220:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3543:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2849:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2961:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3257:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3004:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3046:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3367:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2512:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3329:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3175:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2418:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3267:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2732:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2307:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2885:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2885:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2907:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2876:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2601:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2656:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2311:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2993:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2753:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.3121:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2897:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2537:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2635:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2518:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.3346:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2580:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2561:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.3092:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2433:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.3227:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2848:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2305:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.3275:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2903:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2602:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2778:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.3037:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2850:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2698:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.3279:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2504:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2932:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3813:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2652:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2472:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2498:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3072:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2791:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3236:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3280:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2789:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2810:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2893:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2670:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2362:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2847:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2956:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2534:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3391:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3277:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2601:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2942:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2372:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2877:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3472:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3280:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2833:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2723:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2827:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2501:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2440:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2636:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3079:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2448:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.4189:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2191:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2424:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3007:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2301:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2756:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3041:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2697:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2428:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3074:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3378:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2640:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2928:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2813:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2984:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2729:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2594:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2594:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2462:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2908:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2340:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2757:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3289:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2980:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2990:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3084:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2894:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2684:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2947:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2380:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3704:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3291:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3432:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2438:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2722:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2696:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3146:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3138:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2288:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2626:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3565:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2327:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3042:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2977:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3154:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2739:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2303:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2812:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3344:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2799:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2780:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2869:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2627:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2716:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3165:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2778:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2786:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3037:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2716:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2507:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2840:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3131:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2777:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2723:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3118:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2182:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2506:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2955:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2449:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2780:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3026:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2366:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2577:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2686:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2692:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2983:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2530:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2857:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3003:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2874:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2824:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2988:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2483:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2801:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2888:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3004:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2789:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2447:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2956:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2523:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3284:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2237:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2918:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3601:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2451:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2576:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.0841:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.0841:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2936:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2493:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3005:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2435:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2359:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2715:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2749:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2636:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2787:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2685:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3012:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2084:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2757:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2976:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3009:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2409:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2913:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3558:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2505:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2748:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2658:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2815:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2971:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3063:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2399:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2842:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3324:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2659:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3002:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2541:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2596:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2953:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2943:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2942:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2538:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2310:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2980:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2642:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3016:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2698:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2995:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2377:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2783:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2467:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3363:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2665:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2425:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2874:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2694:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2357:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3388:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2466:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2774:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3293:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2609:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3140:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3039:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2648:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2925:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2901:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3028:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3032:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2169:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2813:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3267:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2546:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2576:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2622:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3010:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2502:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2794:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2938:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2692:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3304:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3183:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2821:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2820:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3401:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2903:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2903:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3558:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3214:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2939:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3291:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3868:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3193:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2482:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3381:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2788:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2200:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2547:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2842:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2712:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2645:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2814:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2628:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2147:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3118:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2898:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2681:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2783:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2424:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2914:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2547:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2531:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2737:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2600:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2421:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3099:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2655:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3264:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2165:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2568:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3045:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2753:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2276:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2552:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2850:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3107:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2715:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3152:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2806:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3154:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2910:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2784:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3034:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2635:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3207:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3393:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3134:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2661:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3635:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3152:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2779:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2486:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2825:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3453:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3325:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3378:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3382:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2445:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3376:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2768:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2960:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2723:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2415:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3225:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3001:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2565:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2776:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3386:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3258:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2613:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3562:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2978:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2888:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3179:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2981:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.4510:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.4510:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2752:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.3504:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2615:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2755:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2942:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.3008:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2789:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2141:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2595:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.3138:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2728:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.3211:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2637:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3237:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2928:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2304:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2728:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2837:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3032:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2920:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2823:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2642:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2922:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3026:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2878:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2514:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2938:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3059:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3405:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2597:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2965:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2767:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2386:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3353:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2841:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3322:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3061:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2800:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2715:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2729:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3093:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2815:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3326:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2966:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2596:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2509:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2815:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2613:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3037:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2959:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3048:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2962:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2774:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3087:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3079:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2496:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2491:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2703:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2622:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3034:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2467:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3210:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2839:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2600:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2918:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2905:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3124:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3448:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2842:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3199:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3373:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2581:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3222:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2851:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2695:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2717:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3480:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2732:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3604:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3604:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3223:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2396:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2720:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3061:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3163:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3326:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2609:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2643:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3067:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2719:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2885:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3159:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3438:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2616:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3060:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2363:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2701:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2906:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3229:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2654:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2737:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3038:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2975:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2653:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3079:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3053:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2403:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2833:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3105:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2456:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3403:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2987:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2859:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3250:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2819:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2915:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2569:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2655:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3116:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2371:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2750:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3084:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3051:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2545:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2619:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2836:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2803:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3728:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2911:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3663:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3132:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2794:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2545:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2769:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2983:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3013:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2110:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2985:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2917:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2813:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2857:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2418:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2641:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2728:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2066:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2496:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2671:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2307:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2724:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2932:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3329:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2784:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2910:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2813:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3164:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3506:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2295:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2831:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.4534:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.4534:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2789:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2594:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2788:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2902:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2573:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2843:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3297:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2632:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2372:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2417:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3209:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3138:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3080:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3105:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3451:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2352:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2818:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3315:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2863:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2014:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3650:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2979:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2640:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2987:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3744:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2775:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2615:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2439:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3011:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2223:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2887:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2476:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2652:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2596:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3056:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2997:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3076:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3058:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2781:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3115:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2754:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2883:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2641:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2895:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2675:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2736:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3119:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2731:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3169:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2290:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2852:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2967:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2561:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2620:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2477:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2903:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2524:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3222:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2760:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2851:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2676:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.1843:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2125:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3085:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3090:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2910:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2660:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2315:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2659:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2747:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2637:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2993:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3030:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2978:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3111:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2528:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3145:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3084:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2554:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2554:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2905:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2536:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2582:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2901:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2669:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3057:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2795:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2931:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2984:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2973:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3223:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2832:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2657:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2712:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3299:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3236:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3311:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3307:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2672:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3077:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3025:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3290:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2869:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2151:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3079:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2460:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2894:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2972:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2653:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2563:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3193:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2696:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2829:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2659:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2612:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2513:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2974:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3227:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2410:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2609:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3452:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3011:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2976:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3086:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3446:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3455:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2614:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3315:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2303:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2442:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2865:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3053:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3202:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2804:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3060:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2254:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2940:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3384:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2830:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3135:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3092:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2537:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3644:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2756:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3407:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.4003:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2899:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3103:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2955:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2819:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2703:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2845:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2593:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2608:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2294:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2755:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2312:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2915:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.4981:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.4981:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2802:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2594:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3125:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3170:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2486:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2843:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2624:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2890:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2938:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2538:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2860:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2950:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3126:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3089:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3235:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3276:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2942:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3234:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3002:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2706:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3025:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3211:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2693:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2844:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2672:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2888:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2250:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2773:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3123:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3314:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2936:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3125:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3028:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3323:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3255:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2738:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2992:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3583:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2809:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2488:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2994:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2232:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3048:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2839:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2282:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2992:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2153:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3212:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2708:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3297:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3049:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2490:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3294:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3004:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3142:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2748:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2626:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2934:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3633:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2987:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2498:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3458:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3675:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2860:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3025:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2660:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2933:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2829:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3203:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2613:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3075:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3179:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2361:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3145:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2515:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2650:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2797:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2626:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2795:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2795:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2943:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3044:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3107:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2731:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2885:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2863:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2304:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2275:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2935:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2431:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2627:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2972:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2765:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2884:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2706:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2879:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2710:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2557:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3213:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2620:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2532:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2363:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2760:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2241:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2813:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3010:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2841:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2309:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3005:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3057:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3479:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2284:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2633:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2419:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2668:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2675:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2920:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2636:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2764:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2827:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2901:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2655:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2578:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2948:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3093:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2650:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2790:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3147:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2951:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2350:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2499:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2313:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2756:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3283:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.3093:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2311:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.3603:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2837:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.3383:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2477:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2648:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.3256:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2953:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.3345:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2865:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2708:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2819:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2548:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2240:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2732:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2687:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.3751:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2843:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.3102:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2559:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.3457:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2866:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2615:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.1439:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.1439:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2735:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3315:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2507:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2694:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2701:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3184:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3099:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2846:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3413:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2710:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3021:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2826:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2634:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3090:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2826:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2512:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2887:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2742:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2646:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2657:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3174:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2917:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2876:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2987:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3373:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3219:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2809:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2169:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2941:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2924:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3321:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2309:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2932:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2257:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2641:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3004:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2713:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3368:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2712:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2842:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2397:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2856:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3185:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2526:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2785:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2705:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3176:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3148:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2613:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2979:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2652:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3281:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3311:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3060:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2337:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3024:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2816:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3341:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3076:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2347:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2356:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2950:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2823:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2839:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2674:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2859:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3025:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3244:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3090:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2899:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2921:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3346:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3021:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3075:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2736:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2767:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3227:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2587:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.1263:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.1263:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3798:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2920:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2827:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2806:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3272:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2098:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2974:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2462:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2788:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2607:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2728:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2779:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2922:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3033:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3153:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2269:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2665:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3653:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3237:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2986:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2687:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2598:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3767:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2738:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2508:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2741:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3523:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2510:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2652:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2650:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3185:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2723:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2416:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2805:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2539:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3044:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2968:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3682:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3029:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3511:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2776:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3179:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2965:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2821:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2541:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2258:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2641:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2970:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2509:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2384:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3022:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3046:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2713:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2871:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2757:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2670:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3097:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3161:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2847:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3304:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3141:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2592:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2360:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3086:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3455:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2741:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2987:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3313:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2863:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2710:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3220:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2797:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2860:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2565:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3490:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2972:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2580:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2963:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.0885:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.0885:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2823:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2748:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2443:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2965:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2220:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2214:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2886:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3500:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2046:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2974:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3669:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3093:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2728:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2706:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3442:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3019:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3006:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2812:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3248:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3070:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2673:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2780:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3457:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2937:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2974:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2487:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2850:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2918:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3019:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2777:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3327:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2277:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3136:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2288:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2938:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2560:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2876:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2845:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3169:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2690:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2402:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.1859:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3050:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3109:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2572:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2490:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2551:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2779:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3372:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3175:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2969:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2341:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2703:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2576:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2872:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2706:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3187:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2411:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2993:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2674:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2655:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3040:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2513:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2752:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2369:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.3001:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.2749:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.3065:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.3094:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.2453:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.2548:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.3283:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.2720:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.3060:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.3281:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.2582:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.4137:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.2926:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.1387:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.1387:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3148:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2770:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2525:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2784:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3091:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2619:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2370:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3078:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3233:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2855:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2826:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2956:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2682:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2725:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3085:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2259:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3138:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2839:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2278:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3536:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2783:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3123:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2840:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2874:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2803:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2992:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3389:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2230:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2897:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2887:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2696:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3283:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2417:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2460:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2456:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2871:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2977:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2647:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2956:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2440:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2675:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3035:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2416:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2760:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2764:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2953:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2939:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2714:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2919:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2868:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2744:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2964:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3188:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3129:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2403:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2702:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2964:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2311:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3168:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3156:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2565:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2768:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2675:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2840:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2916:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2941:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3278:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3181:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2761:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2862:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2953:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2848:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2733:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3289:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2643:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3023:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2733:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3123:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.1673:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.1673:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2829:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2580:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2870:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.3163:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.3096:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2784:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2902:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2703:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2481:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.3043:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2740:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.3000:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2792:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2815:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2408:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2592:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.3311:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2332:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2470:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2671:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2850:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2553:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2701:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2978:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.3335:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2996:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2616:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2656:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2906:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2949:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2924:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2888:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2744:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2799:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.3009:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.3137:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2903:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2987:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3399:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3444:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3249:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2927:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2547:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2057:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2356:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2909:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3838:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2476:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3419:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3126:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2763:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2715:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3127:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2840:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3620:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2713:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2021:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3120:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2998:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2580:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2685:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3204:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3603:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3322:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2688:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2517:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2723:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2285:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3290:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3402:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2695:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2640:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2680:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2837:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2532:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3506:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2453:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3445:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3805:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3805:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3181:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2864:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3495:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2545:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2788:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2489:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2469:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2422:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2839:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2757:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3060:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3399:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2244:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2619:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2669:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3040:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3115:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3130:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3037:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3319:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2847:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2806:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2571:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2660:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2611:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2726:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2426:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2692:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3155:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3018:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2993:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2952:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3063:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2599:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2558:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2639:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3578:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2681:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2398:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3557:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3161:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2887:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2622:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2581:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2712:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2983:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3595:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2329:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3284:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.1949:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3017:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2635:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2718:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2803:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3209:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2613:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3559:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2735:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3302:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3084:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3001:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3061:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3415:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2998:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2960:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2621:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3123:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2423:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2186:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3183:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3412:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2829:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2536:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2840:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2563:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2653:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2797:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2935:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.1199:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.1199:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3040:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2705:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3063:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2614:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2967:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2313:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2842:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3054:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3589:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3433:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2466:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2665:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3794:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3381:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3055:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2976:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2664:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2775:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2507:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2608:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3053:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3137:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2723:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2533:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2713:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3551:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2460:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2602:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2853:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3494:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2741:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3199:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2809:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2826:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2412:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3723:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3241:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2613:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3090:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2776:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3030:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2676:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2593:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3288:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2554:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2420:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2588:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3001:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2448:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2536:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2794:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2593:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2440:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2734:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2444:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3143:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2467:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2723:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2737:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2781:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3131:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3219:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3184:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2737:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3258:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2950:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2465:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2420:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2509:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2718:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2731:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2453:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2993:   8%|▊         | 34/401 [00:23<03:44,  1.63it/s]training loss: 0.2360:   8%|▊         | 34/401 [00:23<03:44,  1.63it/s]training loss: 0.2523:   8%|▊         | 34/401 [00:23<03:44,  1.63it/s]training loss: 0.3248:   8%|▊         | 34/401 [00:23<03:44,  1.63it/s]training loss: 0.2453:   8%|▊         | 34/401 [00:23<03:44,  1.63it/s]training loss: 0.2655:   8%|▊         | 34/401 [00:23<03:44,  1.63it/s]training loss: 0.3804:   8%|▊         | 34/401 [00:23<03:44,  1.63it/s]training loss: 0.3804:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2627:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3394:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3709:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3120:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2644:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2344:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2730:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2448:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2749:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3189:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2864:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2861:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2958:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3199:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2735:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2975:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2522:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3534:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2618:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3351:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3508:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2983:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2606:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2226:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3356:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2828:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3078:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2908:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2541:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3122:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3303:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3214:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2925:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2883:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3021:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2755:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2939:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2196:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3182:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2804:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2689:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2878:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2752:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2708:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3331:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3453:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2878:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2396:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2541:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2984:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3286:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3213:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2912:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2625:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2349:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2772:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2610:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3154:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2602:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2633:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2419:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2987:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3511:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3403:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3103:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2867:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2934:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2486:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2988:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2327:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2809:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3020:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2700:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2403:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2776:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3169:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3049:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2792:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.1956:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.1956:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2920:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2767:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3199:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2711:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2683:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2903:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2602:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2493:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3104:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3040:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2249:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2869:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3542:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3380:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3263:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2662:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3307:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2842:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2907:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2602:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2665:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3287:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2943:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3155:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3251:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2725:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2475:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2364:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2545:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2736:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2531:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2658:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2948:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3073:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3634:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3056:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2862:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3239:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3117:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2529:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2995:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2915:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3072:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2673:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3104:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2867:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3081:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3638:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2738:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2466:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2272:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2917:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2318:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3369:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3117:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3195:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3468:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2794:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2911:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3407:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2555:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3717:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2874:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2952:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3205:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2414:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2661:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3022:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2702:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2513:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2848:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2705:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2856:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3143:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2476:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2472:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3490:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2494:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2455:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2455:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2930:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3273:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2709:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3942:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3016:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2929:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3063:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2601:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3164:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2907:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2923:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2686:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2852:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3705:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3364:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2735:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3444:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2677:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2887:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3146:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2848:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3394:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2814:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2761:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2866:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3673:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3093:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3077:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2515:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2552:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2991:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3701:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2841:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2257:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2655:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2462:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2820:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2745:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2881:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3635:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3407:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3466:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3233:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3041:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2438:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2439:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2984:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3044:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2436:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2854:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2798:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3537:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2521:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2992:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2413:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2649:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2949:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3176:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3101:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2950:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2792:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2691:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2476:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3194:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2761:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3037:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2820:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3232:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3022:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2593:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2963:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3053:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2973:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2259:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2831:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2601:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3057:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3016:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.1851:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.1851:   9%|▉         | 38/401 [00:23<02:24,  2.51it/s]training loss: 0.2834:   9%|▉         | 38/401 [00:23<02:24,  2.51it/s]training loss: 0.2484:   9%|▉         | 38/401 [00:23<02:24,  2.51it/s]training loss: 0.2771:   9%|▉         | 38/401 [00:23<02:24,  2.51it/s]training loss: 0.3145:   9%|▉         | 38/401 [00:23<02:24,  2.51it/s]training loss: 0.2705:   9%|▉         | 38/401 [00:23<02:24,  2.51it/s]training loss: 0.2565:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3184:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3481:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2999:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2526:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2680:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3637:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3156:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3441:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2699:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2593:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2092:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3145:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3255:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3238:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2072:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3056:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2419:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3427:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3889:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2483:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3023:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2509:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2661:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2332:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2913:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3167:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2854:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3559:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2676:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3068:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2250:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3038:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2719:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2987:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2504:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3005:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2734:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3433:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3389:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2443:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2493:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2780:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2337:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2942:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3027:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2645:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2845:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2794:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2866:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2588:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2319:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2813:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2538:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3641:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2730:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2675:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2740:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3285:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2941:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2537:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2494:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2832:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3105:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2852:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2263:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2674:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2758:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3187:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2896:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3204:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3547:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2923:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.1324:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.1324:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2208:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3003:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3106:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3145:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2590:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2720:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3296:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2873:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2572:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2774:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2820:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2685:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2638:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2683:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2974:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3205:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3455:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2662:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2913:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2948:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2705:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.1965:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3030:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3118:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2425:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2544:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3228:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3091:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2912:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3295:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2591:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2704:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2679:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2488:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2506:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3138:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2700:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3281:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2779:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2461:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2951:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2409:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2934:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2582:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2731:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2913:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2922:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2412:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2947:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2012:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3362:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2610:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3017:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2726:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2975:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2488:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3064:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2593:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2162:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2812:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2503:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3520:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2589:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2597:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2772:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2965:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2981:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2756:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2897:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3230:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3446:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2942:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2399:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2621:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2724:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2618:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2806:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2583:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.4315:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.4315:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3280:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2804:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3181:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2885:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2949:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3327:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2809:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3051:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2577:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2539:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3080:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2746:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3189:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2999:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2633:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2640:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2452:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3034:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2694:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2275:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2916:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2543:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3088:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2573:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3304:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2816:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2832:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2790:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2949:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2914:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2823:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2615:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3095:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3303:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3023:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2495:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2720:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2998:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2794:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3028:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2030:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2872:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3131:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2880:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3331:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2533:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3756:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2831:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2568:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3526:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2379:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2594:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3137:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2815:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3131:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2780:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2294:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3180:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3536:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2754:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2674:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2685:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2687:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2832:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2955:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2459:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2784:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2901:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2371:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3116:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2790:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2402:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2372:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2789:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2978:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2784:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2900:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2571:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.1537:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.1537:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.3263:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2226:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2900:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2577:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.3167:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.3149:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2625:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.3110:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.3021:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2230:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2866:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2487:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.3375:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2699:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2591:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2454:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.3466:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3110:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2373:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2848:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2876:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3434:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3080:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2047:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2536:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2570:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2789:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2362:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3188:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2958:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2927:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2592:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2257:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3033:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2593:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3070:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2948:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2085:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2794:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2372:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3162:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2878:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2918:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2621:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2758:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3221:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3221:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2357:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2741:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3442:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2861:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3492:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2777:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2966:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3361:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2118:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2831:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2581:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2959:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2949:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2950:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2692:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3030:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2686:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2804:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2468:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3227:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3131:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2975:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2749:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2434:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2692:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3266:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2858:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3441:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3276:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2902:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2971:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.1553:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.1553:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3492:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3864:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2382:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2575:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2398:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2664:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3403:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3321:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3030:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2962:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2552:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2884:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2953:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2969:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3667:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2783:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2980:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2525:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3084:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2521:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2591:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3165:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2991:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2845:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2873:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3423:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3150:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3542:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2711:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2861:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2674:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3288:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3458:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3356:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2812:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2862:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2423:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2570:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3410:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3232:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3251:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3136:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2940:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2535:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3680:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2611:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2432:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3496:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3296:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2313:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2512:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2792:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2656:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2789:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3377:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3064:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2491:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2814:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2680:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2970:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2572:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2682:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2742:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2652:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2528:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2933:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2948:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2545:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3051:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2607:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2740:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2570:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2879:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2620:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3003:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3005:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2453:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2971:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.1807:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.1807:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2759:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3166:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3312:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2472:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2942:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2614:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2830:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2773:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3037:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2799:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2988:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2752:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2676:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3719:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2665:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2743:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2567:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2901:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2624:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3121:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3118:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3026:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3139:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3057:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2991:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3427:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2844:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3449:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2410:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2974:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2875:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2986:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2925:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2949:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2648:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2671:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2647:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2846:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3258:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3334:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2188:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3342:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3302:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3389:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2182:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3014:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3079:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3065:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3058:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2963:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2286:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2996:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3154:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3136:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3088:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3234:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3244:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2592:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3172:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2655:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2832:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3119:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3019:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3193:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2880:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3216:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2771:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3319:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2766:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3111:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2251:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2860:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3352:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2882:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2688:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3112:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3189:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2888:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3462:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3462:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2671:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2713:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2315:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2728:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2308:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2606:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.1817:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2842:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2452:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.3380:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2842:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.3463:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2611:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2883:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.3198:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2864:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2528:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2329:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2527:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.3398:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.3252:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2383:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2638:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2947:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2587:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2554:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2352:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3072:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2845:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2770:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2792:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2833:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2560:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2877:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3016:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2239:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2521:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3381:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2838:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2812:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3280:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2711:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2525:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2525:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3021:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2558:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3141:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2847:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2511:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3143:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2730:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2765:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2723:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2518:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2724:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2963:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2524:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2852:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2978:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2771:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2696:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2929:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2331:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2654:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2868:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2774:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2650:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3062:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3190:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3398:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2963:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2455:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2637:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2475:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2851:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2604:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2655:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2985:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2812:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2812:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2521:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2826:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2901:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2777:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2479:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2695:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2824:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2385:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2584:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3200:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2220:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2609:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2813:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2883:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2427:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2893:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2704:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3354:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2864:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2654:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2975:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2627:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3149:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2824:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2666:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2662:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3038:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3024:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3045:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2716:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2774:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2825:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2457:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2722:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2808:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3028:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2462:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2823:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2901:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2429:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3014:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2702:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2974:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3396:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3386:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3366:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3036:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3111:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2640:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3475:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2758:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2751:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2834:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2903:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3047:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2469:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3139:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2895:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3422:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2013:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2725:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3363:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2615:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3104:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2824:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2714:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2605:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2904:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3167:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3385:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2548:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2646:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3412:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2997:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2233:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2368:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2440:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2742:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3513:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3513:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2600:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3048:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2494:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2933:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2428:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2747:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2997:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3097:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2935:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2777:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2315:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2953:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2640:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3121:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2726:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2822:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2484:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2943:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2978:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3236:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2325:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3372:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2897:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2844:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3073:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2720:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2764:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3009:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2759:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3080:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2603:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2899:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2704:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3350:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2818:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2811:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2661:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2585:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3213:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2949:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2430:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2879:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3045:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2185:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2554:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2552:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3015:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2539:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3235:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3179:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2842:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3034:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3068:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2906:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2419:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2894:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2692:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2668:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3200:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3035:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2408:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2792:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2840:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3011:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2960:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2903:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2727:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2888:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2849:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3001:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3413:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2681:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2727:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2409:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3362:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3019:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2317:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2439:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2786:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2786:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3648:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2791:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2488:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2602:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3199:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3155:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2370:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2374:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3241:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2686:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2348:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3097:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2977:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2462:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2602:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2625:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2789:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2821:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2728:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2554:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2624:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2732:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3244:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2834:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2987:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3036:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2531:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2759:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2218:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2727:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2869:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2484:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3256:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2653:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3358:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2821:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3430:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2261:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2755:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3202:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2811:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2260:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3656:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2753:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2816:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3118:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3213:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3106:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2941:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2972:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3439:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2201:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2275:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3192:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3046:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2632:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2447:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2399:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2892:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2756:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2636:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2389:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3072:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2716:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2904:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3007:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2897:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2539:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3089:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2997:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2889:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2806:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2834:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3339:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3175:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3269:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2731:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2895:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3762:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3762:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3096:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2440:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2941:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3281:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2777:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3660:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2593:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3324:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2801:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2143:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3357:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2890:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3255:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2612:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2379:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2954:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2695:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2604:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3004:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2420:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3103:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2516:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2866:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3086:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2754:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3764:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3094:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2979:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2530:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2174:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2283:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2400:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2782:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2813:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3047:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2679:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2933:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3102:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3077:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2323:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3127:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2806:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2622:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3204:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2492:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2585:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3227:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2366:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2657:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2885:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2289:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3220:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2894:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2722:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3077:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2903:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2813:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2633:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2389:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2290:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3168:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3179:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3151:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3210:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2640:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2768:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3851:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2888:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2242:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2578:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2839:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2945:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3170:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2286:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2961:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2727:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3105:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2762:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2892:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2892:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2845:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2843:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2714:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2830:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3254:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3168:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2942:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2697:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2699:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2907:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2655:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2678:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2833:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3386:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2814:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3043:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2429:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3080:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2390:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2305:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2892:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2857:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2884:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3580:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2795:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3257:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2923:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2683:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3011:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2446:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3132:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3189:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2589:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2995:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2600:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2772:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3276:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2395:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2658:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2733:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3009:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2943:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3127:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2880:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2862:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3596:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3055:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2310:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2458:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2635:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2983:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3372:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2501:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2770:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2965:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2751:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2845:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2779:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2913:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3134:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2660:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3097:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2694:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2788:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2928:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3403:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2521:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3729:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2510:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3083:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3365:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3209:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3128:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2614:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2845:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2266:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3186:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2599:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3076:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3076:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2633:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2156:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3459:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3269:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3125:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2412:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3252:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2300:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2753:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3437:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3211:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2914:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2549:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2669:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2790:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2737:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2556:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2886:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3515:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3204:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2462:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2512:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3125:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2916:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2782:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3139:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3650:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2789:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2612:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2598:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2493:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3027:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2484:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2944:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3088:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2442:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2731:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2747:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3691:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3161:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3391:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3495:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2706:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2563:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2446:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3595:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3280:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2940:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3070:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2987:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2200:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3235:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3082:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2729:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2657:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2740:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.1956:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3126:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3054:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2996:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2263:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2802:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3110:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3202:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3030:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3063:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2756:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2380:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2612:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3322:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3189:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2719:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3042:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3572:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3412:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2491:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3154:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2721:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.1697:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.1697:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2777:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2756:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2917:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3207:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3182:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2763:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2775:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2657:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2709:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2937:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2646:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2697:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3308:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2237:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2806:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3141:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3249:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2816:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2617:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2497:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2969:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2626:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2199:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2437:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2165:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2645:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3183:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2732:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3506:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3011:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3096:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2231:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3752:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2631:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3280:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2563:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3266:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3178:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2652:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3239:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2804:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2424:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3140:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3036:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2498:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2988:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2883:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2588:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2338:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3034:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3040:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2819:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3408:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2557:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2901:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2886:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2910:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3624:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2336:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2636:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2880:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2514:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3169:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2843:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2523:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2404:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2885:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3023:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2915:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2574:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2629:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2678:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3308:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2653:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3086:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2469:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2746:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3100:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.4521:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.4521:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2787:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2290:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2598:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2924:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2768:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2835:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.3050:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2330:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2554:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.3050:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2537:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.3013:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2831:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2668:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2709:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2951:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2945:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2816:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2187:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2419:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2906:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2656:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2291:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2589:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2728:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2627:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2891:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2807:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2974:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2970:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2420:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2927:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3139:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3180:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2603:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2805:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.4065:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2765:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3086:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3001:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2774:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2924:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2816:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3154:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3019:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2811:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2145:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2832:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2616:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2828:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2549:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2745:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2532:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2438:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3024:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2948:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2327:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2498:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2747:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2641:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3009:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2768:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2635:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3030:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2658:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3165:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2863:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2958:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3013:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2475:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2593:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2768:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2642:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2534:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3039:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3105:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3196:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2517:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.6055:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.6055:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2354:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2869:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3243:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2829:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3267:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3498:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2607:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.1747:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2751:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2942:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3087:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2530:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2681:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2353:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2400:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3454:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2663:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2736:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2763:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2778:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2729:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3529:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3054:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2607:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2977:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2688:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2929:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3479:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3088:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2909:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3492:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3343:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3148:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2473:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2266:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2960:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2147:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2925:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3022:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2946:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2146:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2548:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2518:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2195:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2518:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2265:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3119:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2674:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2683:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2678:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2751:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2650:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3283:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2998:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3199:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2975:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2383:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3007:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2825:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2559:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3057:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2699:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2912:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2753:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2779:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2222:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2730:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2930:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2960:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2183:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3106:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3284:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3353:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2889:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2662:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2725:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2297:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3008:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.1904:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.1904:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2861:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2727:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2669:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2035:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2614:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2644:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2712:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2785:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2512:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2780:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2436:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3419:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3297:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2143:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2557:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2083:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3021:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2404:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2392:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2778:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3169:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2572:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2301:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3321:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3225:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2825:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3090:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2833:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2907:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2674:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2315:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3145:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2583:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2980:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3226:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2963:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2574:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2701:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3074:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2801:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2491:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3605:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2595:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2718:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2637:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2547:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2691:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3513:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3266:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2874:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2296:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2439:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2999:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3109:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2691:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2813:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2673:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2857:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3041:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3035:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3067:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3309:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2457:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2516:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2221:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2966:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2839:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2304:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2214:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2714:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2534:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2715:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3061:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3060:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2827:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2386:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2555:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2944:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2509:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2509:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3120:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2742:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2669:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2327:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2500:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2868:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2360:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3558:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2810:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2601:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2795:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3494:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2936:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2808:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3042:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2169:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3354:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3635:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2308:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2608:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2919:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2749:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3184:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2760:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2716:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2948:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3131:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2738:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2978:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2817:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2568:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3475:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2932:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2291:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2827:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2361:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3018:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2973:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2928:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2715:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3221:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2801:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2700:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2720:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3034:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2826:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3052:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2857:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2764:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3162:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2923:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2552:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3134:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3159:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3418:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2959:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3446:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2479:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2748:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2770:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3230:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2628:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3640:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2526:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3018:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3059:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2517:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2302:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2963:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2877:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2740:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2675:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2913:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2478:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2536:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2950:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2516:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2806:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3384:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3384:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3149:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3561:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2610:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2704:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2614:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2934:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3159:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2732:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2401:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3765:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2787:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2515:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2728:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2881:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2474:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2598:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3315:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2887:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2541:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2566:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2633:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2901:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2533:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2852:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3169:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2196:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2440:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2712:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2865:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3350:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2549:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2745:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3038:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2489:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2712:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3262:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2629:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2677:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2650:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3360:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2645:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2642:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3214:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2784:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2678:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2975:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3012:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2922:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2670:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2709:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2484:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3473:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2964:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3326:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2785:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2735:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3086:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3549:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2781:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2130:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2249:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2821:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2862:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3196:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2623:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2433:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3271:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3022:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2702:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2429:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2593:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2518:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2875:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2703:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3005:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3076:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3118:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2653:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.5124:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.5124:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3272:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2655:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2550:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2720:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2542:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2844:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2696:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2509:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2688:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3555:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2630:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2975:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3137:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3291:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2906:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2911:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2661:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3013:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2469:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2644:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2883:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2804:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3947:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2205:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3051:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2356:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2475:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2515:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3047:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2953:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2653:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2669:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2951:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2679:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3562:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3024:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3436:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2809:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2334:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2512:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2699:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2539:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3249:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3700:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2859:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2883:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2608:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2913:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2935:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3588:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2309:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3521:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2779:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3143:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2442:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2497:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3032:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3010:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2585:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2821:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2843:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2774:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3171:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2831:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2232:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2900:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2630:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2889:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2561:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2844:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2802:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3231:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2943:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3178:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3238:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3027:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2565:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2302:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2268:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2268:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2647:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3019:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2319:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2533:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2891:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2891:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3663:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2915:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3038:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2712:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3082:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2928:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2647:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2885:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3297:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3192:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2599:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2665:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2600:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2740:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2565:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2897:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2401:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2851:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2359:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2809:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3010:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2826:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2567:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3024:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2951:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3394:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3263:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2934:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2374:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2490:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2201:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2362:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2192:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2917:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2555:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3058:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2615:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2336:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2691:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2838:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2979:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2781:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2646:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2714:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2985:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3068:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3199:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2629:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2743:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2909:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3239:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2984:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3142:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2678:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3210:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2653:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2925:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3361:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2449:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2856:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2987:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3157:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3333:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2968:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3130:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2877:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2299:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3109:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3262:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3027:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2629:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2786:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2587:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2587:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2561:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3281:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3235:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2945:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3300:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2264:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2791:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2703:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2957:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2897:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2694:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3340:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3477:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2809:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2431:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2328:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2853:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3208:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2339:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2953:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2444:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2852:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2337:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2663:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2940:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3455:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3029:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2566:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3015:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2854:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2827:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3101:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2777:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2592:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2673:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3355:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2709:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2732:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2701:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3169:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2376:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3196:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2247:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2561:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2106:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2671:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2595:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2155:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3053:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3148:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3158:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2259:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2999:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3100:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2806:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3293:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2554:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2911:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2818:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2871:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2883:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2639:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2249:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2963:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2861:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2848:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2981:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2716:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2958:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2905:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3265:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3097:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3145:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2707:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2527:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2779:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3062:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2821:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2543:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2543:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2285:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2607:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2912:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2940:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3002:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3178:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2717:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2509:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2868:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3091:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2104:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2610:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2862:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2599:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2842:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3014:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2605:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3131:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2263:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3105:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2209:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2667:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2480:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2271:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3180:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3102:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3008:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3202:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2682:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2590:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2443:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3336:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2537:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3554:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3080:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2433:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2461:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2618:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2313:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3027:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3179:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2687:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2940:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2992:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3003:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3315:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2653:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2957:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2884:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2950:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2351:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2905:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3321:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2460:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2960:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3306:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3135:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2350:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3467:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2983:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2747:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2964:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2014:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3025:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2297:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2608:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3384:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2526:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2408:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3296:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3686:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2670:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2963:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2907:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2750:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2283:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2813:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2989:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2756:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2756:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2578:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3001:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2826:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2920:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2735:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3296:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2729:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2560:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3179:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2944:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2892:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2556:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2550:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3220:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3305:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3123:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3050:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3346:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2719:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2472:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3262:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2164:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3253:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3211:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2489:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2949:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3395:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2751:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3373:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2476:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2748:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3013:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2786:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2992:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3284:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2486:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2896:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2968:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2723:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3053:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3075:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3084:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2938:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3177:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2679:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3594:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2534:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2728:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2849:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2326:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3047:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3052:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2859:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3530:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3087:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2350:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2706:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2486:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2919:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2711:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2416:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3120:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3291:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2928:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2879:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2289:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2830:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2909:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3439:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2105:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2826:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2832:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2929:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2643:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2240:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2657:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3215:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3342:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.5418:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.5418:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3660:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2434:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3329:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2569:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2830:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3396:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3172:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2444:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2475:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2865:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2785:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2762:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2869:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2512:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3070:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2212:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3621:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2974:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2311:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2838:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2691:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2367:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2802:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3200:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2677:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2509:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3261:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3446:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3073:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2493:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2354:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2567:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3136:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2577:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3092:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2460:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2734:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2804:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2274:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3243:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2459:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2380:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2920:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2375:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2825:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3081:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2959:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3657:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3157:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2738:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2428:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3405:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3059:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2921:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3095:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2739:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3022:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2832:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2677:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2882:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2317:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2828:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3052:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2982:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2848:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2383:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2867:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2919:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2699:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2725:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2722:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2482:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2865:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3018:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2938:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2450:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2700:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2948:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3680:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3680:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2782:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2940:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3188:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2495:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2694:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2392:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3105:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2629:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2681:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2711:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2378:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3340:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3187:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2893:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3141:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2734:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2707:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2549:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3173:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2831:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2997:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2298:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2755:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3255:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2873:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2736:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2639:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2793:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2762:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2797:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2907:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2181:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2569:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2754:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2609:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3195:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2785:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2661:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2885:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2568:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2880:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2920:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2833:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2472:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3225:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2978:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2891:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2658:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2333:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2999:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3039:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3112:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3219:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2618:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2593:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2821:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2372:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3144:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2706:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2899:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2850:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2876:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2097:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3068:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2936:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3351:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2603:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2984:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2738:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2674:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2488:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2846:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2770:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2795:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2967:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2886:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2452:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2723:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2951:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2951:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2845:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2715:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2474:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2548:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2983:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3410:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2701:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2934:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3147:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2799:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2688:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2661:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2830:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2551:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2982:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2587:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2823:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2621:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3329:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3034:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3038:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2385:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3005:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3270:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2781:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2490:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2849:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3142:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3003:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2560:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2726:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2566:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2953:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2543:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2753:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2934:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3380:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3408:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2501:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2751:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2566:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2596:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3559:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2781:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2642:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2376:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2639:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3336:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2618:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2588:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2557:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2714:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2501:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3347:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3271:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2638:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3054:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2015:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2506:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3501:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2758:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2539:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3670:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2780:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2694:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3016:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2306:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3085:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2823:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2391:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3005:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2894:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2392:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3036:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2148:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3055:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3022:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2575:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.1220:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.1220:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3374:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3050:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3305:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3348:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3019:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3037:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2616:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2628:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2955:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3013:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2520:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2783:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2583:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2731:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2889:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3234:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2660:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2727:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2541:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2300:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2629:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2154:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2708:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3814:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2778:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3048:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2759:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.4337:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3246:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2516:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2869:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3096:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3338:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3139:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2977:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2780:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2956:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3321:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2933:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2758:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3122:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3409:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2548:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3235:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3392:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3023:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3224:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2763:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2591:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2710:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2663:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2829:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2548:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2907:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2746:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3452:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3030:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2377:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2941:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2655:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2931:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3219:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2479:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2998:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2002:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2625:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2926:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2345:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2806:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2946:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2834:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2957:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2936:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3157:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2372:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2749:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3409:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2738:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3730:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3730:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2703:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2926:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2177:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2749:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2896:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2804:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2605:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2601:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2646:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2583:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2878:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3155:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2779:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2945:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3342:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2245:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3394:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2824:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2719:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2592:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3501:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2843:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3002:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2825:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2867:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2646:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3199:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2988:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2546:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2923:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3012:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3075:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2801:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2798:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2951:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3643:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2784:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3015:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2151:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2932:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3229:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3351:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2681:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2282:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3163:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3114:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2761:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3291:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2648:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2697:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2594:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2942:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2955:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2531:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3572:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3058:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3632:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.1991:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3024:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2778:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2990:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3179:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3071:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3230:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2977:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2773:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2585:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3101:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2816:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2402:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2782:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2812:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3047:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2526:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3446:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3139:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2974:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2756:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3344:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3344:  17%|█▋        | 67/401 [00:40<02:13,  2.50it/s]training loss: 0.3127:  17%|█▋        | 67/401 [00:40<02:13,  2.50it/s]training loss: 0.3126:  17%|█▋        | 67/401 [00:40<02:13,  2.50it/s]training loss: 0.2991:  17%|█▋        | 67/401 [00:40<02:13,  2.50it/s]training loss: 0.2797:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2797:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2820:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3023:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2488:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3290:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3047:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2855:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2990:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2776:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2915:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2730:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2915:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3024:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3366:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3010:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3117:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2703:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2688:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2640:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2472:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2741:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3016:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2957:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3237:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2851:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3084:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3168:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3160:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2661:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2762:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3002:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3128:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2952:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2734:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2709:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2529:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2818:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2838:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3411:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2444:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2239:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3163:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2507:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2874:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2882:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2924:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3039:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2803:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2844:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3177:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3054:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2341:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3202:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2808:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2620:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3012:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2507:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2470:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2598:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2812:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2480:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2611:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2997:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3625:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.1970:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3106:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2293:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2744:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2772:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2956:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3069:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3290:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2750:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3036:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.4108:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.4108:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3617:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2466:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2732:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2816:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2653:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3312:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2724:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2778:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2624:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3306:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2379:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2526:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2788:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3473:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2630:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3222:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2820:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2359:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2788:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2479:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2527:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2875:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2961:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2567:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2775:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2950:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3160:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3010:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2879:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3073:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2846:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2714:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3124:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3156:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2650:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3220:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3020:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2387:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2763:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2754:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3140:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3378:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2862:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2647:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3182:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3415:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2407:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3060:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3079:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2535:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2624:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2885:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2540:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3006:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2882:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2691:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2985:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2460:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3258:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3188:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2814:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2549:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3002:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2522:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2748:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2936:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3407:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2763:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2853:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2504:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2753:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2593:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2731:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2194:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3445:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2904:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2663:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3152:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.1539:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.1539:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3025:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2997:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2903:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2656:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2617:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2574:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3116:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2897:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2715:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2757:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3166:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2920:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2634:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2742:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2958:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2709:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2816:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2670:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2784:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3045:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3256:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2468:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2843:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3426:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3222:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2573:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2787:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2870:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3119:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2740:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2789:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3180:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2637:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3655:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3105:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2695:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2956:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2242:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2549:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3046:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2721:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2425:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3308:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2878:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3199:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2820:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3060:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2885:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3211:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2662:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3246:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2782:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3031:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2672:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3779:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2980:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2833:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2756:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3152:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2798:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2244:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2525:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3021:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2840:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2802:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2988:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2570:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2692:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3285:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2163:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2491:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2665:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2527:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3023:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2900:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2361:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3054:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2777:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.4971:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.4971:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2510:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2535:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2212:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2743:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2427:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2952:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.3255:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2493:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.3504:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2542:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.3043:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2590:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2736:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2562:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2648:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3021:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2624:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2382:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2889:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2440:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2773:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2721:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2696:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3240:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2657:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3128:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2679:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2611:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3164:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2736:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2694:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2433:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2955:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2566:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2987:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2784:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2952:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3037:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2563:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3306:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2392:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2595:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3049:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2496:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3292:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2705:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2531:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3213:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3052:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2908:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2980:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3030:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2768:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2594:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2349:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2970:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3001:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2583:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2516:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2883:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2909:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2849:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2640:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2572:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3416:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2800:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2477:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3066:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3363:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2738:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3197:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2967:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2869:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2457:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3141:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2829:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2925:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2902:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2349:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2349:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2543:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2726:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2694:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3173:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2585:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2814:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2565:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3092:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3068:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2748:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2501:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2724:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2982:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2930:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3004:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2473:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2766:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2892:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2838:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3098:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2802:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2448:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3090:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2798:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2557:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2657:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2587:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2313:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3450:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3300:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2458:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2515:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3047:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2831:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3164:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2721:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3093:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2197:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2912:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3618:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3270:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3148:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2776:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2795:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2639:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2421:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2702:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2492:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2852:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2450:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2907:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2711:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2585:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3086:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2697:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3111:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2391:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2834:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2671:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2289:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2194:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2978:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3246:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2336:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3208:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2884:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2617:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2603:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2799:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2556:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3035:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3017:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2572:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2917:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2439:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2332:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2959:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3222:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2647:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2647:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2666:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2852:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2798:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2862:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2922:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2298:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3203:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2977:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2724:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2994:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2791:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2683:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2480:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2627:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3356:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2597:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2508:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3002:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2985:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3418:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2587:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2926:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2764:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2829:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3108:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3190:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2897:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2758:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2620:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2648:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2543:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2368:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3018:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3165:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2421:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3230:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2704:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2961:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2481:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3335:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3004:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2879:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2649:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3237:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3420:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2500:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3035:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2879:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2545:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3144:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3263:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3031:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2664:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3031:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2674:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2550:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3092:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2913:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3128:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3177:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2482:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2548:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2750:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2841:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2738:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3335:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2832:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2616:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2724:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2278:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3205:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2707:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2881:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2983:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2830:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3457:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2340:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3035:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2011:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2011:  18%|█▊        | 73/401 [00:45<04:42,  1.16it/s]training loss: 0.2914:  18%|█▊        | 73/401 [00:45<04:42,  1.16it/s]training loss: 0.2858:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3304:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3122:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3032:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2975:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2193:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2731:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3268:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2730:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3260:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2955:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3317:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2994:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2635:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2692:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2621:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3514:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2766:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2214:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3179:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2988:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2912:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2329:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3057:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2566:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2150:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2984:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3636:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3020:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2920:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2466:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2488:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3051:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2773:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2556:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2718:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2971:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2314:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2475:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2981:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2811:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2471:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2686:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2102:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3052:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3651:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2820:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3103:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2622:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2407:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2985:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3256:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.1992:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2772:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3297:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3014:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2559:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2779:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2894:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2785:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2580:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2694:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3100:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2822:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2598:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2606:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2750:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2689:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3244:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2512:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3159:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2834:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2648:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2757:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3069:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2535:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2350:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2109:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2109:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2759:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3121:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2512:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2751:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2635:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3038:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2270:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2662:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2286:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3001:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3209:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2868:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3141:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2460:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2854:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2348:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2722:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2990:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2916:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2692:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2570:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2606:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2170:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3761:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2560:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2437:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2757:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2761:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2818:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2382:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2395:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2885:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2618:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2815:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3388:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2794:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2348:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2938:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3131:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3226:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2660:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2701:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2905:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2911:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2980:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2196:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2921:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2917:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2532:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2718:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2841:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2700:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2698:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2254:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2242:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2954:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3057:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3188:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3041:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3265:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2375:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2424:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2881:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2655:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2185:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2093:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2697:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2214:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2651:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2141:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3106:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2699:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2450:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2656:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2907:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2465:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3359:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2987:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2709:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2709:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2727:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2440:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2904:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3058:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2945:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3010:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2793:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2854:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2968:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3114:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3177:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2811:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3061:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2304:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2555:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2855:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2597:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2720:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2855:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3044:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2871:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3130:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3076:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2881:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3259:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3258:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2493:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2327:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2945:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2542:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3045:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3237:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3011:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2548:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2714:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2968:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3002:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2784:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2720:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2748:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2473:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3065:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2872:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3012:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2841:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2128:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2529:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3413:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2802:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2942:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2929:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2821:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2981:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2555:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3017:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2581:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2605:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2537:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3478:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3078:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3265:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3358:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2798:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2877:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3168:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3269:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3097:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2782:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2923:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2774:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2440:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3079:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2569:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2677:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2650:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2681:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2529:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2641:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2349:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2349:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2615:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2588:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.3151:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.3130:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2856:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2696:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2662:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.3133:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2036:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2271:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2709:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2944:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2677:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.3129:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2852:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2469:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2960:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3255:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2632:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2515:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3166:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2977:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3327:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3139:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2950:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2780:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3267:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2971:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2653:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2316:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2649:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2790:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3193:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3094:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2726:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3100:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2930:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3169:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2636:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2657:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2606:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2830:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2674:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2793:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3277:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2257:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2397:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3153:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2383:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2835:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3395:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3419:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2952:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2849:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2781:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2699:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2453:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2821:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3283:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2196:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2888:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2734:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2233:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2257:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2597:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2687:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2680:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2276:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3274:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2865:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2900:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2822:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3113:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3029:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2561:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2357:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2865:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2929:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3737:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3737:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3211:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2649:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2920:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3657:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2195:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.4000:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2988:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3015:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2882:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2897:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2913:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2773:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2951:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2862:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2556:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2679:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2963:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2237:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2720:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2483:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2620:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3187:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2618:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2654:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2775:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2466:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2659:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2418:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2804:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2960:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2511:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2825:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2830:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3057:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3659:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3031:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2498:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2845:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2990:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2495:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3136:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2710:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2898:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2454:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2526:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3198:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2470:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3258:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2884:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3251:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3461:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2355:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2719:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2796:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2392:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2882:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2432:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2539:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3035:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3461:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3363:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2307:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3079:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2848:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2809:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3059:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2401:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2976:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2547:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3255:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2817:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3089:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2578:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2943:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2700:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2446:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2768:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3384:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3603:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3603:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3660:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2358:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2766:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2086:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2577:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2936:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2521:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2171:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3099:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2744:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2769:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2402:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3025:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3030:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2993:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3071:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3158:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3480:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3077:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2453:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2768:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2526:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2896:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2986:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2931:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2993:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2966:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2854:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2929:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2611:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2410:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2799:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3615:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2556:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3014:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2830:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3036:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2494:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2718:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3248:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3304:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3040:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2325:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2620:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2744:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3402:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2926:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3095:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2441:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3065:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3068:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2832:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2713:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2949:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2493:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3179:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2993:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2362:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3361:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2723:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3227:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2935:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3110:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3767:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2644:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2666:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2460:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2503:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3134:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2884:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3291:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2627:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2763:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2326:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2592:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2315:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2487:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2575:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2944:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2944:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.1965:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2871:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.3534:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2965:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2356:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2584:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2172:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2288:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2727:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.3126:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2517:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2859:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2625:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2660:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2855:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2547:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.3038:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2836:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2628:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2602:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.3074:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.3052:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2638:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2532:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.3206:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.3293:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2802:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2321:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2773:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2765:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2121:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2750:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3143:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2349:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2464:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2720:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2634:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2542:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2241:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2366:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2717:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2795:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2813:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2815:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2995:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3181:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2466:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2534:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3149:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2909:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2427:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2336:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3116:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2181:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2330:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3059:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2529:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3360:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2820:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2667:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2973:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2667:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3792:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2851:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2703:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3200:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3415:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3175:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2169:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3009:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2060:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2457:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2737:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2749:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2724:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2729:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2916:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2837:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.1830:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.1830:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2773:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2523:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2320:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2891:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2656:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2506:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.1972:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2913:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2798:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2944:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2788:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3275:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3063:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2741:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2555:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2987:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3056:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3443:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3116:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2719:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3155:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2924:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3341:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2870:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3062:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2942:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2689:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2984:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2837:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2652:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2456:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2663:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2889:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2949:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2728:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3347:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2493:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2768:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2889:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3117:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3466:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2438:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3633:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2233:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3149:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2653:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.1970:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2649:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2839:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2498:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2693:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3205:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3130:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2707:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2672:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2397:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3244:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2155:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2877:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3461:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2361:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2744:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2594:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2643:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2649:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2223:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2604:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2617:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2817:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2933:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3136:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2918:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2762:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2662:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2671:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2818:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2933:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3402:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3251:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3251:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3126:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2267:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2554:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2866:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3062:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3175:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3063:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2790:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2934:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2880:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2524:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2504:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2322:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2668:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2796:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3234:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.4072:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2799:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2373:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3219:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2964:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2741:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2783:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2626:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2532:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3333:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3410:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2513:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2819:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2976:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2785:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2672:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2763:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3320:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3155:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3480:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2986:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2609:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2715:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3299:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2737:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3182:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2766:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2520:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3269:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2904:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3532:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2144:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2125:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2597:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3457:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3713:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3473:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3094:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3197:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2899:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2937:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3114:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3203:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2645:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2996:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2938:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3046:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2670:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2227:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2865:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2808:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3034:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3170:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2870:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2709:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.1977:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2651:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2911:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2800:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2584:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2974:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2534:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3185:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3185:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2763:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2483:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3016:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2608:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3487:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2815:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3145:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2229:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3010:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2884:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3607:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3161:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2506:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2253:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3443:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3234:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2909:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2647:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2719:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2271:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2715:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3374:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2916:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2731:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2591:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2862:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2645:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2567:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2551:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3261:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3168:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2987:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2715:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2868:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2832:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2947:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3009:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3643:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2970:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2905:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2527:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2504:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2551:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3030:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2872:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2702:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2679:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2385:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3348:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2663:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2448:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2311:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2674:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2559:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2715:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2870:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2038:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2479:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2717:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3012:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2731:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3032:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2577:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2263:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2840:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2964:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2973:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3606:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3234:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2636:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3176:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2602:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2361:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3034:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2572:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2839:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2598:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2623:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2838:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2838:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2207:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2856:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2041:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2869:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3373:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2545:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3471:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2479:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2644:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2568:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3152:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2408:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2494:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2814:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3443:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2596:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2467:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2242:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2478:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3306:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2993:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2730:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3076:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2324:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2918:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2682:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2274:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2674:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2795:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2650:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2644:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3165:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2921:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2802:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2862:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3028:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2564:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2584:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2532:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2312:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2717:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2842:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2810:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2915:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2211:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3039:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2681:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2432:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2529:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3030:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2598:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2556:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2639:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3122:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2715:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3125:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3187:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2569:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2293:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2408:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2779:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3094:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2743:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2460:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2958:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3139:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2591:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2961:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2498:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2905:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2463:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2607:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3298:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2746:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2207:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2476:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2710:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2553:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3593:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3593:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3124:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2826:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3483:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2491:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2895:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2919:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3359:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2790:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2615:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2738:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2984:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2725:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2985:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2784:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3100:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2442:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3222:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2636:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2707:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2692:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2262:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3218:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3347:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2590:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2915:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2733:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2566:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2563:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2994:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3312:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2844:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3119:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2675:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2692:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3134:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2452:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3340:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2538:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2713:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2793:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3081:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3276:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2899:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2816:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2663:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3281:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2465:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2747:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2404:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2848:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2885:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2741:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2148:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2503:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2439:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3098:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2637:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2484:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2567:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2627:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.3197:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2626:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.3226:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2921:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2799:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2860:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2706:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2638:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2859:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2639:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2902:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.3025:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2529:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2517:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2963:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.3227:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2861:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2752:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.5050:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.5050:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3154:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3154:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2643:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2675:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2430:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3338:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3221:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2981:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3101:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3048:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2151:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2687:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2528:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2667:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2756:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2756:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2555:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2134:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2738:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2788:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3015:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2271:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2593:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2853:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2178:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2436:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2408:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2877:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2826:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2850:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2510:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2410:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2247:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2863:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3367:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2547:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3295:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2570:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2994:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3081:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2200:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3017:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2094:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2989:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3092:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3072:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3185:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2681:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2669:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2452:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2805:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2795:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3217:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2641:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2608:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2808:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3400:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3387:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2953:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2771:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2648:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2290:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3226:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2425:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2710:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3328:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3173:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2936:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3248:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2971:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2077:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3082:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2714:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2488:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2828:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2689:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3010:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2416:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2260:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2260:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2895:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2667:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2279:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2197:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2830:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2991:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3123:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2737:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2411:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3638:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3274:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2725:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3401:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3031:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2942:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2864:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3043:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2556:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2505:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3573:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2441:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2476:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2928:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3042:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3217:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3040:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2986:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2726:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2727:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3081:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2495:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2768:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2338:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2737:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2539:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2746:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3140:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2640:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2969:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2780:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3162:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2651:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3036:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2748:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2462:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2569:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2295:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3374:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3065:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2969:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2456:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2457:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2362:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2769:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3040:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2756:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3351:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2592:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3171:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2540:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2180:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2346:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3324:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2846:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2543:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3610:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3130:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2513:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2785:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2450:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2723:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2247:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3453:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2282:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2576:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3132:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2788:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2323:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3554:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3554:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.3522:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2393:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2956:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.3479:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2583:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.3080:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2588:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2617:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2556:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2935:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2687:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.3250:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2940:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2924:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2554:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2604:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3162:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2541:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2609:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3148:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2244:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3059:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2951:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2322:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2873:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2884:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3106:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2733:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2674:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2226:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2608:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3241:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2645:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2467:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3168:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2535:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2874:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2756:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2910:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3297:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2975:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2787:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2676:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2714:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2646:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2693:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2884:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2799:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2464:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2585:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3240:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2642:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2642:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2437:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2553:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3280:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2616:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2353:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2818:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2807:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2130:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2903:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2767:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3094:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3019:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2979:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2490:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2905:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2178:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2740:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2794:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2728:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2984:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2465:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2609:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2811:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2533:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2767:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2335:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2335:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2970:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3523:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3047:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3197:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2763:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2774:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2899:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2531:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3111:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2616:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3112:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2737:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2716:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2940:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2878:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3429:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2825:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2308:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2260:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3006:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2872:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2858:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2472:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2866:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2367:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2545:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2632:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3252:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2827:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2718:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2569:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3139:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2105:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2279:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2556:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2758:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3224:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2443:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3174:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2732:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2688:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3094:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3059:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2526:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2493:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2423:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2780:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2858:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2640:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2525:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2467:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2887:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2458:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2205:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2516:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2556:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3066:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2926:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2777:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3431:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3177:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2588:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2360:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2461:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2981:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2389:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3437:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3679:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2661:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2705:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2853:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3578:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2471:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2629:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2557:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3751:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2607:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2582:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.6333:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.6333:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2597:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3335:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2591:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2600:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2779:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2568:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2279:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2855:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2431:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2540:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2478:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3345:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2690:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2955:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2600:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3106:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2963:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2858:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2695:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3318:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2821:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2628:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2676:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2199:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.1775:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3007:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2861:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2630:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2798:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2355:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2532:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.1840:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2545:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2040:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3369:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2706:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2622:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2600:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3047:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2587:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3480:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3114:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2842:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2388:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2335:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3520:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2700:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3108:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2547:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2427:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2980:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2825:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2498:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2566:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2893:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2615:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2791:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2800:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2481:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3109:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2494:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2348:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3661:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2603:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2921:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2889:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2874:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2881:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2376:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2757:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3378:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2602:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2693:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2959:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3521:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2830:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2903:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2501:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.4741:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.4741:  22%|██▏       | 90/401 [00:53<02:01,  2.56it/s]training loss: 0.2801:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3454:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3193:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2915:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2552:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3120:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3102:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3045:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2759:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2323:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2714:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2765:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2142:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2428:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2233:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2738:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3162:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2321:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2992:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3037:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2801:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2768:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2893:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2805:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2345:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2503:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3354:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2728:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2341:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2719:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2929:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2903:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3006:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2787:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2346:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2474:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3311:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2850:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.1965:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3029:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2426:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3104:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2506:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3115:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2082:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3740:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2673:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2561:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3142:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2756:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2424:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2555:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3387:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2487:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2689:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3052:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2794:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3248:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3312:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2705:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3349:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2253:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2760:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3453:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2801:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2943:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2595:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2504:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2727:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2806:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3614:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2624:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2851:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2387:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2609:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2668:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2281:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2792:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.4729:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.4729:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2687:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2942:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2548:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2200:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2679:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3150:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3125:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2307:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2493:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2742:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3000:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2864:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2117:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3279:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2946:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2709:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3052:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2589:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3072:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2958:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2239:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2352:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3124:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2778:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2677:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2759:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2467:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2776:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2202:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2771:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2342:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2981:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2924:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2525:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2251:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2294:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2752:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2959:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2469:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2534:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2451:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2809:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2548:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2455:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2835:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2938:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2523:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2748:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3001:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2675:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2170:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3033:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3003:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3046:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3260:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2608:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3000:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3016:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2519:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3334:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2856:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2471:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2656:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2629:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2341:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2903:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2571:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2928:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2919:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2531:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2150:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2839:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2676:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2915:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2652:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2673:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3246:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2832:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2314:  23%|██▎       | 91/401 [00:57<05:32,  1.07s/it]training loss: 0.2314:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3005:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2225:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2916:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2701:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2375:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2584:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2762:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2587:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3129:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3139:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2463:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3143:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2406:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2468:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2621:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2382:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3140:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3050:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2887:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2540:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2589:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2263:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2451:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2891:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2881:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3097:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2961:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3007:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2467:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2880:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3019:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3351:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2614:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2753:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3606:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2791:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2444:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2671:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3613:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3005:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2695:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2830:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2806:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3071:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2727:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2815:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2223:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3053:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3024:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2984:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2698:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2343:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2621:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2437:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2635:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2918:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2162:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2700:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2740:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2232:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2530:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2027:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2632:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2905:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2884:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2306:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3144:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2990:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2864:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3123:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2142:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2925:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2793:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2649:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2878:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2804:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2695:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3404:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2182:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2182:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2576:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2273:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2961:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2347:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2694:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2333:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2901:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2907:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2742:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3458:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2914:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2670:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2335:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2511:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2814:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3495:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2969:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3054:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3123:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2756:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2541:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3132:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2966:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2931:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2802:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2670:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2446:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2438:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2849:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2428:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3265:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2715:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3137:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2769:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2211:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2731:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2446:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2721:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2317:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2801:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3186:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2584:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2604:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2667:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2930:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2726:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2727:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2504:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2708:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2890:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3184:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2696:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2807:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2504:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3619:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2390:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2671:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2915:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3232:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2832:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3011:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2858:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3218:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2513:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2752:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2625:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3244:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2745:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2809:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3654:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2771:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2681:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2369:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2539:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2504:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.1906:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2935:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3109:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.4083:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.4083:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3414:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2883:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3043:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2924:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2943:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2983:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2645:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2590:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2660:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2363:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2419:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3004:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2695:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2914:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2751:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3177:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2803:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3300:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2604:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2417:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2916:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3095:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2976:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3424:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2251:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3128:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2657:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2814:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3477:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2833:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2891:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2946:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3369:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3629:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2652:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2847:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2656:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3258:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2988:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2645:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2291:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2215:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3051:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2532:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2845:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2769:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2864:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2933:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2270:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3266:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3469:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2868:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3006:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2961:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2815:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2456:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3056:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2943:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2450:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2485:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2946:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2334:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2299:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2540:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3160:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2784:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2269:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2583:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3021:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2969:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2406:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3127:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3066:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2602:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2297:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2944:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2966:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2785:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2607:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2607:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2940:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2753:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2896:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2414:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2982:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2823:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2825:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2986:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2372:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2718:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2856:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2580:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2901:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2226:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3158:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3152:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3142:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2641:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2260:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2684:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2398:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2571:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3284:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2663:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3059:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2560:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2659:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3099:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2889:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2718:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3004:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2593:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2805:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2619:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2909:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3869:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2841:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2902:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2438:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2575:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2880:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2575:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3091:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2979:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2904:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2435:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3068:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3091:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2382:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2862:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3239:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2811:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2496:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.1972:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2345:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2030:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2948:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2749:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3163:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2984:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3030:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3265:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2240:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2755:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2680:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2832:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3044:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2210:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2810:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2685:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3044:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2348:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2818:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2668:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3134:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3107:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3067:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2516:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3155:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3155:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3146:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2731:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3228:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3269:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2324:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2151:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2322:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2432:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2612:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2988:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3125:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3086:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3278:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3196:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2401:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2997:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2773:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2941:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2450:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2694:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2844:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2942:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2196:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2796:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2874:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2991:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2189:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2740:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3134:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3139:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2584:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2395:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2591:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3111:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2718:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2156:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2649:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2830:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2649:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3233:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2784:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2487:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2951:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2673:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2699:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2383:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2620:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2670:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2708:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2672:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3616:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2495:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2851:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2744:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2881:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2728:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2855:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2830:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2191:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2531:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2658:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3197:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2371:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3137:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2116:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2788:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2832:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2887:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2931:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2480:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2684:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3522:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2597:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2958:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3157:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2779:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2670:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2457:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2738:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2738:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2716:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3070:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2570:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3123:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2755:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2640:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2370:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2895:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3377:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3026:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2500:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2634:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2285:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2852:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3222:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2706:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2944:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3028:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2754:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2489:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3203:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3135:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2987:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3134:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2862:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2692:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2595:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2693:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2772:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2692:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2628:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2766:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3087:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2681:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2582:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2642:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2872:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2650:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2577:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3032:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3430:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2469:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3055:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3146:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3165:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3377:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3464:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2154:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2749:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2589:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2813:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2024:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2481:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2601:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3063:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3381:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2349:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2476:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2795:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3175:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3144:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2651:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2589:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2649:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3055:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2362:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3094:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2990:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2415:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2457:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2946:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3185:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2435:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2753:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3124:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3172:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2688:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3354:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2957:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2957:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2393:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2896:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3069:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3002:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2823:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2456:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3145:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2198:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2975:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2784:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2423:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3000:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2483:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2885:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2395:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2808:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2455:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2543:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2793:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3198:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2481:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2081:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2758:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3139:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2838:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3406:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3040:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2583:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3442:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2729:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2820:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2577:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2907:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3281:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3025:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2716:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2496:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2442:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2319:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2520:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2379:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3477:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2659:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3033:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2777:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3526:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2745:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2702:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2762:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3105:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2489:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3341:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2660:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2833:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3476:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3412:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3680:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2547:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2220:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2831:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3249:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2562:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3295:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2788:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2866:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2345:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2932:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2698:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2293:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2902:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2704:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3248:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2651:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2039:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2402:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2695:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2921:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2854:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3033:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3033:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2606:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2283:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2465:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2842:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2183:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3457:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2678:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2887:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2492:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2487:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3966:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2562:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2871:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2929:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2321:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2582:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2475:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2634:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2559:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3398:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2795:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2514:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2736:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2998:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2635:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2511:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2706:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2728:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2556:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2726:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2210:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2589:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3290:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2960:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3224:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3379:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2816:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2850:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2648:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2313:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2923:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3101:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2665:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2851:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2775:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2530:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3109:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2891:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2706:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2423:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2516:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3397:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2555:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2761:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3057:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2230:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2926:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2816:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3345:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2846:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2586:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3017:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3350:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2901:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3157:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2615:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3038:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2662:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3009:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2276:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3356:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2480:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3045:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2890:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2559:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3437:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2803:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2466:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.1534:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.1534:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2946:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2300:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2788:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2844:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3174:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2552:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3118:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2895:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2887:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2971:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2425:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2541:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2793:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3200:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2701:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2558:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2335:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2760:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3229:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2746:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3181:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.1974:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2476:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2558:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2828:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2578:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3075:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3240:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2618:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2934:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2588:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3112:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2728:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2985:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2847:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2602:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3002:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2376:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2366:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2450:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2455:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2485:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2988:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2563:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3087:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3347:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2522:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2406:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2199:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2931:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2749:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2753:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2773:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2135:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2807:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2851:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2811:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2789:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2722:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2718:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2847:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2999:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2441:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2409:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2998:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2596:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.3181:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2605:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2791:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2917:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2585:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2907:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2595:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.3204:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2885:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2655:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2898:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2158:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2384:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2384:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2932:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2855:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3188:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2947:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2533:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2715:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3341:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2770:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3154:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2837:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2625:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2620:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3205:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2547:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3042:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3057:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3565:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.1950:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2248:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2386:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3090:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3533:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2654:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2307:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2817:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3123:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2510:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2654:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2359:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3148:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2854:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2956:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3254:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2371:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2845:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3202:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2914:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2313:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2721:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3518:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2819:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2593:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2466:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3008:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2512:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2468:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2868:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2647:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3005:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2585:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3079:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2836:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2642:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2268:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2973:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2489:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2730:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2826:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3297:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2675:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2972:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3132:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2651:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3594:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3607:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2886:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2215:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2848:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2894:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2588:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2774:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3097:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2719:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3263:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2493:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2810:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2419:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2968:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.4606:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.4606:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2273:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2667:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2474:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2466:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3314:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3163:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2097:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2948:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2706:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3399:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2899:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3222:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2517:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2650:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2584:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2294:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3003:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2467:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3001:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2373:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2852:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2775:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2386:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2864:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2357:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2181:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2728:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3334:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3080:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2458:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2507:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2079:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2552:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2917:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2611:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2356:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2733:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2667:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3140:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2604:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2699:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2571:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2839:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2746:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2976:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2969:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2726:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2609:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2775:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3250:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3705:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2632:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2452:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2758:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2897:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2350:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3178:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2422:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2811:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2803:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2529:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2152:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3442:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2478:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.1746:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2322:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2447:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.2538:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.3052:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.2954:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.2390:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.2729:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.2620:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.2662:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.3161:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.2612:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.3024:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.2536:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.3321:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.3321:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2825:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2562:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3326:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2954:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2741:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2558:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2664:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2427:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2466:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2675:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3187:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2910:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2405:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2360:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2038:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2526:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2497:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3051:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2515:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2677:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2438:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3134:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2955:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2464:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2626:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2457:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2493:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2442:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2898:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3069:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2868:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3171:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2495:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3043:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3483:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3264:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2861:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2661:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3039:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2641:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2440:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3330:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2551:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2926:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2601:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2304:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2944:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2743:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2543:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2637:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3270:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2288:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3025:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2467:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2403:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2602:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3214:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2839:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2542:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2606:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2420:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2286:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2792:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3149:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2523:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2489:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3233:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2687:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3242:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3077:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2571:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2714:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2862:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2679:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2777:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2577:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2418:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3189:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2902:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2902:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2917:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2706:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2164:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2766:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2611:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2924:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2990:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2696:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2783:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2747:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2393:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2557:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2976:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3323:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2726:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3109:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3266:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3257:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2744:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2458:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2461:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3272:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2114:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3164:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3111:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2866:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2788:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2897:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3022:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2844:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2652:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2200:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2312:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2760:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2355:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2908:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2647:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2988:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3248:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2651:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2724:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3049:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2612:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2489:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3050:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2710:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2571:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3156:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2533:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2390:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2745:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2174:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2608:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2843:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2991:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2644:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2928:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2915:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2840:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2999:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2507:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3350:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2963:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2664:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2925:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2619:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2983:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2822:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2750:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3159:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2790:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3192:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2690:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2242:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2666:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2897:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2830:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2783:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3946:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3946:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3324:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2520:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2948:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2118:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2552:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2817:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2928:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2787:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3070:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2135:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2474:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2333:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2613:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2379:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2667:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2275:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2841:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3042:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3166:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2296:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2366:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3625:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2353:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2468:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2644:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2667:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2882:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2857:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2428:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2676:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2470:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2797:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2334:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3293:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3069:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3143:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2447:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2826:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2773:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2961:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3503:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2436:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2468:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2045:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3111:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3042:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2095:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2461:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3350:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3161:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2777:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2991:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2281:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2541:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2690:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2487:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2701:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2974:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2626:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2210:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2317:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2763:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2794:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2153:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2890:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.3375:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2805:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2016:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2489:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.3211:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.3016:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.3270:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2784:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2669:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2507:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2601:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2590:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2512:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2380:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2380:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2905:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2563:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2456:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2831:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2687:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2675:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2430:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2541:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2457:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2641:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2461:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2376:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2427:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2454:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2535:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2631:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2691:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2590:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2890:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2836:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2624:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.3043:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2279:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2814:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.3101:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2537:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2872:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.3463:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2146:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2784:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2980:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2819:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2886:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2635:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2599:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2227:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2755:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2580:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2961:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2533:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2439:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2709:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2536:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.3426:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2959:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2956:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2233:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2542:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2832:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2686:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2503:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2540:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2359:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2171:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2144:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2832:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2846:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2702:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.3597:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2555:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2533:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2691:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2601:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.3177:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2842:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2947:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2737:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2525:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2713:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2482:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2803:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2353:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2623:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2824:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.3250:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2796:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2299:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2874:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2123:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2123:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2602:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2324:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2843:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2969:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.1689:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2675:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.3257:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2699:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2396:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2848:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2957:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2725:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.3040:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.3205:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2721:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2814:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2781:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2654:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2501:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2593:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2961:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3102:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2884:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3168:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3201:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2772:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2489:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2481:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2252:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3208:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3022:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3211:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2760:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3096:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2476:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2978:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3071:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2681:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2694:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2274:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2595:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2946:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2559:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2886:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2403:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2833:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3058:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3245:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2920:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.1774:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2426:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2280:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2429:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2814:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2761:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2733:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2841:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2756:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2826:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2621:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2719:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2693:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2470:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2917:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2779:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2996:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2409:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3351:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2881:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2596:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3143:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3137:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2959:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2784:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2190:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2785:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2351:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2832:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2851:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2851:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2958:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2369:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2766:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2282:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2397:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3117:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2405:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2294:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2683:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2705:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2835:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2445:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2789:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2857:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3168:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2475:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2920:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2637:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2528:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3232:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2946:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2907:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2488:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3004:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3289:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2207:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2223:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2943:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2673:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2354:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2519:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2538:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3043:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2935:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2388:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2640:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2812:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3166:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2407:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2251:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2905:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3174:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2560:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2788:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2346:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2892:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3387:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.1937:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2961:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2610:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2944:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2275:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2469:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2889:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3262:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2137:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2323:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2056:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2592:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2923:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2324:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2553:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2415:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3619:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3313:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2984:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2210:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2589:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2564:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2259:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2515:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2386:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2390:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2642:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2553:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2773:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3228:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2997:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3842:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3842:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.3249:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2914:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2619:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2851:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2310:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2728:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.3147:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2613:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2754:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2518:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2875:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2502:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2104:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2962:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2487:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2685:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2418:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2559:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2648:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2411:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2180:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2842:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2376:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2294:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2689:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2282:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2826:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2372:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2521:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2428:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2986:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2596:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2777:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2231:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2678:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2323:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.3647:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2583:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.3286:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2661:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2365:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2802:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2935:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2231:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.3011:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2205:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2522:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.3197:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2376:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.3056:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2440:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2090:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2381:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2799:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2762:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2317:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.3002:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2252:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2522:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2537:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2561:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2847:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2350:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2367:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2786:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2506:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.3107:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2779:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2623:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2826:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2635:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2646:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.3534:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2930:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2625:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2427:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2445:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2924:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2032:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2032:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3108:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2831:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2488:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2615:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2616:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2684:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2280:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2358:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2747:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2802:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2469:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2170:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2682:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3094:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2690:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2769:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3217:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2376:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2668:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3407:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2587:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2346:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3135:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2778:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2514:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2772:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2931:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2959:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2253:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2994:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2437:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2442:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2674:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2897:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3007:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2634:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2774:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3296:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2507:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2976:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.1958:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2643:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2487:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2611:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3206:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3106:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2556:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3232:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2519:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2331:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2353:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2638:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2788:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2143:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2648:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2648:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2455:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2941:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2175:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2144:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2999:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2901:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2972:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2741:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2313:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2390:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2713:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2847:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3049:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2632:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2814:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2812:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2524:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2433:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3045:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2877:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2794:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2143:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3180:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3180:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2328:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3121:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2470:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2594:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2640:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2460:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3432:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2462:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2426:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2504:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3370:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2725:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3285:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2255:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2784:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2933:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2481:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2362:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3022:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2234:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2741:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3074:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2769:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2850:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2626:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2056:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3606:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3221:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3188:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3070:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2950:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3082:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3364:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2266:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2973:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3243:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2843:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2623:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2956:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2601:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3033:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3163:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3708:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2210:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2835:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3146:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2791:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2905:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2329:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2499:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2229:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2792:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3246:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2868:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2674:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2442:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2165:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2578:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2548:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2724:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2242:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2918:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2577:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3041:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2852:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2683:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2686:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2563:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2656:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2613:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.3323:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2124:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2864:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2724:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2813:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.3014:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2744:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2983:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2107:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2107:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2731:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2573:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2410:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2496:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2950:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2834:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2946:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3317:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2392:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3373:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2365:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2598:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2632:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3040:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2840:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2767:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2550:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2786:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2428:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2339:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2727:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2503:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2349:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3111:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2674:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2954:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2539:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2780:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2166:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2404:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2550:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2774:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3327:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2977:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2675:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2530:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2694:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2864:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3028:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2695:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2995:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2578:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2793:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2936:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2935:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3081:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2276:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2425:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2083:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2267:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.1823:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2765:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2839:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2522:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3351:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2737:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2917:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2700:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2567:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2803:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2279:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2992:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2539:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2506:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2497:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2370:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2655:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2640:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2531:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2864:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2945:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2431:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2771:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2352:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2394:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3035:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2903:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2705:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2995:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2995:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2739:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2396:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2707:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3171:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2100:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2790:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2875:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2826:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2837:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2368:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2724:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2718:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2649:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2657:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2577:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2332:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2905:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2474:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2692:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3289:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2370:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3131:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2786:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2385:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2935:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2969:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2358:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2081:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2648:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2519:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2370:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2381:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2792:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2331:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2470:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2376:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2590:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3040:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2488:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2345:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2814:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2758:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2975:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2423:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2808:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2889:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3249:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2363:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3131:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2652:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2569:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2949:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2591:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2638:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2607:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2863:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2433:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3206:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3169:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2980:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2785:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3123:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3049:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3073:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2494:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2427:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.1880:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2190:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2599:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2797:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2338:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2441:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2538:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2816:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2984:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2708:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3291:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2803:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.1807:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.1807:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2259:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3247:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2610:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2214:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2351:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2387:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2782:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2958:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2493:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2279:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2456:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3004:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2665:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2783:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2456:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2753:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2667:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2775:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2816:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3528:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2878:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3586:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2879:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2252:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2361:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2762:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2449:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2595:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2875:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3027:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2952:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2243:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3431:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2623:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2912:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3445:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2190:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2512:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2239:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2551:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2686:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2771:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2761:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2958:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2463:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3148:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2718:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2769:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2694:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2771:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2461:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.1942:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2353:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2471:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2744:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2590:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2049:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3065:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2242:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2389:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2833:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3078:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3020:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2254:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2565:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2117:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2929:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3785:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2371:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2804:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2577:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2795:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2119:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2465:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2255:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2452:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2260:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2807:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.1640:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.1640:  29%|██▊       | 115/401 [01:09<02:24,  1.98it/s]training loss: 0.3354:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2994:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3238:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2842:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2671:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2921:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3162:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2336:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2410:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2914:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2804:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2692:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2694:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2827:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2695:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2228:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2451:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2422:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2517:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2912:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2104:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3260:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3145:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2265:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2562:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2405:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2544:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2339:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2597:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2531:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2710:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2089:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2325:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2733:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2904:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2140:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2581:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2996:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3097:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2620:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.1730:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2614:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2457:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2878:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2572:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2732:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2151:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2730:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2333:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2240:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2568:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2577:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2849:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2685:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2336:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2614:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3117:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2305:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2937:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2413:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2601:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2573:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3126:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2711:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3118:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2391:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2484:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2399:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3055:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2844:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2261:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2557:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2962:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2773:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2642:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2118:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2752:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2851:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2345:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2345:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2905:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3013:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3050:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2786:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3148:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2306:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3182:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2425:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3295:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2293:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2160:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2680:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2386:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2107:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2156:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2706:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2984:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2581:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2888:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2590:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2790:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2435:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2817:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2553:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2601:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3393:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2175:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2388:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2800:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2360:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2436:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2167:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2743:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2943:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2026:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2843:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.1946:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2077:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3118:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2825:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3154:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2169:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2614:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2374:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2943:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2690:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3053:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2575:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2480:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2851:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2550:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2897:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3513:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2603:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3008:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2420:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3495:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2667:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2703:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3241:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2653:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2664:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2502:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3361:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2875:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2943:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2642:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2288:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3023:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2509:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2442:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3026:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2124:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2860:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2551:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2231:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2700:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2363:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.1558:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.1558:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2274:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2276:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2947:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2397:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2643:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2816:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2540:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2470:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2657:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3403:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2944:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2432:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2696:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3373:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2176:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2323:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2592:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2845:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2558:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3060:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2291:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2506:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2690:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2877:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2869:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3189:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2421:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2412:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2675:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2494:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2765:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2575:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2646:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2042:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2764:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2842:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2817:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2619:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2271:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2745:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2907:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2957:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2999:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2477:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2106:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3353:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3094:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3163:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.1978:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3074:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2759:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2527:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2996:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2970:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2619:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2661:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2946:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2327:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3316:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2872:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2311:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2996:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2550:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2300:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2959:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2667:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2487:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3082:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3083:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2238:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2585:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2581:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2863:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2581:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2405:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3290:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2612:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2721:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.4335:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.4335:  29%|██▉       | 118/401 [01:10<01:49,  2.60it/s]training loss: 0.2795:  29%|██▉       | 118/401 [01:10<01:49,  2.60it/s]training loss: 0.2604:  29%|██▉       | 118/401 [01:10<01:49,  2.60it/s]training loss: 0.2120:  29%|██▉       | 118/401 [01:10<01:49,  2.60it/s]training loss: 0.2566:  29%|██▉       | 118/401 [01:10<01:49,  2.60it/s]training loss: 0.3017:  29%|██▉       | 118/401 [01:10<01:49,  2.60it/s]training loss: 0.2661:  29%|██▉       | 118/401 [01:10<01:49,  2.60it/s]training loss: 0.2315:  29%|██▉       | 118/401 [01:10<01:49,  2.60it/s]training loss: 0.2734:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2856:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2349:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2647:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2470:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2987:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2192:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2821:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2607:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2304:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2550:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3033:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2593:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2528:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3348:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2590:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2632:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2494:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2112:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2628:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2724:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2599:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2722:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3316:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3131:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3033:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2575:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.1948:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2544:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2102:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2512:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2362:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2317:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2416:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2732:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3042:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3080:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2481:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2458:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2376:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2559:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2782:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2359:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2872:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2633:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2509:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2834:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3006:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3049:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2067:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2448:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2324:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2602:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2491:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2514:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3193:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2238:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2691:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2150:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2502:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2727:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2750:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2276:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3103:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2600:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2684:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2742:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2545:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2429:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2914:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3077:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.1388:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.1388:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2763:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2741:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2210:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2531:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2682:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2451:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2311:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2527:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.1839:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2828:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2974:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2604:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2604:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2523:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2508:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2086:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2725:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2893:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2944:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3235:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3121:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2816:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2688:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2674:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2685:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2221:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2492:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2691:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2276:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2655:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2394:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2679:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3011:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2918:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2422:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.1819:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2634:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2664:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2745:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2445:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3420:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3263:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2748:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3137:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2468:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2940:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2549:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2461:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2232:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3035:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2048:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2871:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2353:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3172:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2687:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2813:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3421:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2274:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2602:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2721:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3073:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2048:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2362:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2469:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2541:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2787:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2101:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2483:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2829:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2243:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2379:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2598:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2598:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2692:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2462:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2154:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2106:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2173:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3171:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3171:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2612:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2887:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2454:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2394:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2464:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2705:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2137:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2664:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2335:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2651:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2583:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2291:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2789:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.3339:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2704:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2493:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2393:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2685:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2274:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2746:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2875:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.3347:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2596:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2462:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2272:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2944:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2826:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.3053:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2513:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2472:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2161:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2232:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.1953:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2189:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2261:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2800:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2723:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2700:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2237:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2786:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2452:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2652:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2522:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2304:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2182:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2652:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2750:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2577:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2626:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2238:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2547:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2895:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2098:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2166:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.3027:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.3034:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2632:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2886:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2406:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2619:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2732:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2823:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.3358:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2364:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2508:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2641:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.1784:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2914:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2824:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2451:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2591:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.3148:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2898:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2684:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.1961:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2309:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2824:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2304:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2880:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2880:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3396:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2357:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2912:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2549:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2422:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3043:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2853:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2219:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2870:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2697:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2764:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2842:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2361:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3134:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3028:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2414:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3103:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3121:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2424:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2798:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2527:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2201:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.1983:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2264:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2646:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2207:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2880:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3812:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2654:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2518:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2847:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2282:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2733:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2423:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2750:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3190:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2952:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2849:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3030:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2714:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2761:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2484:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2898:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2684:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2501:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3244:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2581:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2089:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2099:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2441:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2615:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2288:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3069:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2478:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2655:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2575:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2331:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2725:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2172:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2525:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2934:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2916:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2761:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2739:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2842:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3252:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2680:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2513:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2790:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2160:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2765:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2366:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3078:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2327:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2482:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3039:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2829:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2465:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2754:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2754:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2282:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2362:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2873:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2283:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2889:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2170:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2250:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.3578:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2635:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2662:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2448:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2463:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2668:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2628:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2719:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2650:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2080:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2993:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2316:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2453:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.3292:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2727:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2873:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2517:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2157:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2472:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2541:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2362:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2487:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2549:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2239:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2425:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2298:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2572:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2066:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2713:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2714:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.3135:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2175:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2428:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2058:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2682:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2845:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2378:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2632:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2426:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2607:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2867:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.3382:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2733:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2302:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2468:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2701:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2393:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2513:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2399:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2578:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2290:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2772:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2306:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2269:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2305:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2428:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2396:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2528:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2736:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2866:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2365:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2256:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2441:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2247:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2439:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2768:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2534:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2362:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2757:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2478:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2229:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.3055:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.3055:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2304:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2850:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2402:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2360:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2874:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2108:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2114:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2495:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2653:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2739:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2546:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2709:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2814:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2395:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2402:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2231:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2526:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2762:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2969:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2532:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2781:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2279:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2450:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2795:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2394:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2578:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2379:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2456:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2918:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2767:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.3157:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2341:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2577:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2232:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2566:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2753:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2807:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2514:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.3045:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2606:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2537:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2943:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.3028:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2496:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2494:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2483:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2780:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2810:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.3213:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2177:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2557:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2013:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.3009:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2600:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2315:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2764:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2386:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2577:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2125:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2579:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2564:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2589:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2642:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2925:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2403:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2327:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2093:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2281:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2480:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.3149:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.3256:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2364:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2919:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2443:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2807:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2379:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2038:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2418:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2362:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2362:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2345:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2629:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2772:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2313:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2845:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2429:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2138:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2940:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.3058:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2871:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2385:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2842:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2606:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2465:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2918:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.1990:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2600:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2684:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2604:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2331:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2435:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2650:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2507:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2731:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2329:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2490:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2454:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2306:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2607:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2788:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2322:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2618:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2356:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2412:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2988:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2151:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2753:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2662:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2521:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2452:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2848:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2596:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2962:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2293:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2531:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2557:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2057:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2606:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2781:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2607:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2909:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2350:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2746:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2485:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2654:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2156:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2691:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2687:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2327:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2333:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2318:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2022:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.1996:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2546:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2659:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2808:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2920:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2517:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2492:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2775:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2285:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.3037:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2645:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.3234:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.3028:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2900:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2321:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2681:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2806:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2806:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2511:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2614:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2541:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2856:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2305:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2406:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2730:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2401:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2476:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2948:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2945:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.3007:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2669:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.1999:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2215:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.3027:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2507:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2580:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2878:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2233:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2241:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2434:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2449:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.3068:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2748:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2422:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2055:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2809:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2716:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.3045:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2048:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2380:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2451:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.3168:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2556:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2588:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2199:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2749:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2655:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2443:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2271:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.3024:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2626:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2800:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2942:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.3021:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2861:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2862:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2516:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2734:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2094:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2357:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2937:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2625:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2803:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2929:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2798:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2243:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2491:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2649:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2777:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2481:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2450:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2709:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2588:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.3307:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2155:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2815:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2383:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2996:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2719:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2581:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2138:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2546:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2767:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2843:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2391:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2435:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2707:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2707:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2802:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2991:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2459:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.1870:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2948:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2350:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2536:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2563:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2137:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2500:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2123:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2820:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2125:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2568:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2459:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2715:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2626:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2604:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2554:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2317:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2318:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2607:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.1894:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2934:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2390:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2911:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2382:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2223:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2462:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2474:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2608:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2461:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2631:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2698:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2444:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2784:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2397:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2676:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2502:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2351:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2049:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2533:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2508:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2176:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2277:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.3236:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2429:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2501:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2916:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.3389:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2361:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2000:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2104:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2171:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2583:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2884:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2143:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.3157:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2391:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2622:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2759:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2234:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2040:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2156:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2749:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2335:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2208:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2713:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2679:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2457:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2998:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.3605:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2728:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2651:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2209:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2692:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.3075:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2768:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.1924:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.1924:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2715:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2921:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2463:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2163:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2176:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.1935:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2781:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2834:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2244:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2341:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2456:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2887:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2249:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2211:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2377:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2652:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2935:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2400:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2811:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.3011:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2756:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2065:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2642:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2344:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2083:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2361:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2733:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2598:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2611:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.3378:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2431:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.1982:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.1943:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2536:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2921:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2581:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.3053:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2354:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2533:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2170:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2838:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2282:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2436:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2611:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2363:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2680:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2065:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2721:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.3550:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2753:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2632:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2917:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2845:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2837:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2200:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2403:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2542:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2551:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2780:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2706:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2555:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2598:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2498:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2398:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2968:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2197:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2510:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.3049:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2434:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2430:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2842:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.3075:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2348:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2279:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2468:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2976:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2283:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2806:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.3424:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.3424:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2271:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3368:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2408:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2511:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2290:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2839:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2203:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3363:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3067:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2336:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2336:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2625:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2509:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3047:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2620:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2672:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2235:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3418:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2284:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2671:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3065:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2118:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2481:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2849:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2520:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2325:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2182:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2148:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2716:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2188:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2414:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2147:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2161:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2260:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2389:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2951:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2530:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2844:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2384:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3151:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2253:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2100:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2260:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2865:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2570:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.1983:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2792:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3117:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2398:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2715:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2152:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2429:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2030:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3430:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2522:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2623:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2914:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2882:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2559:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2566:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2431:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2442:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.1945:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2840:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2128:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2713:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2738:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.1997:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2675:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2455:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2310:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2530:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2416:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2433:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2322:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2312:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2643:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2830:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3817:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3817:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2380:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2665:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2595:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2751:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2714:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2472:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2474:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2375:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2683:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2610:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2356:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2393:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2375:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2393:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2768:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2376:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2171:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.1980:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2492:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2219:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2842:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2456:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2976:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2750:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2193:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2562:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2058:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.3568:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2285:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2597:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2570:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2840:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2740:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2131:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2714:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2772:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2223:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2441:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.1940:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2884:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2709:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2465:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2695:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2547:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.3046:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2411:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2618:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2115:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2846:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2320:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2453:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.1817:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2647:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.3048:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2668:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.1954:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.3154:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2779:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2992:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2623:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2143:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.3255:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2348:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2672:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2561:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2410:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2367:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2548:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2239:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2205:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2144:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2688:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2569:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2566:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2507:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2769:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2748:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2098:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2171:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2171:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.3074:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2816:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2204:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2081:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2366:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2739:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2439:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2502:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2915:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2455:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2091:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2446:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2189:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2591:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2664:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2854:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.3029:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2592:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2767:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2685:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2466:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2180:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2878:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2313:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.3102:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2911:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2393:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2717:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2568:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2620:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2494:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2739:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2783:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2797:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2549:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2868:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.1915:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2420:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2680:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2285:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2580:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2544:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2689:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2719:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2222:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2195:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2644:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2436:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2075:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2175:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.3406:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.3343:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2251:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2405:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2757:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2322:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2293:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2767:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.3028:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2250:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2153:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2671:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2499:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2643:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2273:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2268:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.1902:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2891:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2430:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2347:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2539:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.3159:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2289:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2291:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2581:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2600:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2697:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2367:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2084:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2084:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2130:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2491:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2362:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.3164:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2630:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2319:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2355:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2740:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2042:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2364:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2411:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2443:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2237:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2451:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2199:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2686:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2127:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.3228:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2472:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2400:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2227:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2678:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2536:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2511:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2436:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2677:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2298:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2588:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2169:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2451:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2365:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2332:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.3325:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2473:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2509:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2760:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2906:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2475:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2598:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2372:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2099:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2657:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2532:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2492:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2348:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2537:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2628:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2272:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2160:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2816:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2929:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2320:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2429:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2914:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2683:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2442:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2587:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2231:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2706:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2789:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2529:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.3441:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2420:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2374:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2915:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2637:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2500:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2614:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2927:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2136:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2929:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2764:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2537:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2656:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2903:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2599:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2553:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2239:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.1713:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.1713:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2680:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2473:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2520:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2919:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2326:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2341:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2491:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2704:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2462:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.3126:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2326:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2309:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.3219:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2707:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2308:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2831:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2814:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2176:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2548:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2508:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2700:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2427:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2208:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2931:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2312:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2548:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2698:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.3129:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2592:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.3340:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2373:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2450:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2416:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2570:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2577:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2654:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.1944:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2237:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2612:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2665:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2120:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2758:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2595:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2289:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.3164:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2702:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2629:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2545:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2580:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.1996:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2876:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2193:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2020:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2756:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2134:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2198:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2882:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2699:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2472:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2770:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2520:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2259:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2447:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2473:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2610:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2814:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2485:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2351:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2685:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2522:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2688:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2385:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2934:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.3154:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2302:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2729:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2219:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2181:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2269:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2269:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2442:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.1946:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2352:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2111:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2388:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2851:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.3010:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2350:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2797:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2167:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2849:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2851:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2545:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2235:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2052:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2682:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2468:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2987:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2535:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.3011:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2637:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2428:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2296:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2683:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.1853:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2160:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2306:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2849:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2993:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2438:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2514:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2961:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2627:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2498:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2891:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2165:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2429:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2184:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.3087:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2207:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2874:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2012:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2288:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2263:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2560:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2621:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2605:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2316:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2191:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2738:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2698:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.3069:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2557:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.1962:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2321:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2344:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2728:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2325:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2690:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2048:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2560:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2892:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2505:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2442:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.1985:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2092:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2643:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.3155:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2791:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2488:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.3079:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2361:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2595:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2853:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2699:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.3036:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2106:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2047:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2171:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2171:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2413:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2792:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2422:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2291:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2806:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2705:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2727:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2342:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2863:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2331:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2356:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.3173:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2316:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.1719:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2688:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2463:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2940:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2317:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2415:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.3037:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2640:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2420:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2520:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2335:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.3595:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2410:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.1856:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2859:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2632:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2067:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2710:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.1909:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2703:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2145:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.1822:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2567:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.1897:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.1985:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2624:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2553:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2945:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2247:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.3115:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2754:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2685:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2670:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.1837:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2968:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2067:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2377:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2438:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2344:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2208:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2530:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2153:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2150:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2713:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2217:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2394:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.3008:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2424:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.3310:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2331:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.1890:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2394:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2280:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2498:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2403:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2493:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2351:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2041:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2239:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2759:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2648:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2191:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2259:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2504:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2482:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2402:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2402:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2433:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2358:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2958:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2157:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2045:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2106:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2388:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2754:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2393:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2504:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2329:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2354:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2287:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2703:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2570:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.3267:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2282:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2783:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2397:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2982:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2677:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2763:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2802:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2199:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.3234:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2535:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2846:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2554:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2353:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2155:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2403:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2514:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.3084:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.3074:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2686:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2144:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2664:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2629:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2391:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2578:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2879:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2431:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2043:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2676:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.3005:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.3222:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2505:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2318:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2498:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2453:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2349:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2533:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2414:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2608:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2905:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2220:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2229:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2054:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2110:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2417:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2297:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2712:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2376:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2414:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2332:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.3059:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2067:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2241:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2317:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.3579:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2466:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2168:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2381:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2393:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2729:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2622:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2370:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2463:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2772:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2772:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2548:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.3449:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.1515:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2330:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2300:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.1879:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.1925:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2480:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2185:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2816:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2582:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2800:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2002:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.3346:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2340:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2588:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2515:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2266:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2666:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2065:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2097:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2564:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2823:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2400:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2439:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2598:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2883:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2691:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2397:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2591:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2095:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2030:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2257:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2338:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2262:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2217:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2689:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2208:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2864:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2172:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2399:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2242:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2609:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2000:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2073:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2625:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2702:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2275:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2859:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2637:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2575:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2423:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.1951:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.1822:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2396:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2289:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2561:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2267:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2310:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2226:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2557:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2716:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2727:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2510:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.3113:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2578:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2104:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2454:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.1954:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2703:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2603:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2563:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2806:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.1973:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2932:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2716:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2855:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2821:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.3788:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.3788:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2400:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2175:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2534:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.3051:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2309:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2403:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2285:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2514:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2889:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.3150:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2107:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2366:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2717:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2500:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2638:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2707:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2829:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2794:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2478:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2674:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2820:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2445:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2719:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2338:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2541:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2824:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2101:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2480:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2453:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2660:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2082:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2568:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2092:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2396:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2367:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.3181:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2256:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2685:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2539:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2687:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.1974:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2082:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2350:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2971:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2695:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2383:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2649:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2169:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2496:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2642:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2532:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2920:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2517:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2305:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2741:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2421:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2349:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2740:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2875:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2272:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2615:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2915:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2246:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2222:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.1647:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2982:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2422:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2204:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2363:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2491:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.1902:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2345:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2309:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2659:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2497:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2692:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2549:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.3051:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.1219:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.1219:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2165:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2527:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2677:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2392:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.1969:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2790:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2457:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2504:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2594:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2011:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2658:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.1890:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2648:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2810:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2583:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2025:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2444:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2472:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2609:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2308:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2257:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2132:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2528:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2205:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2782:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2117:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2718:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2496:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2205:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2217:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2339:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2526:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2630:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2418:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2490:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2966:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2424:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2219:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.1994:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2955:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.3182:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2621:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2672:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2642:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2800:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2985:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2547:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2195:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2374:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2792:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2655:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2669:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2536:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.1868:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2931:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2589:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2654:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2577:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2784:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.1953:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2445:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2039:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2450:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2082:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2255:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2676:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2519:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2408:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.3440:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2315:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2205:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.1927:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2172:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2793:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2106:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2554:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2521:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2506:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2591:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2591:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2330:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2329:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2843:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2210:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2657:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2495:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2583:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2745:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2458:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2551:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2629:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2444:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2540:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2831:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2131:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2972:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.1807:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2438:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2873:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2214:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2366:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2623:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.1929:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2083:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2299:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2220:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2398:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2550:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2509:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2399:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2032:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2912:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2886:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2635:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2583:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2543:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2071:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2969:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2855:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2182:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2173:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.1881:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2716:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2251:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2184:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2332:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2149:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2465:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2648:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2180:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2799:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2267:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2020:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2205:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2391:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2111:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2334:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2330:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2275:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2009:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2269:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2038:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2699:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2693:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2490:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2362:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2644:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2031:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2530:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2111:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2307:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2295:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.1813:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2570:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2192:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2842:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2554:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2616:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2463:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2463:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.1866:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2057:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2163:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2214:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2804:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2139:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2149:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.1972:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2454:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2601:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2443:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2302:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.3024:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2139:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2353:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2341:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2997:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2309:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.3046:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2074:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2510:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2290:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2279:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.1968:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2190:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.3079:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2515:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2363:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2515:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2175:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2270:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2329:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2581:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2533:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2761:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2237:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2681:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2155:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2620:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2263:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.3203:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.3195:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2331:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2270:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2447:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.1928:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2502:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2711:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2616:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2339:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2231:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2184:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2433:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2449:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2344:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2185:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2841:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2237:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2406:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2513:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2487:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2518:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2630:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2500:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2491:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2709:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2070:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2364:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2440:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.2334:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.2150:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.2967:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.2083:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.1979:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.2759:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.2425:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.2164:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.2856:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.1140:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.1140:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2658:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2828:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2442:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2390:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2028:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.3054:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2572:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2643:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2218:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.3549:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2556:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2339:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2135:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2578:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2547:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2254:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2717:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.3027:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2704:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2489:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2660:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2449:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1814:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2573:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2477:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2616:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2536:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2987:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1827:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2454:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1752:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2510:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2489:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2278:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2666:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2093:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2804:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2728:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2248:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2673:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2406:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2502:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2338:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2246:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2557:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1698:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2849:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2742:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2854:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2606:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2841:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2198:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2663:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2231:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2202:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2362:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2775:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2076:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2172:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2802:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2450:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2814:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2783:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2144:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2397:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2357:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2132:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2846:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2748:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2595:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1895:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1991:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2762:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2684:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2274:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2396:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2579:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1930:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1497:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1497:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2230:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2192:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2621:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.1999:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2168:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2201:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.1869:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2563:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2284:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2793:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2760:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2291:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2274:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2643:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2073:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2788:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2713:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2466:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2104:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2527:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2711:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2515:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2249:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2526:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2353:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2274:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.1927:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2053:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.3066:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2429:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2373:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2413:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2445:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2000:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2578:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2089:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2026:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2587:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2767:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2751:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2057:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2540:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2064:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2217:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2641:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2242:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2200:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2298:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2395:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2626:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.3168:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2290:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2789:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2344:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2197:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2317:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2450:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2459:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.3186:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2374:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2383:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2784:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2376:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2078:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2519:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2551:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.1846:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2733:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2135:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2571:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2919:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2529:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2470:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.1850:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2179:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.3088:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2490:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2428:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2479:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2479:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2126:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2314:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2463:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2422:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2468:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.1967:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2305:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2201:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2812:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2191:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.1993:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2180:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2114:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2471:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.3224:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.1922:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2688:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2410:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2292:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2650:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2337:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.1561:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2592:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2779:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.1964:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2707:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2672:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.1938:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.1986:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2069:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2308:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2598:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2693:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2009:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2577:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2482:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2134:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2504:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2071:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.3016:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.3182:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2288:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2389:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2173:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2081:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2520:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2558:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2460:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2420:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2510:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2287:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2407:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2588:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.1910:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2635:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2191:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2625:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2587:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2900:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2660:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2139:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2839:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2765:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2452:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2300:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2691:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2845:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2593:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2526:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2432:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2344:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.3100:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2086:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2154:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2881:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.3164:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2848:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2215:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2081:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2081:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2512:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2756:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2466:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2824:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2876:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2375:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2112:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2072:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2391:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2498:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2349:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2460:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2284:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.3110:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2465:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2454:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.1989:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2478:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2074:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2884:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2265:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2593:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2012:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2711:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2493:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2396:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2271:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.1906:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2452:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.1664:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2849:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2074:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2087:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2647:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2380:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2465:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2414:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2547:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2510:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.1617:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.3012:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2362:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2222:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2780:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2450:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2182:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2638:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2120:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2152:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.3425:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2174:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2515:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2398:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2049:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2477:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2489:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2263:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2222:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2567:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2615:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2482:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2309:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2013:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.1823:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2730:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.3051:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2431:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2276:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2656:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2075:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.3081:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2074:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2415:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2842:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2037:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2336:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2197:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2693:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.1937:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.1937:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.1960:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2718:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2379:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2214:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2170:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.1918:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2237:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2008:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2712:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2067:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2070:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2319:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2249:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.1787:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2330:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2284:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2447:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2213:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2561:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2264:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2093:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2148:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2233:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2023:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.3081:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2603:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.3031:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.3034:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2823:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2471:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2671:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2468:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2127:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2074:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2326:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2543:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2230:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2532:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2499:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.1677:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2253:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2169:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2263:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2611:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.1861:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2514:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2181:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2584:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2040:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2045:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2303:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2446:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2297:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2541:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2511:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2393:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2590:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2492:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2245:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2675:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2553:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2859:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.1935:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2670:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2458:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2394:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2459:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2446:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2021:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.3102:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.1831:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2685:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2036:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2319:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2172:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2188:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2664:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.3045:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2373:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2373:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2471:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2370:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2839:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2130:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1937:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2513:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2380:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2252:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2710:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2063:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2599:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2615:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2788:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2409:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2402:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2475:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2392:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2290:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2076:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2571:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2957:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2324:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2261:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2237:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1946:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2355:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2020:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2307:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2069:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.3115:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2735:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2307:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2112:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1912:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2210:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2451:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2697:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2402:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2509:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1897:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2261:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2135:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1698:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2066:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1895:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2521:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1821:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2083:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1676:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1980:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2556:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.1711:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2499:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2290:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2520:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2013:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2567:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2322:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2788:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2394:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2959:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2468:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2171:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2376:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2147:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2679:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2404:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2155:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.3033:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.3132:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2660:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2089:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2099:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2323:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2287:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2393:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2421:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2872:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2228:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2228:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2619:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2374:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2101:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2590:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.1833:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2296:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.3116:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2078:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2310:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2535:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2517:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2008:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2527:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2456:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.3102:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2174:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2757:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2263:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.1683:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2012:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2995:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.1957:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2334:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2776:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2003:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.1705:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2316:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.1842:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2684:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2367:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2463:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2196:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2762:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2301:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2395:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2144:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.1755:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2417:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.3267:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2796:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2575:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2236:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2581:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2393:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2324:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2418:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2771:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2463:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2359:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2659:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2166:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2123:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2297:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2623:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2038:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2573:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2134:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2148:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2248:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2611:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2376:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2521:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.3142:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2242:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2858:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2591:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.1963:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2295:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2428:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2284:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.1984:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2336:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2326:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2744:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2670:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2525:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2284:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2260:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2945:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2945:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2749:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2375:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2894:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2778:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2613:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2923:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2231:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1825:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2444:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2247:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2638:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2102:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2102:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1886:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1929:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1902:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2750:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2307:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.3021:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2695:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2174:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2569:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1831:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2227:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2071:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2789:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2032:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2296:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2991:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2624:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2364:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1891:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.3132:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2405:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.3026:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2316:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2003:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2343:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2466:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2264:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2915:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2204:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2625:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2361:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2250:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2143:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2934:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2174:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2077:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2251:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.3124:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2500:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2210:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2583:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2100:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2670:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2416:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2387:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2077:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2962:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2753:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1960:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1943:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1974:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2089:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2911:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2645:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2386:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2124:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2482:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2714:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2284:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2643:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2180:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2773:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2936:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2026:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2117:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2827:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2827:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2587:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2499:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2403:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2952:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2669:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2588:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2353:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2347:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2218:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2184:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2898:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2101:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2767:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.3024:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2230:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2155:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1905:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2377:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2442:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2706:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2599:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2431:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2185:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2540:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2394:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1881:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2001:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2711:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2623:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2559:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1839:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2674:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2918:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2172:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2585:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.3077:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1813:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1946:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2622:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2324:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2340:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2075:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2359:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2622:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2289:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2268:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2520:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2386:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1940:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2082:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2181:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2656:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2446:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2031:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1936:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2665:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2684:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2199:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1629:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2602:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1723:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2618:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2001:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2316:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2240:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2826:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2471:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2622:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2318:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2729:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2802:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.1855:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2665:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2052:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2456:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.3087:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2539:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.1799:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2569:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2569:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.1797:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2754:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2429:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2296:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2593:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2799:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2167:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2406:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2584:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2151:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.1750:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2501:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.3026:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2265:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2392:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2861:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2539:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2369:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2436:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2122:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2407:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2710:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2186:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.3091:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.1964:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2235:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2270:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.1568:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2700:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2769:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2678:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2040:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2559:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2096:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2501:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2672:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2280:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2995:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2382:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2280:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2675:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2488:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2349:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2239:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2136:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2160:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2227:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2186:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2644:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.3184:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.3136:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2595:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2501:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2547:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2582:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2058:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2301:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2842:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2298:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.1831:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2439:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2772:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2921:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2384:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2832:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2202:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2921:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2914:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2375:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2347:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2481:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.3091:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.1807:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2120:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.1916:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2650:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2127:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2410:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.0895:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.0895:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2710:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.3121:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2454:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2479:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1671:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2284:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2507:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2671:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2013:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2363:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2505:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2017:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2523:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2234:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2817:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1855:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2169:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2168:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2815:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2450:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2948:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2619:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2194:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2294:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1857:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2316:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2508:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2755:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2475:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2185:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2029:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1843:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1980:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2093:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2245:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2043:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2084:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2508:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1924:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2071:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2327:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2508:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1986:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2230:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2222:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1693:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2266:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2632:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2605:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2306:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.3212:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2205:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2394:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2783:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1702:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2337:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1726:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2328:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1983:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2315:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2389:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2578:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2040:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2735:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2416:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1909:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2478:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2768:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.3315:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2801:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2649:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2573:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2157:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2821:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2200:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2080:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2177:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2128:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2385:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2385:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2130:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2775:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2706:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2538:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2530:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2007:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2117:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2541:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2087:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2160:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.1923:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2480:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2491:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2667:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2163:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2080:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2232:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.1938:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2597:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.3184:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2089:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2300:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.3073:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2831:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2786:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2302:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2468:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2681:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.3038:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2245:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2617:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2432:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2208:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2480:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2825:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2904:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2327:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2335:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2537:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.1948:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2133:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2205:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2041:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2205:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2564:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2021:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.1836:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2306:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2005:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2389:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2610:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2366:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2053:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2111:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2491:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2439:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2495:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2611:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2643:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.1822:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2404:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2787:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2317:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2907:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2345:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2766:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2486:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2165:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2324:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2369:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2095:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2296:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2506:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2237:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2378:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2080:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2132:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2557:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2349:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2349:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2295:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2486:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.3139:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2387:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2076:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2879:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2164:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.1929:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2231:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2709:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2672:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.1823:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2356:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2230:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2694:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2708:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2313:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2519:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2474:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2530:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2386:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2081:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2158:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.1831:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2344:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2050:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2258:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2150:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2730:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2240:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2408:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2118:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2267:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.3093:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2535:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2903:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2309:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2049:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2542:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2204:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2134:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2505:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2109:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2233:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2164:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2423:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2467:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2683:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2309:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.1739:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2151:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2397:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2738:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2916:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2404:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2109:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.1546:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2233:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2531:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2062:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2329:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2315:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2595:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2629:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2557:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2308:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2449:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2286:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2491:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2429:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2228:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2222:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2218:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2323:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2550:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2368:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.1816:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2125:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.1626:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.1626:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2144:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2224:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.3118:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2429:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2197:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.3131:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2347:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.1899:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2629:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2238:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2825:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2214:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2787:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2445:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2415:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2266:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2579:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2351:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.1582:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2629:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2271:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2867:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2290:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2768:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2298:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2230:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2429:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2424:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.1848:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2141:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2228:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2099:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2510:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2442:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.1637:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2420:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2960:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2082:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2368:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2133:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2142:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2488:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.3151:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2418:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2913:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2252:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2469:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2250:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2766:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2353:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2269:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2013:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2287:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2014:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2517:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2314:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2688:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.1950:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2327:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2350:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2293:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2612:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2436:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2646:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.1965:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.1858:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2347:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2948:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2350:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2877:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2039:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2562:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2373:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2036:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.1978:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2629:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2337:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2742:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2711:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2711:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2240:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2175:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2626:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2303:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2827:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2169:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2193:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.3020:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2433:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2730:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2866:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2328:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2701:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2131:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2800:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2007:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2460:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.1849:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2205:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2616:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2097:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2354:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2442:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2211:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2086:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2250:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2857:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2148:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2377:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2175:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.1817:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2629:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2206:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2035:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2155:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2773:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2620:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.1938:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2074:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2439:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2612:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2381:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2199:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2331:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2331:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2418:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2269:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2860:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2020:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2519:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2121:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2712:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2340:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2396:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2456:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2566:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2311:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.1964:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2988:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2388:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.1908:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2635:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2230:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2441:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.1745:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2477:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2530:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2905:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2399:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2241:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2407:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2456:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2092:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2327:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.3045:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2465:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2213:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2088:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.1495:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.1495:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2196:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2422:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2200:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.3281:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2316:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2058:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2282:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2140:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2902:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1891:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2639:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2486:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2063:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2303:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2873:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2815:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2046:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2544:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2445:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2228:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2140:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2269:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2594:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2687:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2236:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2251:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2497:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1955:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2234:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2004:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2370:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2314:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2091:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2549:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2313:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1956:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2438:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2220:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2895:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2269:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1993:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2632:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2214:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2267:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2104:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2474:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2612:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2698:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.3186:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2343:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1744:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2455:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1900:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2278:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1913:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2118:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1621:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2251:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2788:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1815:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2562:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2281:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2465:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2607:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2113:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1899:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.3176:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2471:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2618:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2704:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2090:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1801:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2080:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1801:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2713:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2493:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1940:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2436:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.4049:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.4049:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2581:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1975:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2070:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2259:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2228:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2398:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1890:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2225:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2020:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2407:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1810:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2028:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2482:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2370:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2039:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2270:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2169:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1937:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2345:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2701:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2492:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2086:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2669:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2563:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2169:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1947:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2379:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2809:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2303:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2881:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1771:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2119:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2310:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2284:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2206:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2699:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2232:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2098:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2615:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2052:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2343:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1984:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2332:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1963:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2302:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1802:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2396:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2154:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1915:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2351:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2081:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2328:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2510:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2176:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2368:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2131:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2695:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2689:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2231:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2323:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2199:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2194:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.3239:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2008:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2146:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2566:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2133:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1998:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2563:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2410:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2392:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2818:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2310:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2268:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2591:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2422:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1793:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2226:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.0932:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.0932:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.1993:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2307:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2668:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2318:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2255:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2574:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2499:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2138:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2584:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2664:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2017:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2613:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2050:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2202:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2178:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2544:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.1613:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2012:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.3194:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2431:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2213:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2307:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2892:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2408:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2137:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2315:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2574:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2350:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2364:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2613:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2409:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2642:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.1854:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2499:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2243:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2382:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2586:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2753:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2345:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2341:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2316:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1992:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1997:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2397:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.3026:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2818:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2329:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2135:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2501:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2190:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2300:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2807:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1921:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2337:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1552:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2305:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1863:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2572:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2069:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2937:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1980:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1945:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2090:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2519:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2886:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2706:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2310:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2300:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2111:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2738:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1900:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2526:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2438:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.3220:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1995:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2801:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2078:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2220:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2199:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2199:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.1919:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.3113:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2020:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.3124:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2546:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2421:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2247:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.1926:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.1977:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2424:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2592:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2336:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2782:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2695:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2391:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2549:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2168:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2103:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2216:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2556:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2466:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.3015:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2037:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2666:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2710:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2243:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2301:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2553:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2195:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2054:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2376:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2360:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2807:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2724:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2477:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2241:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2217:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.1934:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2830:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2461:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2656:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2121:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2493:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.1647:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2545:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2073:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2265:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2360:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2586:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2223:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2631:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2142:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2424:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2532:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2639:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2149:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2408:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2486:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2183:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2645:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.1918:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2763:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.3148:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2582:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.1889:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2191:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2028:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2362:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2235:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2323:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2400:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2281:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2242:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2183:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2650:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.1795:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2734:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2182:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.3396:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.3396:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2034:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2457:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1810:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2241:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.3056:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2006:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2106:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2355:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2644:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2097:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2931:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1943:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2482:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2387:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2859:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2456:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1870:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2641:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2364:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1440:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2447:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2885:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2329:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2248:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2255:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2116:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2174:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1951:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2214:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2799:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1799:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2255:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2025:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.3009:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2580:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1948:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2029:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2538:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2773:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1635:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2165:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.3018:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2416:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2376:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1632:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2459:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2061:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1748:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1961:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2135:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2105:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2866:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2369:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2351:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2996:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2270:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2063:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2518:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2418:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2597:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2286:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2714:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2010:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2744:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2403:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2923:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2855:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2367:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.3176:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2522:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1967:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1968:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2500:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2511:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2521:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2422:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1862:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1962:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1553:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1553:  40%|████      | 161/401 [01:35<03:58,  1.01it/s]training loss: 0.2321:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2110:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2794:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2206:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2863:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2367:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2195:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2097:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2229:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2272:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2475:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2817:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2792:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1886:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2107:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2177:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2128:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2052:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2426:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1997:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2224:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1961:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1790:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1608:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2362:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2314:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1713:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2475:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.3101:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2410:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1988:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2475:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1916:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1541:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2418:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2648:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2567:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2035:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2393:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2920:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2868:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2723:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2347:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1851:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2855:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2123:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2057:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2808:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.3031:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2114:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2198:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2809:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2266:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1876:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2213:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1806:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2350:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2637:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2010:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2285:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2659:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2050:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1829:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1757:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2011:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2841:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2896:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2190:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2435:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2154:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2601:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2792:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1965:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2240:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1949:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2770:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2585:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2560:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2171:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2171:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2045:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2567:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2353:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2298:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2334:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2380:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.1998:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2457:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2433:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2280:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2823:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.1955:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2582:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2882:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2102:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2855:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2433:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2222:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2371:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2894:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2157:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2443:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2161:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2550:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2054:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2563:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2179:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2231:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2294:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2226:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2602:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2820:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2549:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2502:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2373:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2148:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2238:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2098:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.1688:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2703:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2349:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2571:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2219:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2334:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2664:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2393:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2603:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2844:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2318:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2380:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2277:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2123:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.1833:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2019:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2445:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.1829:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2641:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2105:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2347:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2520:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2499:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2137:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2362:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2125:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.1977:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2084:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2560:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2217:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2476:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2413:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2292:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2300:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2325:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2150:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2201:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.1815:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2111:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.1997:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2812:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2812:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2841:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2915:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2987:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2373:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2581:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1939:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2273:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2449:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2342:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2559:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1732:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1941:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2549:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2048:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2639:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2440:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2696:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2548:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2139:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2856:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2103:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1967:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2325:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2141:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1983:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1998:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1957:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2296:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2366:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2512:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2305:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1916:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2210:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2327:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2073:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2319:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.3087:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2058:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1965:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2128:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2133:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2726:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2835:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2390:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1956:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1765:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2351:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2637:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2500:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1978:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2007:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2822:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1712:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2480:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2504:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2821:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2129:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2123:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2831:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2123:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2191:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2285:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2963:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.3100:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2117:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2228:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2340:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2189:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2102:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2446:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.1707:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.1927:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.2170:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.2184:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.1988:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.2014:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.2228:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.2239:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.3339:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.3339:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2739:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1462:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2003:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2436:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2282:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2435:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2252:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2297:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2364:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1931:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1936:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2431:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2071:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2174:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1641:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2579:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2052:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2614:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2112:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2404:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2081:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2153:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1932:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2864:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2180:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2261:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2209:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2614:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2646:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2388:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2325:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1899:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2594:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2698:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2441:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1917:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1922:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2152:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1919:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2557:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2749:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2057:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2079:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2727:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2247:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2036:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2632:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2319:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2383:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2597:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1878:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2244:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2891:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2715:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2491:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2563:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2301:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2045:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2510:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2522:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2211:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2405:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1790:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2013:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1879:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2418:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1935:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2456:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2405:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2000:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2382:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2335:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2539:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2066:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2775:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2082:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2997:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1991:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1887:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1887:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2085:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2188:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2031:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2287:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2512:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.3010:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2471:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2267:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2391:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2186:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2062:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1980:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2005:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2273:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1818:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2159:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2138:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2028:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2250:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1980:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1927:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2782:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2934:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2848:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2256:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2524:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2139:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2867:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2560:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2041:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2783:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2236:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2166:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1950:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2446:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1725:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2367:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2545:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2359:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2070:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2069:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1905:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2451:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2545:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2440:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1852:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2457:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2492:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2551:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2204:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1745:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1634:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2327:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1834:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2545:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2744:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2105:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2006:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1874:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2746:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2250:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2812:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1959:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2267:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2200:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2490:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1874:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2259:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2547:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2693:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2285:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2509:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2883:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2673:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2154:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1796:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2433:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1878:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1598:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1598:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1610:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2433:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2041:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2655:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2125:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2244:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2106:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2289:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2425:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2369:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2088:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2171:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2222:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2095:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2413:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2354:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2241:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2968:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2071:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2097:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2532:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1922:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2252:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2524:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1991:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2284:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1892:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2552:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2784:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2587:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2322:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1648:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2066:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2546:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2018:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2046:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2633:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2245:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2381:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1676:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1848:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2679:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2013:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2161:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2737:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2519:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2169:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1983:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2339:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2934:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2756:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2509:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1864:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2094:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1819:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2396:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.3202:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1989:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.3549:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2194:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1974:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2059:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1758:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2007:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2212:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2259:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1837:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2209:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1517:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2550:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2672:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2499:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2416:  41%|████▏     | 166/401 [01:38<01:45,  2.22it/s]training loss: 0.1891:  41%|████▏     | 166/401 [01:38<01:45,  2.22it/s]training loss: 0.2189:  41%|████▏     | 166/401 [01:38<01:45,  2.22it/s]training loss: 0.2280:  41%|████▏     | 166/401 [01:38<01:45,  2.22it/s]training loss: 0.2731:  41%|████▏     | 166/401 [01:38<01:45,  2.22it/s]training loss: 0.2007:  41%|████▏     | 166/401 [01:38<01:45,  2.22it/s]training loss: 0.3308:  41%|████▏     | 166/401 [01:38<01:45,  2.22it/s]training loss: 0.3308:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1968:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2008:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2246:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2007:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2197:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2430:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1880:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2916:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2634:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2196:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.3630:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2618:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2313:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1790:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2205:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2193:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2296:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1906:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2471:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2529:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2089:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1837:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2412:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1995:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2408:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2842:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1961:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2403:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2005:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2156:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1930:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2680:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1904:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1895:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2287:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2548:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1861:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2386:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2194:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2200:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1891:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2578:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2071:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2573:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2332:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2205:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2121:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2008:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2062:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2286:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2136:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2075:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2104:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1911:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2012:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2213:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2559:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2551:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2476:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2242:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2211:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1987:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2666:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2223:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2626:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2051:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2448:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1922:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2019:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2520:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2117:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2170:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1737:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2968:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2467:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2065:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2415:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2312:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1904:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1904:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1944:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2053:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2065:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1955:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2093:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2016:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2155:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2624:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2808:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2282:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1445:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2582:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2785:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1847:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2164:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2130:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2353:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2059:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2182:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2447:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1813:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2424:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2129:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2249:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2390:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2009:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2210:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2973:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1987:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1988:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2781:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2271:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2295:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2726:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1916:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1892:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1939:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1980:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2195:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2578:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2358:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2538:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1648:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1998:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2374:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2095:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1901:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2000:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2047:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2165:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2092:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2299:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1854:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1906:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2921:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1726:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2383:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2448:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2768:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2010:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2229:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2116:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2287:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2320:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2281:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2237:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2350:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2516:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2266:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2344:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2128:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1710:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2076:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2488:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1853:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2050:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2030:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1616:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1537:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1537:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2167:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2247:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1822:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2193:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2353:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1742:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2055:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2211:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2139:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2069:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1771:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2463:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2447:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2353:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2482:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2744:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2288:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2598:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2237:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2248:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2059:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2464:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2391:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1862:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2572:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1878:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2717:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1804:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2922:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2027:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1782:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2281:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2921:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2371:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2741:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2863:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1767:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2508:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2287:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2051:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2369:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2871:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2607:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2630:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1828:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1975:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1840:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2018:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1750:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2216:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2308:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2365:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2404:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1877:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2841:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1769:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1843:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2074:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2345:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1716:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2227:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1786:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2117:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1952:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1817:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2100:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2130:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1866:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2137:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1980:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1835:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2140:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1947:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1768:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2782:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1826:  42%|████▏     | 169/401 [01:39<01:23,  2.77it/s]training loss: 0.2473:  42%|████▏     | 169/401 [01:39<01:23,  2.77it/s]training loss: 0.2475:  42%|████▏     | 169/401 [01:39<01:23,  2.77it/s]training loss: 0.3009:  42%|████▏     | 169/401 [01:39<01:23,  2.77it/s]training loss: 0.3009:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2308:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2115:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2250:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1620:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2267:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2418:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2806:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2127:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2768:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2438:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2324:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2162:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2162:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2772:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2101:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1875:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1660:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2187:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2233:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2669:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2090:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2167:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1937:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2193:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2059:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1638:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2567:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2072:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2023:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2377:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2018:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2144:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2222:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2258:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2008:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2508:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2172:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1848:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1902:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2277:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1980:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2042:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1871:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2182:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1983:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2023:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1663:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2418:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2377:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2264:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2194:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2354:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2585:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2361:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2531:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2518:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2567:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2190:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2364:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2427:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2549:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2318:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1673:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2297:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2114:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1865:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2825:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2391:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1794:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2218:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2929:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2002:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2664:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2073:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1697:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2412:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2229:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2159:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1627:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1627:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2394:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2685:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2039:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2269:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2343:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2053:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1781:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1857:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1913:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1825:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2530:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2479:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2055:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2374:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1944:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1907:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2158:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2191:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2621:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2063:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2228:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2001:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2810:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1944:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2345:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1669:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1980:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1952:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2155:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2458:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1842:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1890:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2323:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2382:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2365:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2311:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2471:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2658:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2307:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2739:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2055:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1896:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2470:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2025:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2099:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2591:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2478:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2305:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1835:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2269:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1876:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1755:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2225:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2278:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1801:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2064:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2312:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2052:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.3575:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1896:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1957:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2215:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2273:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2375:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2189:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1963:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2432:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2413:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2888:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1904:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2301:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2620:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2972:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2343:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2135:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2136:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2003:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2107:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1889:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1889:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1931:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2261:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2516:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2121:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2053:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2642:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2452:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1904:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2406:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2356:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1987:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2296:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1756:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1728:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2625:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1892:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2769:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.3033:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2487:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2388:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2510:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2577:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1932:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2216:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2158:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2067:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2213:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1798:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2067:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1929:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2271:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2132:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1769:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1997:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2086:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2227:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1802:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2586:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2592:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2534:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2006:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2393:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2476:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2119:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1826:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2043:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2148:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1766:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2353:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2557:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1987:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2459:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2073:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2183:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2015:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2624:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2383:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2110:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2076:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1756:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2615:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1909:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2600:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1907:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2225:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1699:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1798:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2081:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2123:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1779:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2202:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1914:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2378:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2260:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2328:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2154:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2176:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2776:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1886:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1886:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2377:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1998:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2201:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2538:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1897:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2237:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2510:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2390:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2158:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2184:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2096:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2285:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1974:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2306:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1404:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2237:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1973:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2336:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1920:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2302:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2136:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2379:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2550:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2327:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1865:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2049:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2302:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2223:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2365:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2757:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2695:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1762:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2671:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2270:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1857:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2091:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2346:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2276:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2359:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1947:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2233:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1913:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2253:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.3009:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2292:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2348:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2183:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2415:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1713:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2011:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2663:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2097:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2665:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2337:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2167:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2692:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2179:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2500:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2207:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1730:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2570:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2047:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2602:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2073:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2036:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1974:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.3292:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2269:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2617:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2225:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2178:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1982:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1890:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2025:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2422:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1775:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1902:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2732:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1966:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1966:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2057:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2943:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2028:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2664:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1530:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2123:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2069:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2840:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1920:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1934:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1973:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2256:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2514:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2492:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2099:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1983:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2048:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2353:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1814:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2092:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1776:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2617:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1494:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2485:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2618:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1840:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1980:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2731:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2160:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1914:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2673:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2078:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2556:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2357:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2853:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2403:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2019:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2488:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2593:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2270:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1976:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2252:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1968:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.3199:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2241:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2052:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2396:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1992:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2846:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2288:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2137:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2408:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2120:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2102:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2348:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1984:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1594:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1954:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2290:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2167:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2324:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2469:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1954:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2032:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2016:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1862:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1696:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2346:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2259:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1444:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2597:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1719:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2339:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2667:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2237:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2341:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1918:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2563:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2460:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2460:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2523:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.1764:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.1718:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2237:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2390:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.3130:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2605:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.1642:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2468:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.1878:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2041:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2312:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.1972:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2193:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2092:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2290:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2425:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2032:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2384:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2278:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2239:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2114:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2522:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.1989:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2223:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2248:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.1623:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2564:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.1971:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2230:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2091:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2265:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2247:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2810:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2307:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2175:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2357:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2155:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2401:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1999:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2313:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1989:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2197:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2313:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.3368:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2339:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1842:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2092:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2988:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1885:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2393:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1964:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2814:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2466:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2170:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.3152:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2829:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2188:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1955:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2094:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2790:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2185:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2520:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2587:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2575:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1607:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1881:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2317:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2208:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2488:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1801:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2317:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2774:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2341:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2603:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2106:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2436:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2302:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.3006:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.3006:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2309:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2124:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2266:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2174:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2074:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1981:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2034:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2298:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2063:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2310:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2510:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2205:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2177:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2165:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1853:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2620:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1747:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2358:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1917:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2109:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1997:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2607:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2228:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1906:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2096:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2432:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1781:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1570:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2146:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1827:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2448:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2679:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2258:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2108:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2292:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2586:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2506:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2172:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2478:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1879:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2448:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2120:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2465:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2140:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2493:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1592:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2060:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2077:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2006:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2994:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.3092:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2149:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2975:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2197:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1894:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2223:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2273:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2744:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2285:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2062:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2114:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2447:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2124:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2478:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2217:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1939:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2362:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2225:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2640:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2381:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2521:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2515:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2423:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1891:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2831:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.3004:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2228:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2664:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1869:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1869:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1915:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2383:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2045:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2749:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2254:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2226:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2027:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2159:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2328:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2707:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1945:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1745:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2832:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2084:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2402:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1931:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2032:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2264:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2726:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1930:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1745:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2392:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2511:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2175:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1529:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2582:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1841:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2472:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2287:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2325:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2990:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2022:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1909:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2155:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2946:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2575:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2085:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2838:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2580:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1895:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2463:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1845:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1888:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2090:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2259:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2507:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2787:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2020:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1521:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2907:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2421:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2361:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1879:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2388:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2113:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2529:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2221:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2504:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2430:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1917:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2186:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2434:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1815:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2240:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2055:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2141:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2375:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2143:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1934:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2288:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2297:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2208:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1971:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2759:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2461:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1954:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1922:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2080:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1266:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1266:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1736:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1752:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2151:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1725:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2909:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2893:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1963:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1518:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2196:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2136:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1758:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2615:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2922:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1766:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2314:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1918:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1849:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2808:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2316:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2425:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2147:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2244:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2261:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1885:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2804:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2178:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1736:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1736:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2217:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2630:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2350:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2405:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1697:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2183:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2345:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2335:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2554:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2162:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2266:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2214:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2740:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2319:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2398:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2410:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2821:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2476:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2653:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2212:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2131:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2326:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1818:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2604:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1654:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2694:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1945:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2693:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1901:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1914:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2302:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2587:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2227:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2365:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2029:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1732:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2169:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1918:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2563:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2207:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2116:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2304:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1911:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2258:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1963:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2194:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1827:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2057:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2087:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1788:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1489:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1489:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2092:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2315:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2516:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2051:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1785:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2295:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2674:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2173:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2406:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2296:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2029:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1873:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2449:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2198:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2101:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2241:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1904:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2283:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2273:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2657:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2175:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.3062:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2215:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2034:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2171:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2037:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2430:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2988:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2053:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2418:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2630:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1765:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1812:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2130:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2221:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2502:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1771:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2031:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2254:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2035:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2482:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2008:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2718:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1972:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1831:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2068:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2465:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1954:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2203:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1995:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2076:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2329:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2586:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2383:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1904:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2216:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2049:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2390:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2188:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2074:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1944:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2367:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2382:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2349:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2162:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2659:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2503:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1777:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1895:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2117:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2153:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2248:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2042:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2782:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2377:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2367:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1915:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2408:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2161:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2161:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1824:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2645:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2455:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2262:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2402:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1715:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2427:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1807:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1988:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1601:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2023:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1596:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2407:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2080:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2271:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1839:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2157:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2174:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2629:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2096:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2092:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2182:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2356:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2294:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2158:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2517:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2052:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2404:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2192:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2545:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2339:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.3059:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2277:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2397:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2365:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2228:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1943:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2307:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2278:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2400:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2197:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2549:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2482:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2276:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2100:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2325:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2263:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2466:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2017:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2053:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2051:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2577:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2122:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2585:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2391:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2333:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1942:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2425:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2029:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2071:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1775:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2050:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2259:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2142:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2144:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2178:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2233:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2475:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2275:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2107:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2812:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2154:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2068:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2310:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2486:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2201:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2424:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1637:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2749:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2749:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1606:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2284:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2387:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2039:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2345:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2186:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2452:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1989:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2353:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2765:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2141:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2133:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2813:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2538:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1919:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2339:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2705:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1969:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2162:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2338:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1716:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2101:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2121:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2050:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2372:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2544:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1689:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2084:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2213:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2316:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2319:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2369:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2839:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1943:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2275:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.3029:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1995:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2277:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1864:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2146:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2054:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2436:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1675:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1910:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1604:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1758:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1996:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2098:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1916:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2554:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1764:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2434:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2188:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1882:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1991:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2169:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2013:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2609:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2079:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1665:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2844:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1677:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2520:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1902:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1883:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2143:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2317:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2416:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2142:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2325:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1848:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2158:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2084:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2516:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2478:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2552:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2505:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2592:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1024:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1024:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1953:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2736:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2633:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1779:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2152:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2146:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2294:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1884:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2466:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1794:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1780:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2368:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2245:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2073:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2567:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2919:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2878:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1566:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1817:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2171:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2575:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2335:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2117:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2362:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2000:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1906:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2902:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2126:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2275:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2141:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1992:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2260:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1415:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2420:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2369:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1949:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2168:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2361:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2030:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1852:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2775:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1877:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2123:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2427:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2569:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1379:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2228:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1889:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2357:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2444:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2805:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1964:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1983:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2382:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2658:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2136:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2352:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2177:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2084:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2295:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2353:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2101:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.1929:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2401:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.1992:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2245:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2322:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2624:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2727:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2371:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.3129:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.3054:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.1784:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2726:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2392:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2308:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2641:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.1818:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.1713:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.1713:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1802:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2446:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2068:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2568:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2334:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2258:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1884:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1962:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1569:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2840:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2404:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2143:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2096:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2162:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2243:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2483:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2348:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.3271:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2629:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2042:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2845:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2652:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2332:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2816:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2211:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2122:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1916:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2146:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2052:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2874:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2018:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2798:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1582:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1872:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1969:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.3181:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1765:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2659:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2123:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2542:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2096:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2196:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1951:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1939:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1916:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1678:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2225:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2234:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1933:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2088:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2203:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2380:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2218:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2200:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1883:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2222:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2321:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1756:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2831:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1748:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1857:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2538:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2386:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1901:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1953:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1861:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2123:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1837:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2049:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2190:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1783:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1740:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1875:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2016:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2225:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2051:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2756:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2310:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.4362:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.4362:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2624:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2354:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2398:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2477:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2304:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2811:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2028:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2273:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2730:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1760:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2436:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2292:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2470:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1940:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2723:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1754:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2397:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1903:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2569:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2687:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1746:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1753:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2718:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2105:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1840:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2678:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2523:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2636:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2574:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2188:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2252:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2427:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1986:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2343:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2102:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2835:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1698:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2762:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1846:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2233:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2369:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2683:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1809:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2256:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2176:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2016:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2663:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2017:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2508:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1761:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1861:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2286:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1980:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2616:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1667:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2586:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2294:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2791:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2598:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2139:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1311:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2566:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2313:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2272:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2123:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1533:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1975:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2624:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2046:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2357:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1999:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1833:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1759:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2335:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1743:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2226:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1920:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1771:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2449:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2449:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2171:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2271:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2352:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2001:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1729:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2163:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1836:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2349:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2028:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2288:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2389:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2402:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2300:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2321:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2324:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2853:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2436:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2877:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2087:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1944:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2118:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2610:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.3295:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2136:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2105:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2597:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2080:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2130:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2485:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1666:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2386:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1987:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1962:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2611:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2719:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2060:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2389:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1907:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2281:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1790:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2712:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2263:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1566:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2586:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2102:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2151:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2339:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2203:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2858:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2143:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2625:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2214:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2003:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1496:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1553:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2465:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2043:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2546:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1743:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2215:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1756:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2007:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1842:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2573:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1955:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2121:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2743:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2767:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2576:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.1950:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.1917:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2004:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2819:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.1901:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2427:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2005:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.1750:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2622:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2754:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2754:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2001:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2073:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2407:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2228:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1729:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1720:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2076:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2176:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2016:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2393:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2191:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2137:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1800:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2179:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2921:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2493:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2226:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1653:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2487:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2350:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2067:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1998:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2666:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2049:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1989:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2176:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2350:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1755:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2163:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2460:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2421:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2209:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1957:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2538:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.3132:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2223:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2507:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1861:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1899:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1721:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2199:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2622:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2217:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1964:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2321:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2828:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2104:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2392:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2150:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1803:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1872:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1870:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2218:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1983:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2072:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1756:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2535:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2408:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2371:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2138:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2344:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1922:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2115:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2539:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1749:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2975:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2409:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2642:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2020:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2442:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2059:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2120:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2030:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1674:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2059:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2216:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1809:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1992:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1722:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1722:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2292:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2200:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2242:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2269:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2753:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2255:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2032:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2373:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2735:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2199:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2609:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1758:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2391:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2554:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2351:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1999:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2914:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2217:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2282:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2818:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2573:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2077:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1896:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2714:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2123:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2620:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1993:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2004:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1610:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2139:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2563:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1999:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2221:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2523:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2180:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2828:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2259:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2063:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2017:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2138:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2413:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2415:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1557:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2066:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1926:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2057:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2405:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2449:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2551:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1645:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2142:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2058:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2168:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2774:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2232:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2298:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2355:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2465:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1931:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1957:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2578:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1759:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2388:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2602:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2288:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2081:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2014:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2383:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2351:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2054:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2053:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2813:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1934:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.3208:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2040:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1993:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1421:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2227:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2592:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2592:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2991:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1919:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2486:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1802:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1849:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2014:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2688:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2302:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1785:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1926:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1797:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2252:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2325:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2188:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1975:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1823:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2102:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1815:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1916:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2371:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2502:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2102:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.3297:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2674:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2409:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1938:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2197:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1780:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1427:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1960:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2164:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1949:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2293:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2130:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2435:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1919:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2278:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1705:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2012:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2296:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2277:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1744:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1853:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2329:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2372:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1854:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1911:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2372:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2048:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2782:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2265:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2698:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.3252:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2105:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2023:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2279:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1900:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2753:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2406:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2163:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2246:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2054:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2167:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1763:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2242:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2484:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2122:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2327:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2289:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2197:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2371:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2228:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2216:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1982:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2901:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2618:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1930:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2206:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.3340:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.3340:  47%|████▋     | 189/401 [01:49<01:16,  2.79it/s]training loss: 0.2522:  47%|████▋     | 189/401 [01:49<01:16,  2.79it/s]training loss: 0.2719:  47%|████▋     | 189/401 [01:49<01:16,  2.79it/s]training loss: 0.2704:  47%|████▋     | 189/401 [01:49<01:16,  2.79it/s]training loss: 0.2260:  47%|████▋     | 189/401 [01:49<01:16,  2.79it/s]training loss: 0.2055:  47%|████▋     | 189/401 [01:49<01:16,  2.79it/s]training loss: 0.2355:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2563:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1846:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2200:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2484:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1977:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1926:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2329:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1719:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2322:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2523:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2475:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2417:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1756:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1948:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2358:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2451:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1830:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2085:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2264:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1835:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1962:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2457:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2021:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2657:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1862:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2372:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1979:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2047:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2760:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2008:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2239:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2895:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2160:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1450:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1676:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2253:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.3282:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2006:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2782:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2048:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2185:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1628:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2101:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2190:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1900:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2134:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2373:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2134:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2228:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1611:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2052:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2297:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2304:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2415:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1868:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2347:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1947:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2126:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2286:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2116:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2253:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2129:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1931:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.3047:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2277:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2230:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1858:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2137:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2426:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2140:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1939:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2063:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2417:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2417:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2133:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1865:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1894:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2082:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1659:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1855:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2299:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2035:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2082:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2007:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2255:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2484:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1806:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2605:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2392:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2307:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2447:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2344:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2585:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1798:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2161:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2685:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1832:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2146:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1893:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1659:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1689:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2557:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2615:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1849:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1792:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2712:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2019:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2097:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1677:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1948:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2404:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2756:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2163:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2455:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2990:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1937:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1688:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2373:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1653:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2231:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1789:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2281:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2505:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2393:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2437:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2058:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2118:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2494:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2499:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2232:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2248:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1812:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2275:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1802:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1741:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2171:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2345:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2531:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2098:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1935:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2032:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2327:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2238:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2053:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1999:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1491:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2359:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2669:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2094:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2464:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2232:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.3801:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2616:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2616:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2032:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2094:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2700:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2102:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1726:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1911:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2310:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2773:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2327:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1649:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2254:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2248:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1740:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2937:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1872:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2353:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2183:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1751:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2022:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2033:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2432:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1976:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2513:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2091:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2302:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1944:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2793:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1746:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2213:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1960:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1840:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2392:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2744:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1671:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1966:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2563:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2395:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2044:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1950:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1857:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2043:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1791:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1984:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2016:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2603:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2052:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1843:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2090:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1718:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2307:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2886:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1617:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2153:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2109:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2744:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1924:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1980:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2199:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2799:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2319:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2156:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2005:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1488:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2356:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1871:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1696:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2300:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2452:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1992:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2224:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2441:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2378:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.3042:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2442:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1713:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2687:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2542:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1914:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2490:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2490:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2563:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2335:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1644:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2057:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1708:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2720:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1616:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2042:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1946:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2012:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2094:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2163:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2233:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1950:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2365:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2448:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2052:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2237:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1942:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2319:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2124:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2407:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1931:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1880:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1935:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2337:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2177:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2325:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1869:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2478:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2284:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1983:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2475:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1923:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2510:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2186:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2466:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1997:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1980:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2637:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2084:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2426:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2147:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2562:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1883:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1922:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1808:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2269:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1880:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1963:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1990:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1950:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2060:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1992:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2433:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1655:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2664:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2173:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2601:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1910:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2242:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1828:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.3315:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2713:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1988:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2698:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2651:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2231:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1803:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2302:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2494:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1893:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1682:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2112:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2279:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2159:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2098:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2075:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1594:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1594:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2344:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2824:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2296:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2170:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2676:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1842:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2008:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1911:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2154:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2262:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2841:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1961:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2017:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2409:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2250:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2148:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1920:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2141:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2765:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2016:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1705:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2202:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2129:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2752:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2046:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2236:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1897:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2513:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2920:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2146:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2796:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.3138:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1946:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1838:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2177:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2064:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2632:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2532:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2541:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2255:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2054:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2787:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2149:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1908:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2439:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1894:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1913:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2225:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1986:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2040:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2742:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2018:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2435:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2191:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2036:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2019:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2172:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2354:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2252:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2093:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2144:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2093:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2481:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2272:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2065:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2331:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2071:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2282:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2164:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2188:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2169:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2101:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.1982:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.1783:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2828:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.1209:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2272:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2311:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.1990:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.1990:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2194:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2628:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1864:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2875:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2245:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1597:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2015:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1936:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2270:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2328:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2297:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.3088:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1819:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2154:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2201:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2009:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2084:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2627:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2021:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1579:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1641:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2068:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1782:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1861:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2589:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2503:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2141:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1743:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2023:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2095:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2228:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2398:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.3368:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2420:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1949:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1980:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2666:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2515:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1980:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2048:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2219:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2312:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2123:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2222:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2257:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1881:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2341:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2033:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1886:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2455:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2673:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2741:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1957:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1989:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2123:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2407:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2293:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2350:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2194:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2139:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1966:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2110:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2399:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1960:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2021:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1614:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1773:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1973:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2079:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2564:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2226:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2471:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2645:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2248:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2236:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2240:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2028:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2782:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1153:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1153:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2048:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1924:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2165:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1858:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1960:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2313:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2086:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2367:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2591:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1762:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2488:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1696:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2382:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2066:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2200:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2191:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1929:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2173:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2624:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2421:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2298:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2029:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2218:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2005:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2335:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2598:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2059:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2210:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2792:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2948:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1806:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1886:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2197:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2454:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2044:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1948:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2401:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1724:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2734:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2602:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2045:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2004:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2284:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2340:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2029:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2605:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2155:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1943:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1517:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2093:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2776:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2255:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2538:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2413:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2224:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1613:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1893:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2261:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2330:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2210:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1862:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1815:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2381:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2132:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2073:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2042:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2228:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2571:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1460:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2259:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2010:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1902:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2550:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2467:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2345:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1862:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2798:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2123:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1075:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1075:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2929:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.1659:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2166:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2365:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2029:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2414:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2079:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2166:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.1786:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2102:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2397:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2549:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2063:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2144:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2328:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2228:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2364:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2761:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2414:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2116:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.1742:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2378:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2187:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.3060:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2234:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2290:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2946:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.1766:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2234:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2121:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2701:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2177:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2406:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2093:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2126:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.1952:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2218:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2125:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2286:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2966:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.1665:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.1997:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2270:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2692:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2313:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2327:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2415:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2235:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2380:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2083:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.1921:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2186:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.1903:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2255:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2564:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2878:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2284:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2135:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2467:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2158:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2054:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2117:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2480:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.1918:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2167:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.1932:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.3009:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2115:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.1858:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2388:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.1758:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.1785:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2355:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2162:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2252:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2346:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.1779:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2415:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2745:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2745:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2595:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1417:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2460:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2893:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.3000:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1965:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2714:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2486:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2070:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2520:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2225:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1634:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2125:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2203:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1943:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2271:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2584:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1877:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1859:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2069:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2289:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1704:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2327:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2043:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1931:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1535:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2545:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1811:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1890:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2210:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1518:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2150:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2058:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2831:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2184:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2213:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2531:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2692:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1704:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2731:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2031:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1988:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2303:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2663:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1773:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2331:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2383:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2332:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2003:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2497:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2289:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1949:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2715:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1789:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2181:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1921:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2310:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1826:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2702:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2309:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2401:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1917:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2273:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1904:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1875:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1980:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2202:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1889:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2289:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1964:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2385:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2121:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2996:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2145:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1766:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2004:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1607:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1720:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2359:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2359:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2328:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2543:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1985:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2289:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1866:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2166:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2039:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2079:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2352:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2340:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1988:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1765:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2209:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1891:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1943:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2216:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2802:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2321:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2277:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2092:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2721:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1961:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2483:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2069:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2296:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2478:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1819:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2280:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2452:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2539:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1949:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2247:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2707:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2646:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1946:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2176:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2247:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2143:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2235:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2639:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1930:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2104:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2247:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2822:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2190:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2282:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2342:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2218:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2345:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1908:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2045:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2646:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2760:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1817:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1658:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2467:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2603:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2332:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2135:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2117:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1973:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1861:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2701:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1805:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2345:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1699:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1862:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2193:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2083:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1795:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2545:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2199:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1960:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2687:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2249:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2013:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2240:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2337:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.0691:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.0691:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2437:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2144:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2586:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2180:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2012:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2265:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1579:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2836:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2880:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1694:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1978:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2536:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2678:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2799:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2252:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2370:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.3052:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2755:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2345:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2288:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2355:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2340:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1783:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2198:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2181:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2283:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1811:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.3107:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2543:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1980:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1933:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2315:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2144:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2659:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1954:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2118:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2202:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2056:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1883:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1883:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1729:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2133:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1867:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2101:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2562:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2077:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2311:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1727:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2345:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2162:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2390:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2835:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1977:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2497:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2510:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1817:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2320:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2304:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1661:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1728:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1481:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1711:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2439:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2012:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1963:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2457:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1954:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1898:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1709:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1886:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1513:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2689:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2764:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1820:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1709:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1309:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2063:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2915:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1929:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1929:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2294:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2049:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1821:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2320:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2053:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1941:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1816:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1548:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1792:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2034:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1638:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2647:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1976:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2291:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2856:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2323:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2067:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1311:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1573:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1616:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2936:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2310:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2014:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2042:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2365:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1897:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2512:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2410:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1971:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2104:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2003:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2685:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2288:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2327:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2437:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2206:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2328:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2143:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2014:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2309:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2873:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2381:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2019:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2331:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2188:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2533:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2375:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2036:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2647:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2738:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2667:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1791:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2149:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1683:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2293:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2369:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2234:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1913:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2257:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2580:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2608:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2007:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2885:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1986:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2185:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2172:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1708:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2532:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2204:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2038:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2140:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2132:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2593:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2294:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2196:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2289:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2049:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2397:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2489:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2489:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1871:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2766:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2074:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2237:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1783:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1893:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1730:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2525:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1836:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2236:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2217:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2543:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2730:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2096:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1979:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2317:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2222:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2335:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2099:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2425:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2471:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2627:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2948:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1985:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2704:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1980:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2278:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2635:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1766:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2202:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2142:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1876:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2215:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2383:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2170:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2071:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1897:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2061:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2050:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1859:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2046:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2431:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1754:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1745:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1997:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2402:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1721:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1703:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1711:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2202:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2475:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2404:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2182:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2307:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2245:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2010:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1991:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1869:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2557:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2158:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2321:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1630:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2477:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1976:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1999:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2080:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1890:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2003:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2236:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.3337:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1821:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1972:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2845:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1989:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2003:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1608:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1820:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2212:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1913:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1913:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2144:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.1557:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2310:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2525:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.1975:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2013:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2730:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.1582:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2223:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.1508:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2463:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2368:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2129:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2840:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2257:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2380:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2888:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2045:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.3233:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2182:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2115:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.1846:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2162:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1858:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2749:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1975:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2386:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2652:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2159:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2122:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2468:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2025:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2367:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2413:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2464:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1813:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1884:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1861:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2866:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2232:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1963:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2262:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1987:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1970:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2350:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2382:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2131:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2106:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1990:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1813:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1870:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1696:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2475:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2272:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1578:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2327:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1691:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2126:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2067:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2314:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2448:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2471:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2101:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2830:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2878:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1691:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2060:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2237:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1859:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2011:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1837:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2046:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2117:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2034:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1785:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2602:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1970:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1930:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.3802:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.3802:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2421:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2492:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2010:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2330:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1958:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1864:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2540:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2029:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1696:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2100:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2311:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1787:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2068:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2839:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2286:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1635:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1480:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1948:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2451:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1780:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2035:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1676:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1854:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2451:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2297:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2189:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1828:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1982:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2041:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2312:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2213:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2153:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2180:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1985:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2331:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.3057:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1660:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1712:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2133:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2249:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1693:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2325:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1909:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2704:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2586:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2068:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2049:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2527:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2519:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2731:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2577:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2661:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2091:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2627:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2014:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2052:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2357:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1891:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2006:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1935:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1886:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.3408:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2433:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2195:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2683:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2467:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1615:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2246:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2012:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2264:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2458:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2134:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2566:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1952:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2580:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2239:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2446:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2195:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1644:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1644:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1969:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2065:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2191:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2062:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2235:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2180:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1597:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2253:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1698:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2479:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2301:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2177:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2385:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1781:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2398:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1912:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1812:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2496:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1845:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2153:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1750:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2808:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2275:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2422:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1789:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2282:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2297:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2343:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1842:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1822:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2672:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2095:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2042:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2286:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1827:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2125:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1706:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2622:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1778:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2086:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.3017:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2915:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.3317:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2148:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2035:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2775:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2271:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2714:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2174:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2343:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2082:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2388:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2433:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2256:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1936:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.3147:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2199:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1960:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2815:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2228:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2372:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2519:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2569:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2140:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2565:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2116:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1811:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2843:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2024:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2366:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2292:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2146:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2269:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2229:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1972:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2278:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2180:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1547:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1477:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1477:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2040:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2396:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.1968:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.1986:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2345:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2082:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2578:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2319:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2247:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2057:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2729:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2576:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2102:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2431:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2154:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.3003:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2470:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2686:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2562:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.1746:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2349:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.1916:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2058:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2036:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2189:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1895:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2433:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2394:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.3019:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2527:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1882:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1785:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2174:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2705:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1719:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2687:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2010:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1964:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2147:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2332:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2379:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1828:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2092:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1652:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2101:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2139:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1402:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2475:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1861:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2136:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2319:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1959:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2668:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2207:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2424:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1975:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2319:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1850:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2722:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1680:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2402:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2309:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1658:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2163:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1815:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2034:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2371:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2294:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2114:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2450:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2158:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2076:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2158:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1724:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2763:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2504:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1962:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2220:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2625:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2625:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2501:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1949:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2088:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2280:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2208:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2479:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2620:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1805:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2392:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1605:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2864:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1996:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1833:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1499:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2382:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2830:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2285:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2105:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1878:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2007:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2060:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2057:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2040:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2090:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2426:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2597:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2414:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2111:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2635:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1870:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2035:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2367:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2582:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2278:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2794:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2106:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2318:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1998:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1860:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2384:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2549:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2475:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1842:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2727:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1843:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2503:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2334:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2170:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2320:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2403:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2304:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1812:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2682:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2207:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2182:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1824:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2136:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2115:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2561:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1680:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1768:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2827:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1974:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2277:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2465:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1802:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2244:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2272:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2110:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2350:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2538:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2122:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2285:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2109:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2503:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2323:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2688:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2527:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2235:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2235:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2360:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2188:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2039:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2058:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2354:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2220:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1897:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2477:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2560:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2257:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2091:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1634:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2380:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1674:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1946:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2258:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1882:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2538:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1879:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2084:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1934:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1837:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1928:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2393:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2163:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2510:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2358:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1971:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2123:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1597:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2050:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1826:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2249:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2079:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1669:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2486:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2651:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1756:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1967:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1565:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1673:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2087:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2284:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2503:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2252:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1927:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2836:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2149:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2182:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1794:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2182:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2352:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2611:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2513:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2334:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2099:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1670:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2316:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2057:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2207:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2138:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2078:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1850:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1934:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2280:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2628:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1895:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1971:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1962:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2256:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2516:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1698:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2215:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2094:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1852:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2943:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2216:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2131:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1973:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1973:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2168:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2138:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2253:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2736:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2180:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2152:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1691:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2438:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2470:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2300:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.3067:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1662:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2272:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2870:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2002:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2422:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1559:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1892:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1724:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2132:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1944:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2659:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1857:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1714:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2382:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2045:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1842:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1537:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2342:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2127:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2366:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1951:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2395:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2075:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2170:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2172:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2598:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1852:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2378:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2821:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2077:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2056:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2158:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2442:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1825:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2129:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2071:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1802:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2451:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1508:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1873:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2918:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1970:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2239:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1791:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2098:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.3090:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2152:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2093:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2433:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.3060:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1903:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2194:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2455:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2182:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2980:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2863:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2547:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1577:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2192:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1403:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2355:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1734:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2456:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1763:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1843:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2047:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1775:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1054:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1054:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1977:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2206:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2834:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1493:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2427:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2435:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1935:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2388:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2347:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1763:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2807:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2092:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2527:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1573:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2020:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1925:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2430:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1955:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2004:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2485:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2466:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2477:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2300:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2110:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2074:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.3811:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2356:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2088:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1582:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2285:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2611:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2305:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2295:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1706:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2164:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1951:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1722:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1881:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2746:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2143:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1741:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2539:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2897:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2319:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2090:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2002:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1767:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2304:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2341:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2260:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2438:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2023:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2109:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1158:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1747:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2403:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2452:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2102:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2228:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2390:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2585:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2501:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1860:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2711:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1808:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1849:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2137:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1601:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2336:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2309:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2186:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2241:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1952:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1781:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2156:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2657:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2054:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2133:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2077:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2077:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2222:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2065:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2413:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1792:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2068:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1582:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2133:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2044:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1835:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2122:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1264:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2119:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2716:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2812:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.3012:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2011:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1672:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2192:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2132:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2015:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1754:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2496:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1780:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2036:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1853:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1992:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2044:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.3605:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1923:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2052:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2027:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2104:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2125:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2110:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2746:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2383:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1915:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2850:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2203:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2636:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2309:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2268:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1939:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2255:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1855:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1927:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2333:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2868:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2311:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2072:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2582:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2002:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2100:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2157:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2728:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2581:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2832:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2191:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1853:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2043:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2208:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2431:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2019:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1783:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2247:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2392:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1944:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2323:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2181:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2107:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1933:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2410:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2311:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1794:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2330:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2089:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2710:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2624:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2427:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2427:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2120:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2104:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2293:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2379:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1774:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1981:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1589:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2137:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2485:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2139:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1961:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1942:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1932:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2871:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1793:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1786:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2509:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1803:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1983:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2519:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1674:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2345:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2188:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2581:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2155:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2222:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2309:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2140:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2227:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2440:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2820:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2602:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2432:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2788:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1916:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1730:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2181:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2163:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1997:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2502:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2157:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1914:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1775:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2043:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2104:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2543:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1906:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2231:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2182:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2317:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2083:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2971:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1798:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2711:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2275:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2548:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2020:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1615:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2585:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2350:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2165:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2318:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2259:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2405:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1562:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2291:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2337:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2409:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2363:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2675:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1985:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1918:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2107:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2595:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1844:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2013:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2389:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2558:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2390:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2390:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2115:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1952:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1773:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2530:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2189:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1774:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2348:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2206:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2423:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2156:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1465:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2918:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2014:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1910:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1980:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2231:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2516:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1889:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1697:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2142:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2203:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2521:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2310:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2003:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2183:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2427:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2349:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2055:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2185:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2052:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1787:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2196:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1993:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2209:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2476:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2058:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2255:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2373:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1869:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2348:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1451:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2403:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.3265:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2026:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2096:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2657:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2296:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1866:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2382:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2159:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2299:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1607:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2236:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2355:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2321:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2196:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1911:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1739:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2635:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2156:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2300:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2485:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1887:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2008:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2141:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2347:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1993:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2340:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2336:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2012:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1641:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2449:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2701:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2149:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1523:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1921:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2435:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1840:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2436:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2436:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2135:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2012:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1936:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2166:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2194:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1921:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1654:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2059:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2106:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2175:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2378:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2293:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1812:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1696:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2275:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2584:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1941:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2277:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.3171:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2058:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1834:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1719:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2098:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2269:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2220:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2132:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2032:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2260:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1755:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2525:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2078:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1991:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2901:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1571:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1591:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2188:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2293:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2057:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1611:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2192:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2036:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1380:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2078:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2391:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2393:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2202:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2200:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2384:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2669:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2260:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1986:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2022:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1691:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2095:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1842:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1972:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1373:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2290:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2375:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1674:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2438:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2306:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2480:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1992:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2405:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2612:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2754:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2276:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2623:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1645:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2188:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2051:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2167:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2272:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1614:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.3113:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2159:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.3063:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.3408:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.3408:  53%|█████▎    | 214/401 [02:04<01:42,  1.82it/s]training loss: 0.2098:  53%|█████▎    | 214/401 [02:04<01:42,  1.82it/s]training loss: 0.2594:  53%|█████▎    | 214/401 [02:04<01:42,  1.82it/s]training loss: 0.1954:  53%|█████▎    | 214/401 [02:04<01:42,  1.82it/s]training loss: 0.2129:  53%|█████▎    | 214/401 [02:04<01:42,  1.82it/s]training loss: 0.2344:  53%|█████▎    | 214/401 [02:04<01:42,  1.82it/s]training loss: 0.1827:  53%|█████▎    | 214/401 [02:04<01:42,  1.82it/s]training loss: 0.2633:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2342:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2241:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2497:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2151:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2106:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2406:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1717:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2360:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1555:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2059:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1670:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2815:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2195:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1752:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2631:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1901:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2335:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2498:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2081:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2402:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2132:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1996:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1925:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1809:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1846:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2327:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2197:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2203:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2211:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1608:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2164:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2516:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2096:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2015:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2117:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2058:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2303:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2223:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2368:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2315:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2376:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2459:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2239:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2301:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2534:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2653:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2475:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2656:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2710:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1890:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1681:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1723:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2202:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2017:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2139:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1834:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2064:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2146:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2146:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2363:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2010:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1843:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2258:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2335:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2061:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1654:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2305:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1789:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2261:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1931:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2370:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.4758:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.4758:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2182:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2430:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1650:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1947:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2366:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2476:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2192:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1840:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2277:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2124:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2134:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2205:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1777:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2153:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2334:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2072:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2339:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1759:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2754:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2181:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2098:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2024:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2179:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2259:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2798:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2155:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2618:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1953:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2072:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2337:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2223:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2038:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1557:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1833:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1389:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2183:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2573:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2529:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2172:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2423:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2073:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2155:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2660:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2120:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2556:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2539:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1959:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2246:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2207:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2632:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2197:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2616:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2581:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1954:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1814:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2261:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2710:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2177:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2193:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2487:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1779:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2843:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2219:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1868:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2266:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1862:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2007:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2666:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2502:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2080:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2093:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2279:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2317:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2473:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2263:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2740:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2255:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2339:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1742:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1742:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2262:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2072:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2294:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1764:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2168:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2023:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1714:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2034:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1678:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2340:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2758:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1882:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1261:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2137:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1644:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2543:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2686:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2049:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2256:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2447:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2359:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2322:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1747:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2558:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2449:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1894:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2563:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2411:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2657:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2110:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2873:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1848:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2242:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2396:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1859:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2047:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1979:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2116:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2220:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1634:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2269:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2032:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2011:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2490:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1794:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2107:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2550:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2051:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2059:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2020:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2357:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2691:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1827:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2504:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1900:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1950:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2254:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2353:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2327:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2510:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1965:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1977:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2249:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2554:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2307:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1835:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2859:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1976:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2099:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1962:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2020:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2632:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1981:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2203:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1732:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2394:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2418:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1832:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1131:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1131:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1816:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2192:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2695:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2164:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2173:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2683:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2530:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2408:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2068:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2035:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2414:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2513:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2485:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1959:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2043:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2305:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2382:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2096:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1888:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2246:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2398:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2545:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1671:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2303:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2008:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2609:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2347:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2493:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2559:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2109:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2346:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1990:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2870:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2002:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2067:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1437:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2506:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2100:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2394:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1973:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1756:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2096:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1630:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1887:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1806:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1859:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2238:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2041:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1570:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2601:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2172:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2238:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2124:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2053:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2025:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2426:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2573:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1671:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2141:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1847:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2526:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2768:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2190:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1820:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2308:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2135:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2682:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2547:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2130:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2428:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1424:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2555:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2091:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1823:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2391:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1928:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2169:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2634:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1479:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1479:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2167:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1854:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2152:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2399:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2360:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2810:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2319:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1942:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1764:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2512:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2514:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2351:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1956:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2623:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2732:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1717:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1742:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2329:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2281:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2220:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1493:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2126:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1771:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2550:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1953:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2273:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2536:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1774:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2132:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2011:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2226:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1856:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1590:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2292:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2153:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2369:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2501:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2051:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2791:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1814:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1781:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2119:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2102:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1478:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2164:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2180:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1935:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2087:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2267:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1881:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2136:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2673:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1954:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2352:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1947:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1994:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2048:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2586:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2010:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2544:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2842:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2337:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2065:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1713:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1596:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2291:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2281:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2596:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2512:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.1985:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2113:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2711:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.1834:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.1500:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2102:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2463:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2954:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2020:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.1668:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.1668:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2098:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2316:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2159:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2065:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2003:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2582:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2417:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2122:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2140:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2266:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2461:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1886:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2300:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2491:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2678:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2345:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2083:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1936:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1852:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2437:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2071:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2493:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2556:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2313:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2699:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2772:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2210:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2421:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2152:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2541:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2062:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1960:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1547:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1566:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2340:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2375:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1913:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1974:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1814:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2442:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2570:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2447:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2381:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2055:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2416:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.3092:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2202:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2029:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2169:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.3142:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2005:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2063:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2698:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2767:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2023:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2152:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2086:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2148:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1824:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2132:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2669:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2268:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2425:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2854:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2069:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.3044:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1975:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2307:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1535:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2419:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1810:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1843:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2052:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2303:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2135:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2146:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1939:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2369:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1939:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1939:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2692:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2624:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1740:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1363:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1958:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1913:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2625:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2627:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2318:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1823:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2537:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1998:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2291:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2441:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2831:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1957:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2013:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1962:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1979:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1827:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2008:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1754:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2049:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2404:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2181:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2422:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2329:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2569:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2090:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1620:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2361:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2203:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1634:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2447:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2943:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2152:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2086:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2119:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1680:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2565:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2463:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2323:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1941:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1768:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2127:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1936:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2553:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1932:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2390:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2235:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2282:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2172:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2550:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2536:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2888:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2239:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2327:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2263:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1570:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2095:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2251:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1578:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2332:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2027:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1648:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1817:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1850:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2500:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1869:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2587:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2435:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2026:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2039:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2140:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2606:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1940:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1683:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1955:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1821:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1821:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2203:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1943:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2702:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2110:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2420:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2078:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2068:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2645:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2048:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2205:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.3247:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2108:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2047:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1772:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1645:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1797:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1961:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2791:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1700:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2494:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1863:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2111:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2124:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2423:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1749:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1885:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2211:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2047:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1527:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2048:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1760:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2394:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2198:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1603:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2137:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2024:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2618:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2126:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2321:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2330:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1772:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1826:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1976:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1755:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2165:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1771:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2545:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2078:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2142:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1968:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2473:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1999:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1872:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2206:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1998:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1920:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2484:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2433:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1854:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2985:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2402:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1900:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2406:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2157:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2521:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2336:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2052:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2636:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2285:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2413:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2355:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1765:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2322:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2041:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1828:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1689:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2447:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2385:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1250:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1250:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2908:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2431:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2215:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1699:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2237:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2460:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1641:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2584:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2662:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2401:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2241:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1934:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2025:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2088:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2351:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2518:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2654:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1671:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2108:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1557:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1909:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1575:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2161:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2558:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1944:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2979:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2344:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2144:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2703:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1565:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2243:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1947:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2053:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2391:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2456:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1858:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2550:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1803:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2578:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1908:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2225:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1797:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1845:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2121:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2017:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2196:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2484:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1891:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2602:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1941:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2308:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2128:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2269:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2228:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2454:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1521:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1439:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1462:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2647:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2231:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2659:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2059:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2083:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1894:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2984:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1796:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2723:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2170:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2224:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1989:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2414:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2077:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2307:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2097:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2135:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2166:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2291:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2114:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2413:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2413:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2019:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2478:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1723:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2367:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2171:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1789:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1776:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2332:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1864:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1672:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1758:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1824:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2078:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2258:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2789:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1957:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2252:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1894:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1808:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2790:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2648:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2110:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2544:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2271:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1910:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2072:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2209:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2331:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2589:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2200:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2321:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1996:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2229:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1980:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2698:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2260:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1623:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2513:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2275:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2335:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2698:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1839:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2390:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1494:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2321:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2004:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2720:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2325:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2766:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1794:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2111:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2569:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1754:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2220:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2087:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1535:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1959:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1788:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1886:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2321:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2166:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1944:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1549:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1975:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1789:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2764:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2428:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2216:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2019:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2228:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2125:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1558:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1755:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2149:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1870:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2249:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2269:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2881:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.3154:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.3154:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2275:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2163:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1996:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2190:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2106:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2227:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1813:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1699:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1852:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2663:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2075:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2130:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2297:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2347:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2572:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2178:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2497:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2533:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2498:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1928:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2186:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2531:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2394:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2114:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1792:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2444:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1965:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1679:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2509:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2415:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1604:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2654:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2837:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1883:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1830:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2383:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2253:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2470:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2138:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2398:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1875:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1627:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1831:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.3239:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2249:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.3000:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2367:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2173:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2596:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2120:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2300:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2356:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2198:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2715:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2620:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2466:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1865:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1801:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2909:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1626:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2974:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2358:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2716:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2094:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2211:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2567:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1804:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2164:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1953:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2045:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2248:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2804:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1998:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2281:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2585:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2041:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2522:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2150:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1225:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1225:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1979:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2728:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.3264:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2116:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1429:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2511:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2231:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2122:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1754:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2475:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2079:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2275:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1759:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2105:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2110:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1660:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2256:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1849:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1838:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2409:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2290:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2358:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2523:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1957:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2224:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1937:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1956:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2401:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2344:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1648:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1963:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2714:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2414:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2336:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1908:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2154:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2306:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1881:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1844:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1903:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1696:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1954:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1668:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2273:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1548:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2323:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2188:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2375:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2166:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2536:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2049:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1700:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2241:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2350:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2312:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2532:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2556:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2206:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1941:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2255:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2370:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2881:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2335:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2075:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2320:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2139:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2437:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2560:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2033:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2395:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2041:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2569:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1580:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2148:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2081:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2063:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2034:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2134:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.3513:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.3513:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1722:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2028:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.3244:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1756:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1735:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2356:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2039:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2194:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2612:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2044:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2120:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2141:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2186:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2193:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2526:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2013:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1946:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1872:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2534:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2026:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2092:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2319:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2286:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1881:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2228:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1326:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2579:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2234:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1887:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1300:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1951:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2212:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2382:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2216:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2530:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1733:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1646:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1719:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1850:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1918:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2559:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2389:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2620:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2140:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1891:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1961:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2834:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2355:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1867:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2607:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1925:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2124:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2727:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1712:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2091:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2013:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1634:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2333:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2034:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1974:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1665:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2164:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2355:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1653:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1643:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1908:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1854:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2456:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1954:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2050:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2979:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1736:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1849:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2395:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2322:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2103:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1735:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1850:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.0809:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.0809:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2322:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1721:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2303:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2227:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2291:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2367:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1952:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2450:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2116:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1952:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2635:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1838:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2278:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2374:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2261:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1985:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2004:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2191:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2364:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1575:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1620:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1604:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2509:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2534:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1778:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1990:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2248:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2494:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2070:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1991:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1687:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2335:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1916:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2751:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2228:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1839:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2543:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2054:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2140:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1687:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2321:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2019:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1810:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1792:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1787:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2307:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1984:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2089:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1716:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2953:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1662:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2253:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2217:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1907:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1953:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1951:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2687:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2298:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2337:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2296:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2526:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2482:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2189:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2023:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1779:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1929:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2205:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2436:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1663:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1774:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2474:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1974:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2105:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2752:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1578:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2201:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1765:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2005:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2532:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2532:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2366:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2854:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2373:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2482:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2563:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2152:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1377:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2433:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2455:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1671:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1995:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2601:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1966:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2677:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2405:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1941:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2180:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2063:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2430:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2057:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2427:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1921:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2353:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1852:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1646:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2823:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1991:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1867:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2464:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1987:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2437:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2082:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2122:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2714:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2094:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2367:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1889:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2361:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2200:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1939:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1376:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1933:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2402:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2394:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2454:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1651:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2596:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1473:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1649:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1891:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2200:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2128:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2529:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2013:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2406:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2236:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2027:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2095:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1552:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2533:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2566:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1343:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2345:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1609:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2186:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2196:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2131:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1979:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2347:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1936:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2042:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1456:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2286:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1544:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1870:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1845:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.3159:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2182:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.3790:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.3790:  57%|█████▋    | 229/401 [02:13<01:17,  2.23it/s]training loss: 0.2708:  57%|█████▋    | 229/401 [02:13<01:17,  2.23it/s]training loss: 0.2017:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1819:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2044:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2066:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2133:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1685:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1937:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1640:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2326:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2034:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1942:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2270:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2428:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1546:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2102:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2295:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1698:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2220:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1943:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2011:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2083:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2517:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2042:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2272:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1934:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1705:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2461:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2030:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2091:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2897:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2129:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2408:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1997:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1834:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2311:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1524:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2263:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2353:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1807:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2046:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1866:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2434:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2732:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2883:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1770:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2507:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2276:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2041:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2539:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1796:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2162:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2282:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2153:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2456:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2007:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1663:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2136:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2392:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2355:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2579:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2149:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2359:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1952:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1665:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1821:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1972:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2421:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1928:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2233:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2243:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2211:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2848:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.3004:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2403:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2799:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2084:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2093:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1918:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1918:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1857:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2053:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1804:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1826:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2706:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1937:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2007:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2330:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2101:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2501:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1866:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2236:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2528:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2000:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2121:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2409:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2431:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2434:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1914:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2149:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2524:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2035:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2681:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1795:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2014:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2170:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1679:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2626:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2569:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1880:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2442:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2104:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1917:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2471:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2155:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1801:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2110:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2489:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1690:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1931:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2182:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1997:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2462:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2354:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2098:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2278:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1716:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2299:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1748:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2702:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2046:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1603:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2023:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2039:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1930:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2517:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1805:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2055:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2226:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1620:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1827:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1928:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1925:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2094:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2326:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1981:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2912:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1696:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1854:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1745:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2102:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2616:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2109:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1901:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2857:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2391:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1864:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2049:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1807:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1807:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2585:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1659:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2012:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2026:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2147:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1881:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1729:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1897:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1968:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2759:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1708:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1909:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2151:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2487:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2001:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1935:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2179:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2062:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1900:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2300:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2645:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1855:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1946:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2311:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2603:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2684:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2084:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1746:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2218:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1813:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1903:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1829:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2351:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2683:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1923:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1683:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2483:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1868:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2281:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2160:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1935:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1998:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.3012:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2163:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2363:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2359:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2114:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2648:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2280:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2128:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2363:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2634:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2463:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2149:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2174:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2101:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2382:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1978:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1832:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1822:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2391:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2239:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2049:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2479:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2337:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2063:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2280:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1838:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2736:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2153:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2306:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2652:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2236:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1570:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2240:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2508:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1771:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1897:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1518:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1518:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1999:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1959:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1551:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1861:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1878:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1765:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2375:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2902:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2184:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2670:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2369:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2117:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1678:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1731:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1678:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2051:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2192:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2351:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2396:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2474:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2325:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2079:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2207:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2481:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2354:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2484:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1973:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2050:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2199:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1782:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2170:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1961:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2549:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1840:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2543:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1560:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2258:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1751:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2275:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1975:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1526:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1460:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2406:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1930:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2555:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2199:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2186:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1783:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1918:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2211:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.3246:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1845:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1965:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1974:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2070:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2165:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2383:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2535:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2467:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2163:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2802:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1701:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2386:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2826:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1816:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2113:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1826:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1837:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2262:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2438:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1999:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2170:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2328:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2465:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2106:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1819:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2409:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1898:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.3661:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.3661:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1920:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1983:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2000:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2253:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2537:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1990:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1988:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1865:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1703:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2283:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2652:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1905:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.3201:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2101:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2383:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2137:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2148:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1705:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2110:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2917:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2216:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1244:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2428:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1994:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2427:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2340:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1850:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2091:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1813:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2839:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2321:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2359:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2415:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1925:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2011:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2026:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2788:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1744:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2423:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2275:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1893:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2105:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2390:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1726:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2575:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1715:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2788:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2479:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2454:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1549:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2197:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1950:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2082:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2476:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2130:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2122:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2277:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2460:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2609:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.1995:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2198:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2177:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2655:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.1837:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.1863:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2121:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2369:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2399:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2155:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2482:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2693:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2048:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2169:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.1638:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2043:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2707:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.1379:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2166:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2688:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2688:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2178:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1907:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2500:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2409:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2168:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2303:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2105:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1711:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2601:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2199:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2076:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2768:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1864:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2799:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2284:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1900:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1990:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2117:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2087:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1958:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1814:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2476:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2055:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1909:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2186:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2871:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1292:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1578:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2134:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2578:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2721:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1831:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2252:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2369:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1986:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1656:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1968:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2107:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2143:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1624:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2154:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2788:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2327:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1888:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2015:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2110:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2235:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1929:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2352:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2313:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1596:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1870:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1930:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2222:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2566:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1874:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2606:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1955:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2755:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2571:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1947:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2791:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2472:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2111:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2161:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2457:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2245:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2087:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2079:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2458:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2391:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2696:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2066:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2159:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2601:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2578:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1682:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2013:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1995:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1995:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2145:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1812:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2134:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2835:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2432:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1878:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1806:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1894:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2265:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1950:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2348:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2629:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1974:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2026:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2482:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2112:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2318:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2009:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2568:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2160:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1827:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2341:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2403:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2617:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1695:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2141:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2509:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2337:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1963:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2572:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2088:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1900:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1988:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1834:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2530:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1873:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2439:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2075:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1962:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1707:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2679:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2284:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1972:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2538:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2495:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1873:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2101:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2780:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2169:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2228:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1773:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2597:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2006:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2221:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2230:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2326:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1702:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2069:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2395:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2063:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2222:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2360:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1841:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2378:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2310:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2397:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2514:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2597:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2284:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2118:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2329:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1954:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1886:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2163:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2449:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2644:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2408:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2043:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1807:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1807:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2290:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1788:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1830:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2100:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2031:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2357:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2232:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1492:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2384:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2052:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2307:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.3045:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1995:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1867:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1974:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1828:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2373:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1959:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2143:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2297:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2456:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1808:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1814:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1690:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2698:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2178:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2108:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2206:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2044:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1741:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2699:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1803:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2003:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2665:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2184:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2017:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2163:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1657:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2047:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2133:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1864:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2560:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2206:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2163:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2102:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2920:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2271:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2051:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2608:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1987:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2225:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2141:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1862:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2106:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2445:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2239:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2385:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2221:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2031:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1907:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2570:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1918:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2300:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2434:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1812:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2672:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1724:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1701:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1725:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2684:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2609:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2365:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2133:  59%|█████▉    | 236/401 [02:19<01:14,  2.23it/s]training loss: 0.1523:  59%|█████▉    | 236/401 [02:19<01:14,  2.23it/s]training loss: 0.2623:  59%|█████▉    | 236/401 [02:19<01:14,  2.23it/s]training loss: 0.2690:  59%|█████▉    | 236/401 [02:19<01:14,  2.23it/s]training loss: 0.1627:  59%|█████▉    | 236/401 [02:19<01:14,  2.23it/s]training loss: 0.1573:  59%|█████▉    | 236/401 [02:19<01:14,  2.23it/s]training loss: 0.2827:  59%|█████▉    | 236/401 [02:19<01:14,  2.23it/s]training loss: 0.2827:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2314:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2370:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2088:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2159:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2590:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2678:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2119:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.3601:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2521:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2324:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2102:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2201:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2643:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1970:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.3052:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2437:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2783:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1848:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1613:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2683:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1745:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1760:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2663:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1909:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2292:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2692:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2115:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2403:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2167:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2121:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2423:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1836:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2509:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2041:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2058:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1745:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2824:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1779:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1917:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2163:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2119:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2505:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2282:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2564:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2357:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1924:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2061:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2090:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2181:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2307:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2166:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2094:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2222:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2385:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2456:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2434:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1697:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2427:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2365:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1848:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1800:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1932:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2217:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2814:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2460:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2240:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1970:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1893:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2267:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2483:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2504:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1974:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1828:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2017:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2516:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1661:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2011:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1668:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1373:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1373:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1641:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2262:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2469:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1785:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2506:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2380:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2415:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1968:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1661:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2769:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1886:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2166:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1941:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1883:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2018:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2049:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1628:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2586:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2444:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2456:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1866:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2217:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2307:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2378:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2053:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2556:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2175:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2236:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2354:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1888:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1652:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2045:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2279:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2068:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1682:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1694:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2105:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2193:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1858:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2040:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2266:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2419:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2922:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2069:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1903:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2083:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2380:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2187:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2017:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1834:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1634:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2115:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2019:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2081:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1696:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2026:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2399:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2460:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2588:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2877:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2096:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2105:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1599:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1945:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2761:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2742:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2647:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2419:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2240:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2513:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2244:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2328:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2139:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2381:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1847:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1459:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1924:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2330:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1445:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1445:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2244:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2200:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2181:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1912:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1975:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2712:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2135:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2190:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2985:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1939:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2136:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2263:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2180:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1874:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2154:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2699:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2413:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1484:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1764:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2696:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2002:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2180:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1796:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2127:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2305:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2485:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2128:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1986:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1870:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2476:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2488:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1734:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1872:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1924:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2577:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2454:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2409:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2523:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2235:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2058:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2015:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2049:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1988:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1993:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2066:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2176:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2232:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2174:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1596:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2026:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1903:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2087:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1791:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2290:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2046:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2488:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2193:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1551:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2307:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2014:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2279:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1733:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2172:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2010:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2600:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2084:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1805:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1975:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2639:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1734:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2280:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2047:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1886:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2968:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1728:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2083:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2290:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2085:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1979:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1979:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.1497:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2075:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2160:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2024:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2144:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2498:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2850:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.1813:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2465:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2800:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2248:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2608:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1675:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1950:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2784:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2562:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2074:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1915:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2458:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2043:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1879:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2342:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2785:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1804:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2180:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1984:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1989:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2138:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1950:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2276:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1896:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1910:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2032:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2256:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1956:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2628:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2251:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2297:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2035:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1743:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2307:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1465:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2187:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2646:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2477:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2547:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2168:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2368:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2284:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2043:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1816:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2541:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1982:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1889:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2473:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2228:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2027:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2151:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2582:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2520:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2021:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1992:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2458:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1864:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2050:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1786:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1912:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2261:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2063:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2428:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2148:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2014:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1563:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2342:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2310:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1638:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2322:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2125:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.4195:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.4195:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2010:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1864:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2337:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2197:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.3003:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2394:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2953:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2456:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2253:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2103:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1645:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1624:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2118:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2402:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2352:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1739:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2615:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1979:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2324:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2083:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2456:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2427:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.3290:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2199:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2059:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2223:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1936:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2045:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1510:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2283:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2365:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2329:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1884:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1551:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1865:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2201:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2057:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2407:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2775:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2142:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2315:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2858:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2025:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2046:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2603:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1427:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1945:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2079:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1893:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2144:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1847:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2576:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1801:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2396:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1852:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1914:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1949:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1882:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1639:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2186:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1936:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2461:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1899:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1810:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2070:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2468:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2501:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2114:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2234:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2865:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2796:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2387:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2413:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1811:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1962:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2460:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2092:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2010:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1929:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1929:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2351:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2382:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1797:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2282:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2048:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1880:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1989:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1931:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2134:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2504:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2713:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2185:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2314:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2222:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2152:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2317:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2215:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1977:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2509:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2197:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2434:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1767:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1975:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2715:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1970:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2169:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2356:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2036:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2091:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2339:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1728:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2066:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2212:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2344:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2158:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2357:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1600:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2218:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1538:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1913:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2261:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1866:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2288:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2190:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1913:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2617:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2592:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2476:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2090:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1898:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2311:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2312:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2602:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2148:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2260:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2579:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2740:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2325:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2175:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1892:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1978:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2399:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1614:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1770:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1796:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1801:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2295:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1915:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1991:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2582:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2489:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2723:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2290:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2549:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2120:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2261:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1969:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2280:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2013:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2013:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2772:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2434:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2209:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2428:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2499:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2237:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1861:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2313:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1383:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2572:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2977:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1907:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2067:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1728:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1965:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2265:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2384:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2384:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1746:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2438:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2048:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2041:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2035:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1919:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2798:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1799:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2467:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2047:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1824:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1981:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2157:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2505:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1913:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1804:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2272:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1587:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1960:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2733:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1533:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1809:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2412:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2443:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1761:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1828:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1803:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2155:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1752:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2402:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2390:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2354:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1477:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2615:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1489:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2292:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1954:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1622:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2361:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2058:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2189:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2579:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1944:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2288:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1628:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2250:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1682:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1708:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2706:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1976:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2322:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2704:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2032:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2411:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2762:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2017:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2249:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2409:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1987:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1974:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1921:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1921:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2490:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2307:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2284:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2791:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2399:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2799:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2574:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2050:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2433:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2038:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2470:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2138:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2326:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.1623:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1873:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1948:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2097:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2270:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1681:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1983:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2694:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2814:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2237:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2210:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1498:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2811:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2026:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1326:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2245:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1369:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1719:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1208:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1875:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1883:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2035:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2410:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1978:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2149:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2504:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2385:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2229:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2180:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1897:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1835:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2287:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1969:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1861:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2141:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2280:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2398:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2128:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2025:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1379:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1817:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2306:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1915:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2107:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2391:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2097:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2306:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2148:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1937:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.3105:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2091:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2015:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2488:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1665:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2421:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1884:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2317:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1955:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2127:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2238:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1661:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1831:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2867:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2289:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2091:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2589:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2589:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2464:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2345:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2123:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2137:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1863:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1810:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1883:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2001:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2422:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2139:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1799:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2517:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1673:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2724:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1394:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2241:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1756:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2159:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1889:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2037:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2254:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2665:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2581:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1778:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2161:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2029:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2268:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1923:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2035:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2198:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1991:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2335:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1822:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1799:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1480:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2389:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2555:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1928:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2129:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1663:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2375:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2324:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1960:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1884:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1710:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2207:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2181:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1874:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2211:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2200:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2125:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1682:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2564:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2100:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1683:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2005:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1452:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2134:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2590:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2093:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1685:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2133:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1369:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2517:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1837:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1663:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2051:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1793:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1969:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1965:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2863:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2548:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1822:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2112:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2204:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2311:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2635:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2269:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1789:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1789:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2097:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2198:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1750:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1401:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2455:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1991:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1934:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2380:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2569:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2094:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1854:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2807:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2060:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2194:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2159:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2502:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2568:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2437:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2008:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2367:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2241:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1928:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2179:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1962:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1626:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2149:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2270:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2405:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1970:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1577:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2097:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2300:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2530:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2062:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2399:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2433:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2585:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2249:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1995:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2836:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1672:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1759:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2344:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2168:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1779:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1801:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1821:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2306:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1371:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2036:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2742:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1864:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1489:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2177:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2091:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2722:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1743:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1964:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2219:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2222:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2226:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2268:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2825:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1878:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1837:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1734:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2344:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2232:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2113:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2124:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2342:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2271:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2586:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2199:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1454:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2071:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1907:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2097:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.3410:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.3410:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2408:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2077:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2325:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1701:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2428:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1909:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2356:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2749:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1463:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2077:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2131:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2114:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2232:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1710:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2156:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2044:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1777:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2246:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2058:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1946:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2233:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1810:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1980:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1941:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1924:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2409:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2765:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2337:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2083:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2389:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2265:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1939:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2948:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1734:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1630:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1943:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1897:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2280:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2106:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2273:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2081:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1964:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1806:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1688:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2030:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2395:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2292:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1973:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2007:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2013:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2504:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2533:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2079:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2546:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1856:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2094:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2012:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1623:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2559:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2276:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2296:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1670:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2244:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2170:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1919:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1766:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1998:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2704:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1990:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2363:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2062:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1888:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2329:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2330:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2637:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2059:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1471:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2036:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.5231:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.5231:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1972:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2718:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1961:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2391:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2302:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2310:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2826:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2629:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1789:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1926:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1763:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2307:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1980:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2302:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2553:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2279:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1815:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1941:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2386:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1962:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2005:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.3011:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1517:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2649:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1828:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1722:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2449:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1503:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2082:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2078:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2467:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1714:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2904:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2461:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2005:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2569:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2009:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2098:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1805:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2763:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2645:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1665:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1496:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2393:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2203:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2453:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1991:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2134:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2223:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2747:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2220:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2268:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2220:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2143:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1883:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2208:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2487:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2107:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2091:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2528:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2307:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.3047:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2459:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2379:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2505:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1534:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2366:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2203:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2314:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2533:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2290:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1904:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2274:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2655:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.3046:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1651:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2191:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2428:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.0926:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.0926:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2024:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1718:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1975:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1970:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2009:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1847:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.3047:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2294:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2222:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2775:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2179:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2505:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2188:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2483:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1841:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2454:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1463:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1803:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1890:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2070:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2176:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2287:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2182:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2072:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2078:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2165:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1656:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1824:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1998:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2872:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2761:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1952:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2124:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2427:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2153:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2200:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1736:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2557:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2323:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1515:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1920:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1665:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1600:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1849:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2229:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2294:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2224:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1660:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1682:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1768:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2003:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2219:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2885:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1466:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2218:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2221:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1573:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2127:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2388:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2172:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2583:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2312:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2212:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1757:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1997:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2880:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1603:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1748:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2028:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2499:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2214:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2209:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2356:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2017:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1824:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1685:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2245:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2173:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2899:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2899:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1818:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2389:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1923:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1775:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1779:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2227:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1572:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2072:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2619:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2298:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2333:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1730:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2207:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2858:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1821:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2845:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2134:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2651:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1501:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1671:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1736:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2252:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1799:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2637:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2033:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1700:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2079:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1602:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2014:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2843:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2084:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2165:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2536:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2330:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1745:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1831:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.3131:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2352:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1770:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1886:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2798:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2907:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2177:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2120:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2636:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2184:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1642:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1829:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2130:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2159:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1727:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2348:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1862:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2417:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2169:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2085:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2361:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1848:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1889:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2674:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1794:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2111:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2224:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1956:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2197:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2060:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1791:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2725:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2731:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1743:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1833:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1716:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2172:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2098:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2107:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2239:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2428:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1867:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.0692:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.0692:  63%|██████▎   | 251/401 [02:28<02:49,  1.13s/it]training loss: 0.1771:  63%|██████▎   | 251/401 [02:28<02:49,  1.13s/it]training loss: 0.2398:  63%|██████▎   | 251/401 [02:28<02:49,  1.13s/it]training loss: 0.2206:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2779:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2544:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1539:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.3608:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2117:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1943:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2110:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1897:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1923:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1969:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1646:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2106:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1793:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2442:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2241:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1924:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1986:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2120:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2393:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1790:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2372:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2668:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2148:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1874:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2496:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2179:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1904:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1928:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2266:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2077:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1944:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1985:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2424:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2414:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2403:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1988:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1816:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2326:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2274:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1365:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1860:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1717:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2620:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2414:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2484:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2521:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2075:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1755:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2491:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1962:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2441:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1913:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2127:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2441:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2302:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1769:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2288:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2569:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1863:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2466:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2071:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2049:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2044:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1508:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1832:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2311:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1575:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2532:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2894:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1896:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1679:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2510:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2328:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1726:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.3302:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2560:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2560:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2225:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1722:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2617:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2252:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2273:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1607:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2418:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1902:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2190:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2520:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1907:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2270:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2510:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2073:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2276:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2281:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2176:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2391:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2018:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1858:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2148:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1659:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2066:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1628:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2650:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1918:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2113:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2227:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2034:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1906:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2546:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1926:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2648:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2142:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2478:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1865:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2421:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1945:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1627:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1589:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2600:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2148:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1594:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2915:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2401:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2522:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.3007:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1715:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.3058:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1818:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2040:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2144:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1801:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1986:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2645:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1917:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2039:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2404:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1949:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2496:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2840:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2313:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2120:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2436:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1656:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2562:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1933:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2146:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2370:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2062:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1898:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2262:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1558:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1991:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2409:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2244:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2551:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1877:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.3418:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.3418:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2666:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1986:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2224:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1833:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1531:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2633:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2111:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2721:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2251:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1612:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2377:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2777:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2427:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1911:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2194:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2716:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1760:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2407:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1907:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1954:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2061:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2146:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2060:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1896:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1713:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2086:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2075:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2554:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1796:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2111:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1540:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2418:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2536:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2621:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2425:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2853:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2356:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2350:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1802:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2470:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2383:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2933:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1671:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1913:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2115:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2054:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2665:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1939:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1971:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2397:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2119:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2023:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1923:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2689:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2229:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2563:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1406:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2273:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2443:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1767:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2651:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2062:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2227:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2029:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2517:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2566:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1518:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2369:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1895:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2316:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1998:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2569:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2631:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1654:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2525:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2600:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2045:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1946:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1020:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1020:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2830:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.1674:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.1794:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.1859:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2028:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2354:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2086:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2291:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2347:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.1829:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.1916:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2194:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.1460:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.1821:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2116:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2693:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2321:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.1972:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2441:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2208:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2504:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1945:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2740:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1821:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1668:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2513:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2592:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1957:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1534:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2012:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1816:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1819:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1899:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2391:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2462:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1834:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2343:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1651:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1888:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2344:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1880:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1844:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1995:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1420:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1847:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1864:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2296:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2509:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1797:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2042:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2227:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1860:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1724:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2447:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2066:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2059:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1670:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2743:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1683:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2271:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2535:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1984:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1957:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2362:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2014:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2759:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1850:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1730:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2255:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2375:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2476:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2512:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1702:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2628:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2183:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2761:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2090:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2733:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2291:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2291:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1594:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2609:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2537:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1856:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1948:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2552:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2177:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2363:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2625:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2459:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2011:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1946:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1737:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2153:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2114:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2395:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1668:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1985:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2168:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2187:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2131:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2108:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2857:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2349:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2063:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.3101:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1837:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2227:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2638:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1878:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2225:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2357:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2232:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1956:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2276:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2122:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2114:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2334:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2725:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2254:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2516:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2340:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2548:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2362:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2081:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2560:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2206:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2400:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1766:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1850:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2204:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2428:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2068:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2142:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1882:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1828:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2055:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2152:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1546:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2025:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2235:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1857:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2077:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2340:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1759:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2193:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2628:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2346:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2303:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1815:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2227:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2005:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2305:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2023:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2029:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2631:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2382:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2218:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1950:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1950:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2485:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2609:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2465:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1799:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.3303:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1488:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2278:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2679:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2434:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1988:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2142:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1984:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2355:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2055:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2240:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2476:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2064:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1923:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1853:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2975:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1886:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1539:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2295:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2580:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2669:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2120:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2043:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2069:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1889:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2111:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1622:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2058:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2571:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2359:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2208:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2333:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2039:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2297:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1801:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2435:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2252:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2535:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2816:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2161:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2103:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1759:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2123:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2761:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2009:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2361:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1705:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2541:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2238:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2516:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1605:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1511:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1884:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1997:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2036:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1932:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1770:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1716:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2294:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2665:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2534:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1846:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1678:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2093:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2612:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2071:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2314:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2258:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1611:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2096:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2132:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2165:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1570:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1887:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.0861:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.0861:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.1931:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2246:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2297:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.1568:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.1852:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2590:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2212:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2358:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2436:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.1898:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2210:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2357:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2126:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2295:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2137:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2440:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2157:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.1574:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2351:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2330:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2572:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2335:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.3173:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2292:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2215:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2330:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1708:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2069:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1719:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1665:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1995:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2519:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2248:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2117:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2343:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1862:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1539:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1680:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2332:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1900:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2205:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2874:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1930:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2149:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1641:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2887:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2145:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2103:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1871:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2484:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2442:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1998:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2715:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2148:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2758:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2237:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2186:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2151:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2155:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2953:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2616:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2676:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2079:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1881:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1981:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2480:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2141:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1787:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2955:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1638:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1808:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2240:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1550:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1612:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2105:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2942:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2374:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1706:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2526:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2526:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2265:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1649:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2033:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2442:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1995:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2084:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1904:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1966:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1919:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2556:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2252:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2392:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2189:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1798:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1400:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1511:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2083:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2409:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1504:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2789:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1580:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1808:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2999:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.3045:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2240:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1861:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2007:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1868:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1624:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2662:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2169:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2761:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2069:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2106:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2159:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1663:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2059:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1958:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1987:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1931:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2424:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1630:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2415:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2098:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2695:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2314:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2303:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2395:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1829:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2436:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1942:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2379:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2250:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2487:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1813:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2041:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1735:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2115:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2510:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2585:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2498:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1973:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1810:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1809:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1925:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2084:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2576:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2812:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2083:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2639:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2870:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2706:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2113:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2034:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1979:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1747:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2570:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2358:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2680:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2680:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2231:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2720:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1833:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2183:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2138:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2039:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.3019:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2263:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2131:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2691:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2122:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2053:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1585:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2372:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1928:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2233:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2717:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2157:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1393:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2443:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1514:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1289:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2465:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2168:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1701:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2090:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1931:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2732:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2295:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1618:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2335:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2179:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1416:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2412:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2125:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2351:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1894:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2697:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2092:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1302:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2269:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1814:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2303:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2394:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2240:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1932:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1986:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2411:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2308:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1933:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1734:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2562:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2025:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1825:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1610:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2564:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2265:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2090:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2540:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2502:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2073:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2470:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1708:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2818:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1813:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2296:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1915:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2957:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2444:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2265:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2328:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2325:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2836:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2141:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2034:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2109:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1890:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2108:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2329:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2329:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1989:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2009:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2083:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1617:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2446:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2323:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2695:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2294:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2295:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2363:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2357:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1890:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2008:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2492:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.3026:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2317:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1803:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2242:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2044:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2027:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2342:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.3090:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1716:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2116:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2255:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2053:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2168:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1740:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1491:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2023:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2222:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1979:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2040:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1949:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1648:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2528:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2600:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2211:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2129:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2253:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2306:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1620:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1922:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1892:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1712:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2090:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1775:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1765:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1801:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1681:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2385:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1949:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2297:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2152:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2219:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2721:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2222:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2376:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1840:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2230:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2247:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.3104:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2544:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2816:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1951:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2205:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2509:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1874:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2266:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2550:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2353:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2695:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2332:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2401:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2067:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2546:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2299:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2536:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1053:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1053:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2616:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2177:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1919:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2253:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2110:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2516:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2523:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2673:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2480:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2250:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2314:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2128:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2508:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2814:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2178:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2030:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2029:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2270:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2167:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1931:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1684:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2515:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1626:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2104:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2700:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.3033:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1894:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2077:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1997:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2635:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2672:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2011:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1846:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2074:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1733:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2274:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2121:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1928:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1873:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1793:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2014:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2470:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2286:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2455:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1962:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2170:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1738:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2404:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2126:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1951:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2675:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1893:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1964:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2573:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1784:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2060:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2268:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1955:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2026:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1784:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1981:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2221:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2662:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1865:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2042:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1669:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2562:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2100:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2433:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1771:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2375:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2918:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2394:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2035:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2020:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2290:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2275:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1829:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1615:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1615:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.1899:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2022:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2150:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2695:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2296:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2623:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2488:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2843:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2416:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2289:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.1985:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2167:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2126:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2551:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2764:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.1844:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2065:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2519:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2212:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.1663:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.3032:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2490:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.1699:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2632:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2580:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1743:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2517:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2005:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2131:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2172:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1819:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2173:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2330:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2353:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1978:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2410:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1652:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.3154:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1734:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1821:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2846:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1934:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2428:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2041:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1746:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2430:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1878:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2591:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2058:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2909:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2678:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1860:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1974:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1596:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2631:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1910:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2277:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1969:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2462:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2325:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1766:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2316:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2097:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2188:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1565:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1770:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1685:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1294:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2371:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2196:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2401:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1668:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2167:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.3049:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2251:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1897:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2424:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1951:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2054:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2054:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1989:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2357:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2522:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1791:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1938:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2306:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2769:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1509:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2024:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2494:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1659:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2196:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2337:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1874:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2034:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2706:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2510:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1252:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2097:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1915:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2698:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2290:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1984:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.3070:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2049:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2308:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1761:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2160:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1955:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2270:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2570:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2049:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2139:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2327:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2182:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1961:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2404:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1974:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2114:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2746:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1639:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1376:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1987:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2826:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2038:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2153:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2189:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1991:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1973:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2251:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1449:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2234:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2121:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2454:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1916:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2076:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.3031:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1952:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2471:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2311:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2691:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2298:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2398:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2066:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2039:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2040:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2062:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1813:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.3091:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1916:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2249:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2009:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2869:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2186:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2034:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2061:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1307:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1999:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1562:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1562:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1946:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2831:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2253:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2108:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1430:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2043:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1981:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2719:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2127:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2087:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2409:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.3046:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2295:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2169:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2293:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2421:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2267:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2913:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2009:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2292:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2187:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2240:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2176:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1516:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2335:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1858:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1543:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1950:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1617:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2355:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2330:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1952:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2360:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2296:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2101:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2579:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2507:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2327:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1637:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1487:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2496:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2364:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2149:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2573:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2593:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2380:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1974:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2430:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2477:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1825:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2860:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1884:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1671:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2325:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2762:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1714:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1990:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2040:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2289:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2189:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2677:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1854:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2249:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2395:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2034:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2167:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2011:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1851:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2006:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2054:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2307:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2417:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2364:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2177:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2828:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2246:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2050:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2480:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2444:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2444:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.1824:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2326:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.1983:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2336:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.1915:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2420:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2191:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2177:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2313:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2181:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2212:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2341:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.1952:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.1895:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2026:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2265:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2299:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2981:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2080:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2513:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2065:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.1875:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2225:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2645:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2414:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2216:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2218:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2442:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2007:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2499:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1902:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2356:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1803:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2346:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1996:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2190:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1935:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1928:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2299:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2062:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2370:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2022:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1219:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2901:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2043:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2042:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1787:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2227:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2434:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1922:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2336:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2509:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1906:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2242:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2431:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1956:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1996:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2135:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1938:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2052:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1693:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2130:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2436:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2750:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1742:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2413:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2118:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2437:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1978:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2190:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2132:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2016:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1804:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2148:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1953:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2192:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2145:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1727:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2769:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2769:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2449:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1912:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1995:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2188:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2735:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2168:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2394:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2118:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2349:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1783:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2140:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2534:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2658:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.3057:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.3000:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.3063:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1620:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2200:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2140:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2069:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2526:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2929:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1789:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2454:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2319:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2720:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2130:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1412:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1876:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2140:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1669:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2207:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2229:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1834:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1705:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2197:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2412:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2251:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2186:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2451:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2385:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1755:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2481:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2113:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2293:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1645:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1732:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1539:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2223:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2288:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2061:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2019:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2055:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2922:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2653:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1942:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1806:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1747:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1797:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1818:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2095:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2475:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1626:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1553:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2113:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2147:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2166:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1689:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2015:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1881:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2360:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2442:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1859:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2256:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1681:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.3209:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1849:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2443:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2669:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2669:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1457:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1648:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1502:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1956:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2547:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2223:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1917:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2429:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1614:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2116:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1897:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1527:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1806:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1765:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2017:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2175:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2395:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2218:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2035:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2576:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2889:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2037:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1926:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2218:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2156:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1929:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2761:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1755:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2866:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2205:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2439:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2157:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1625:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2521:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2415:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2696:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2011:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2020:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2222:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1930:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2155:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2009:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1753:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2838:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2292:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2798:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2452:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2015:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2462:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1805:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2600:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2651:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1773:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2238:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2008:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1552:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2226:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2286:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1943:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2118:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2260:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2557:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2326:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1916:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2253:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2061:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1964:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2139:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2128:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2086:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1556:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1958:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1945:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2391:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2708:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1985:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1742:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2140:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.3088:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.3088:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2154:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2610:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2601:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2130:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2533:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2174:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2837:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2112:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2548:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2751:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2391:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2009:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.1760:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2200:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2506:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2607:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2359:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2385:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2241:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2372:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2453:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2172:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2627:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.1775:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2259:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2489:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.1573:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.1884:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2103:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.1859:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2187:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2046:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.1972:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.1903:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2387:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2747:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1782:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2390:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2074:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2202:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1937:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1999:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1925:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2067:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1599:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2289:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2320:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1859:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2211:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1761:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2044:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1955:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2025:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2418:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2462:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1753:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1416:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1841:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2211:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2530:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2082:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1790:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2055:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2461:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1658:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1396:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1921:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2713:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1841:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2731:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2047:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1772:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2367:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1783:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2154:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1941:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2438:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2338:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.0931:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.0931:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2248:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2110:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2359:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2148:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1656:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.3011:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2752:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2240:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2288:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1817:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2029:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2721:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2686:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1904:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2101:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1742:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1923:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2102:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2043:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2907:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2197:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2265:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1656:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1802:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2638:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2128:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2493:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2264:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1942:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2343:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2266:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1995:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2162:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1810:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2351:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2746:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2608:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2490:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2282:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.3043:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1583:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2521:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1883:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1773:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1838:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2056:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2169:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2568:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2133:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2591:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2355:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2010:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1509:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1967:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2416:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2581:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2395:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2551:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2046:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2253:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1920:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1903:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2067:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2123:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1800:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1702:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2101:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2624:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2257:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2044:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1913:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1575:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2529:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1569:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1905:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1755:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1874:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2584:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2839:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2839:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1237:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1871:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1921:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2134:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2227:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2268:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2259:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2788:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2581:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2386:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2174:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2222:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2272:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1974:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2507:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2169:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2110:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.3094:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2118:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1864:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2176:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1469:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2200:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1889:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2031:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1581:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2706:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2658:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2102:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2059:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1617:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2154:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.3170:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1905:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1460:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2249:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2484:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2638:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2397:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2181:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1729:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2558:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2025:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1904:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1912:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2117:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2629:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1970:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2946:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1443:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2453:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2833:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1593:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1933:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2672:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2487:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2826:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2357:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2004:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1897:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2300:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2003:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1949:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2052:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1663:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2470:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2639:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2078:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2250:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1925:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1214:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2086:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2461:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2210:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2597:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1761:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1745:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2119:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.0957:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.0957:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1738:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2100:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2340:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2538:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1947:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2387:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2406:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2684:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1958:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1638:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2091:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1656:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2122:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2006:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1912:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2673:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2317:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2651:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2006:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2162:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1779:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2331:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2398:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2083:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.3254:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2457:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2978:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2127:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2236:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2080:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2516:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1985:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1730:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1923:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2353:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1937:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1662:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2153:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2025:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1665:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1790:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2194:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2821:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2340:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2365:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2227:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2398:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2071:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2397:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2354:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2219:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1892:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2272:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2324:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2666:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2014:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2044:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2546:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1906:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1531:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1907:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1940:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2461:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1993:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2636:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2318:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2220:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1953:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2229:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2334:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2221:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1753:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1547:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2107:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1993:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1819:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1632:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2285:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2756:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2756:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2196:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1905:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2400:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2051:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2712:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2290:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2026:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.3255:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1678:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2290:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1507:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2306:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2023:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2034:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1499:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2118:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2309:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2093:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1883:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2730:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2609:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2065:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2268:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1581:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1862:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1605:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2582:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2238:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2470:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1907:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2465:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2462:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1849:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2491:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2188:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1523:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2381:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1951:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2721:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2143:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1905:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2559:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2513:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2045:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1752:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2024:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2064:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2019:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1307:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2174:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2347:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1556:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2185:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1925:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2406:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2106:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2669:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2076:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1977:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2089:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2738:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2201:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1813:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2171:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1673:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2259:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2480:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2123:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1993:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2149:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2228:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2548:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2122:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2157:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2259:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2578:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2985:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1837:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2176:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2176:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2387:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2119:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2450:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2210:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2140:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2432:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1985:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1800:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1902:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1561:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2042:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2323:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2554:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1938:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2650:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2906:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2022:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1953:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2630:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2152:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1909:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2373:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1899:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2308:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2500:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1807:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1757:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1991:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1730:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2404:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2517:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2132:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2585:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2520:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2063:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1937:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.3000:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2652:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2105:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2247:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2149:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2029:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1844:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2235:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2212:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2229:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2153:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1957:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1804:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1680:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2161:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2509:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2238:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2904:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2928:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2379:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2210:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2886:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2382:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1804:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1922:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2017:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2408:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2521:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1982:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1843:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2229:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2149:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1788:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2237:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2124:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2387:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1697:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2387:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2117:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2442:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2415:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2091:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.0938:  68%|██████▊   | 273/401 [02:41<01:24,  1.52it/s]training loss: 0.0938:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2287:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2438:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1790:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1865:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2739:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1487:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1968:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2243:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2490:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2154:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2521:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2131:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2370:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2274:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2158:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1596:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2021:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2357:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1979:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1918:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2082:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2197:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2589:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1911:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1990:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2117:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2528:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1567:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2522:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2334:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1952:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2386:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1314:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2540:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1783:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1711:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2557:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2051:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1732:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1944:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2366:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1947:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.3523:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1341:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1934:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2067:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2016:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2124:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2270:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.3097:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1979:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2433:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1493:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2512:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2560:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2587:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2047:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1858:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1540:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1996:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1829:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2274:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2314:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1977:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2207:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2077:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2279:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2212:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1558:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2197:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1761:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2459:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2394:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2374:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2355:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2323:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1874:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2574:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1937:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1937:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1792:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2371:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1876:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2138:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2167:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2194:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2713:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2460:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2628:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2792:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2131:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2153:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2689:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2039:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1872:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2357:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2234:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2064:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2058:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1776:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2035:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1666:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2439:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2035:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2103:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1954:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1920:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1806:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2064:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1830:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2318:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1855:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1894:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2173:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1938:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2142:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2207:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1677:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1857:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2639:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1462:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2560:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2127:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2116:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1712:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2578:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1753:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2128:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2506:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2258:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2295:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2367:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2571:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1821:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1750:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1665:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2304:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2089:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2755:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2783:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2612:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1866:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2306:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2526:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2507:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2269:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2026:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2383:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2431:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1933:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1719:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1786:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1896:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2014:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1665:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1682:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2058:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2236:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1176:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1176:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2358:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2375:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2102:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2019:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2187:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2380:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.3055:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1975:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1927:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2132:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1967:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1631:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2148:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1954:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1838:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2138:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2101:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1613:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2578:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2460:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2237:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1861:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2425:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1892:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2191:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1765:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2190:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2323:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2188:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1604:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2490:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2186:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1836:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1987:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1818:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2036:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2227:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1963:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2000:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2025:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1604:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1854:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2312:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2015:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2011:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1816:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2308:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2025:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2234:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2245:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2421:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1824:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2451:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2937:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2143:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2069:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1544:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2112:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2567:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.3011:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1796:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2083:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1771:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2696:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1998:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2792:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1803:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2568:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1699:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2091:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2163:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2197:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1798:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1740:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2217:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1873:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1770:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2028:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2387:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2387:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2672:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2862:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2459:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2221:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2349:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2068:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2077:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.1752:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2185:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2422:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.1804:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2055:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2375:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2282:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.1487:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.1626:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.1563:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2004:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2287:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2093:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2530:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2511:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1794:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2311:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2191:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2376:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2270:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2090:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2428:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.3009:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2375:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1959:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.3072:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2283:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2060:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2202:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2042:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2817:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2310:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1895:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2523:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2575:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2727:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1792:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2168:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2133:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1908:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1928:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2006:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2283:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2683:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2131:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2003:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2018:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2391:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1851:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1518:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2769:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1935:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2122:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2062:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2072:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2079:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2444:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1909:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2033:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1904:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2160:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1453:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2049:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2215:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2116:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2806:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1835:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2067:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2434:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1595:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1478:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2339:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2339:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2080:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2094:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2243:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1733:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1964:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2132:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2085:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2587:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1638:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2595:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2419:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1365:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1528:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1917:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2131:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2581:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2215:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2107:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2557:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2285:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1848:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2029:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1843:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2925:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2418:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1858:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1478:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1766:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2630:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2096:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2164:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2369:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2933:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1832:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1807:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2323:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2157:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1902:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2453:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2369:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2337:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1877:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1954:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2524:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2507:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2306:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2392:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2726:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2748:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1991:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2042:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2162:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2158:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2786:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1789:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2222:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1868:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1910:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2025:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2229:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1691:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1752:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2596:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2694:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2679:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2300:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1853:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2299:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2352:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2481:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1558:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2739:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1809:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1919:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1986:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1703:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1920:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2095:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.3105:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.3105:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1566:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1904:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2272:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2858:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2172:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2225:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2378:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2865:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2156:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1773:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2588:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1999:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1625:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2685:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1419:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2556:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1752:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1945:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2714:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2543:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2993:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2416:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2477:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2315:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2234:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1656:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2521:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1476:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2782:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2571:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2343:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1924:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1867:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1996:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2252:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2166:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2239:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2113:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2175:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2139:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2323:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2281:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2215:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2049:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2378:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2325:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1643:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2067:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2022:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1779:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2138:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2272:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2220:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2050:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2482:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1794:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1912:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1788:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2237:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1920:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2384:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2379:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2384:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2077:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2123:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2225:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2136:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2073:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2239:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1944:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1710:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1885:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2076:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2246:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1853:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1960:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2214:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2057:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1891:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1891:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1725:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1980:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2343:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1613:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1655:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1722:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1669:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1642:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2701:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2434:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2700:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2682:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1950:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2380:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2034:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2585:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2074:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2398:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1804:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2421:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1785:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1660:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1905:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2736:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2027:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1909:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2125:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2200:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2283:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.3155:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1818:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2086:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1801:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1911:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2280:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2194:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2565:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1595:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1918:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1973:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2546:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2386:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2265:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2000:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2261:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2631:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2858:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2490:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2573:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2863:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2165:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2752:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1360:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2551:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1843:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2046:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2547:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2673:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1927:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1652:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2352:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2225:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1935:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1835:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2363:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2264:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2555:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1915:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2367:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2177:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1882:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2408:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2956:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2426:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2334:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1812:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1666:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2577:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1790:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1790:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1842:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2045:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2527:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2396:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2053:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1870:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1842:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2292:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1986:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2290:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2479:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2477:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1774:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2094:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1989:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1826:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1984:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2558:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1680:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2315:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2039:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2431:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2740:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2422:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2544:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1668:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1860:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1968:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2058:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1692:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1866:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2386:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1860:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2739:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2410:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2233:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2600:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2068:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2263:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2014:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2602:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1948:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2267:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2063:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1597:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2207:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1884:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1969:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1727:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2053:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1740:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1848:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2054:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2396:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1837:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2407:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2297:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2162:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1833:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2346:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2258:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1704:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1728:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1904:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2190:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2018:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1879:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1983:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2107:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2309:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1732:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2410:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1828:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1875:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.3345:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2453:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1971:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2568:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.4491:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.4491:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1914:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2069:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1526:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2669:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1690:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2830:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2583:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2336:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2345:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1559:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1934:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1809:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2112:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2532:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1833:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1938:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2332:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2095:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2135:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2194:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1664:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1735:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2337:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2792:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2221:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2525:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1674:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1828:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2583:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1223:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1713:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2066:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1678:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2648:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2168:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1683:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2518:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2436:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2003:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2446:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1334:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2166:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2136:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1642:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2560:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2097:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2201:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2529:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1714:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2255:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2573:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.3006:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1995:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1950:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2356:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2416:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2082:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1956:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2449:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1703:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1900:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2021:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1959:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1704:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1572:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1621:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2165:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2154:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1369:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1959:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2512:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2363:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2005:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1644:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2447:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2710:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2880:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1897:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2598:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2598:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2721:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2052:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1977:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2399:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1643:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.3267:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2211:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2573:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2425:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1919:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2083:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1604:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1676:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1912:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1981:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2106:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2611:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2380:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1954:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2091:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2599:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2091:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2112:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2135:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2190:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2052:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2477:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1990:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1847:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2747:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2363:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2098:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1544:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2195:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2040:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2107:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1935:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2715:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2107:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2007:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1968:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2143:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2163:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1754:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2282:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2805:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2157:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.3100:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2199:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2439:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2026:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2051:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2433:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2621:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1642:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2348:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2801:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1982:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1940:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2263:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2272:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1682:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2252:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1966:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2500:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1727:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2300:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2051:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2683:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1846:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2358:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2108:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2090:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1877:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2527:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1855:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2541:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1598:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2045:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2045:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.1978:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.1909:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.2007:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.2022:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.1551:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.2261:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.2063:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.3094:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.2211:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.2447:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.1463:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.2030:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2022:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1728:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2880:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2471:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2147:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1795:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2246:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2170:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2356:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1390:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2067:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2818:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1798:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2374:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2168:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2063:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2273:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2569:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2012:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1773:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2385:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2011:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1877:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1775:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2237:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2133:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2015:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1874:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2346:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1535:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2105:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1932:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2352:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2426:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2476:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1931:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1710:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1741:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1996:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2139:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2339:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1897:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1578:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1778:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1612:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2119:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2835:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2196:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2422:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2216:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1684:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2367:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.3366:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2354:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2487:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1781:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2361:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2907:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2517:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2461:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1747:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1953:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1905:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1870:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2090:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1898:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2940:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2940:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2240:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2262:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2569:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2116:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2452:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2135:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2759:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2534:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2821:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1719:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2641:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2172:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1756:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1813:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2244:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1557:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1935:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1732:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1929:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1549:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1976:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1881:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1870:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1725:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2291:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1747:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1885:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1804:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1577:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1937:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1853:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1453:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2588:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2330:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2070:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1982:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.3069:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2294:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2198:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1675:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2449:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2334:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2446:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1753:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1813:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2655:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1883:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2465:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2210:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2299:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2539:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1917:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2034:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2522:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1504:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2190:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1557:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2181:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1857:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2351:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2009:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1591:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2579:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2023:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2302:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1556:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2624:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1772:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1768:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2149:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2458:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2755:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1681:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2192:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2048:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2214:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1683:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1830:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.3037:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.3037:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1642:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1605:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1819:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2533:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2492:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1808:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2032:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2238:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2143:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1628:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2234:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1571:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2629:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1769:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1901:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1968:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2001:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2189:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1860:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2034:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1961:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2141:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1993:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1801:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2526:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2528:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1921:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2624:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2234:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1813:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2267:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1779:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2162:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2305:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1850:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1750:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1689:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.3059:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2274:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2291:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2251:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2045:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2012:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2072:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1981:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2295:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1821:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2061:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1455:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2359:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1802:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2406:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2046:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1823:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1923:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1930:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2355:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2616:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1563:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2470:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1875:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1800:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1802:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1718:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2082:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2549:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2362:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2580:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2079:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1985:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1515:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2620:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2149:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2555:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1952:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2040:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1492:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1929:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1888:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1888:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2459:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1917:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1820:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1906:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2647:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2467:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1903:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2497:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1574:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2450:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2822:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1794:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2538:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2621:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2303:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2703:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1998:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2492:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1862:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1882:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2124:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2637:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2109:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1847:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1877:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1849:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2054:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2947:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2185:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1940:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1994:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2523:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2539:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1910:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1849:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1470:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2140:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2060:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2131:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2195:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2085:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2004:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2214:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1438:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1606:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2219:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1668:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2095:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2193:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.3686:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2543:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2202:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2262:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2020:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2607:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1739:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2035:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2520:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2251:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1543:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2219:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2580:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1833:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1602:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2165:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2026:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1709:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2227:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2118:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2555:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1705:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1939:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2553:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2001:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2563:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2060:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2123:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1550:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2010:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2010:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1560:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1892:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2060:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2213:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1734:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1668:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1750:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2083:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1856:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1839:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1910:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1902:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1876:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2444:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2047:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2252:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2174:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1934:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2086:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2347:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2022:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2840:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2282:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2300:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1814:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1881:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2539:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2531:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2171:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1617:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2391:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2706:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2531:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1576:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1641:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2017:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2870:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2250:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2147:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2556:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1951:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2258:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1771:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2276:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2255:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1818:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1865:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1777:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1709:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2059:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2205:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1789:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2531:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2127:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2130:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1620:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2208:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2443:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1776:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1938:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1702:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2475:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2522:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1989:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2595:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2118:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2223:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2496:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2229:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2100:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1671:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2143:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2534:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2177:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1944:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2924:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.3011:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2080:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2854:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2854:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2704:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2315:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.3003:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1348:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2353:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2503:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1891:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2106:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2473:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2442:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1973:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1902:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1818:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2092:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2601:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2266:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2583:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2521:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2649:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2251:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2345:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2163:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1687:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2351:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2164:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1962:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1630:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2562:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2394:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2401:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1531:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2605:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2996:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2216:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2352:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2397:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2121:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1743:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2190:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1972:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1761:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2408:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1705:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1673:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1662:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2402:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2770:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2543:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2060:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2166:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1897:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2109:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2256:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1810:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2537:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1746:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1742:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2304:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2612:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2329:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2019:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2201:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2141:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2172:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1362:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2263:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2193:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1719:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1910:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1757:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1811:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1919:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1868:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2341:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1928:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2646:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1594:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2129:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2572:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2572:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2371:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1565:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2164:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1964:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2164:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2276:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2514:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2449:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2353:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1947:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2388:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1668:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2046:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2343:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2439:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2188:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2069:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1965:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2288:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2010:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1419:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1664:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2389:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1796:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2155:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2074:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2196:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2572:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1983:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2278:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2351:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1919:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2041:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1912:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1904:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2438:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2029:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2841:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2084:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1704:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1961:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2222:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2802:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2188:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2758:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1879:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2942:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2221:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2329:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2123:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1997:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1967:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2277:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2079:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1736:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2191:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2957:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1793:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2588:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2246:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1922:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1819:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2006:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1939:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2141:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1880:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2292:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1483:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2537:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2608:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2647:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1964:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1783:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1987:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1646:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1773:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2254:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2192:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2154:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2154:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1618:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2552:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1757:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1948:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2314:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2357:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2153:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1706:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1873:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2452:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2103:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1562:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2090:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2401:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2252:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2232:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2487:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1742:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2356:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2778:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2749:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2353:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2573:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1495:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2325:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2838:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2218:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2145:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2968:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2250:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2691:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1835:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2214:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1847:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2213:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2242:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2096:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2105:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1903:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1866:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2122:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1738:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2609:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2116:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2038:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2049:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1601:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2014:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2108:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2126:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2270:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2357:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2478:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1949:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1792:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2080:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2664:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1816:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2418:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1984:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1947:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2629:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1866:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1955:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2091:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2354:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2208:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2159:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2653:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2585:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1932:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1931:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1893:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2498:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2602:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2418:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1891:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2065:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2295:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2295:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1877:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2136:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1811:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1973:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1942:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1622:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1829:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2626:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2248:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2048:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1766:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1786:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2372:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2553:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2258:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1992:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2139:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2425:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2856:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2648:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2445:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2113:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2298:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2518:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2264:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1852:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2068:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2209:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2119:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1731:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1993:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1655:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2535:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1630:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2271:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2062:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1498:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2728:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1898:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2037:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1862:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2025:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2706:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2152:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2243:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2592:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2310:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2380:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1507:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1795:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1645:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2576:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1784:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1541:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1711:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2062:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2302:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1544:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2009:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2266:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2462:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2028:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2135:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2273:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2850:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1792:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2523:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2105:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2842:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1998:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1756:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2193:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2313:  73%|███████▎  | 292/401 [02:52<01:27,  1.25it/s]training loss: 0.2531:  73%|███████▎  | 292/401 [02:52<01:27,  1.25it/s]training loss: 0.2140:  73%|███████▎  | 292/401 [02:52<01:27,  1.25it/s]training loss: 0.2165:  73%|███████▎  | 292/401 [02:52<01:27,  1.25it/s]training loss: 0.2434:  73%|███████▎  | 292/401 [02:52<01:27,  1.25it/s]training loss: 0.1790:  73%|███████▎  | 292/401 [02:52<01:27,  1.25it/s]training loss: 0.1740:  73%|███████▎  | 292/401 [02:52<01:27,  1.25it/s]training loss: 0.1740:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2199:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2032:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1826:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2031:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1898:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1916:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1450:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2065:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1647:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1936:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2048:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1919:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2469:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2165:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2222:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1819:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2309:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2294:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2151:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1755:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2245:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1979:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2562:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2095:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1968:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2134:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2084:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2013:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1848:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1825:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2042:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2300:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1602:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2126:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2546:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2260:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1764:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2670:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2920:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2289:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1539:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2080:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2282:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2300:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2230:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1696:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1997:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1854:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2295:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2093:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1882:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1621:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2540:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1930:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2146:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2491:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1977:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1915:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2580:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2170:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1810:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2515:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2041:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2235:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.3073:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1824:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2428:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1659:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1816:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2044:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1855:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1682:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1715:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2587:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2693:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1431:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2027:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2349:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2812:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2812:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1563:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2561:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2362:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2130:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1981:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2223:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1890:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2250:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2004:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2254:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2332:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.3054:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2667:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2416:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1760:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2409:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2358:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1920:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1889:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2393:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2156:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2807:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1489:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2108:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2535:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2885:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2125:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1781:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1797:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1717:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2347:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1934:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1824:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2152:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1773:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1756:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2661:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2918:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2225:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2406:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2271:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2071:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2018:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2030:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2082:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2180:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2552:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1504:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1808:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2166:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2639:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.3531:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2126:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2031:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1797:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2305:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2471:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2100:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1965:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2234:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2518:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2147:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1930:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2728:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2224:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2323:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2512:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2008:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2630:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1722:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2204:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1941:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1939:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2130:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1885:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1899:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2524:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1646:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1972:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1972:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2511:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.1669:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.1749:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2473:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2132:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2133:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.1894:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2463:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2114:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2129:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2433:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.1919:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.1746:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2222:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2539:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.1865:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.1508:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2249:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2527:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2134:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1971:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2553:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2281:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2213:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2072:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1327:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1607:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2003:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2346:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2308:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2405:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2397:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2258:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1903:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2112:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1762:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2470:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1595:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1971:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2087:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2953:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2060:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1791:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2036:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2075:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1739:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1903:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2233:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.3005:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2149:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1994:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1921:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2024:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2550:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1859:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2526:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2519:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2635:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1823:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2221:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2107:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1976:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1992:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2337:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2210:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2356:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1910:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1999:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2202:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1887:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2199:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2329:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2180:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1817:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2125:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2213:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2257:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2932:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2145:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2145:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1854:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1981:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2013:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1938:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2466:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1970:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1719:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2136:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1846:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2701:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2381:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2276:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1831:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2221:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2168:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1952:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1931:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2327:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2438:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2263:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2028:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2001:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2075:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1709:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1472:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2372:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2606:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2628:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2038:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2142:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2320:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2516:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2212:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2030:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2029:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2035:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2836:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2008:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2285:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2624:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1712:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2222:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2159:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2547:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2226:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2216:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2184:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2061:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1526:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1819:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1902:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2873:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1813:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2039:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1679:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1638:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2491:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2401:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1948:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2303:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2040:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2383:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2279:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1903:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1903:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2566:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1936:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2330:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1925:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1842:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2172:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2069:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2239:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1972:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2193:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2576:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2226:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1739:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.0614:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.0614:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2062:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2413:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2095:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1762:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1962:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2634:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2126:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1853:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2575:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2555:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1829:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1740:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2007:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1695:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2248:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2153:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1546:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2252:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2667:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2402:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2372:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2163:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1796:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1926:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2247:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1653:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2264:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2373:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1926:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2514:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2136:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2423:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1986:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2343:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2389:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2643:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2312:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1841:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1607:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1992:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1772:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1850:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2472:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2567:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2500:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1983:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2069:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2688:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2260:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2048:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1932:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2341:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2195:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1558:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.3024:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2182:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2478:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2273:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1993:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2387:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2271:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2580:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2198:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2672:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2268:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1648:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2172:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2228:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2153:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1923:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2718:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2283:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1534:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1786:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1589:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1663:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1821:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2010:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2725:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2725:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2304:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2559:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1607:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2132:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1781:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2414:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1738:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1810:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1958:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2358:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2126:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2199:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2723:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1833:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1803:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2853:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2443:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2123:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2514:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1918:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2163:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2055:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2199:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2721:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2088:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2150:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2096:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1848:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2055:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1584:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1805:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2227:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2666:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1847:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2006:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2466:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1964:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1989:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1970:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2417:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2295:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2778:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2316:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.1878:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2797:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2162:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2369:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2005:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2487:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2722:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.1530:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2179:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2042:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.1795:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2491:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2645:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2551:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2446:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.1917:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.1640:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2380:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2388:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2312:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2155:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2508:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2092:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.1923:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2201:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.1718:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2201:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2471:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2372:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2167:  74%|███████▍  | 298/401 [02:55<00:41,  2.46it/s]training loss: 0.2666:  74%|███████▍  | 298/401 [02:55<00:41,  2.46it/s]training loss: 0.1519:  74%|███████▍  | 298/401 [02:55<00:41,  2.46it/s]training loss: 0.2423:  74%|███████▍  | 298/401 [02:55<00:41,  2.46it/s]training loss: 0.1876:  74%|███████▍  | 298/401 [02:55<00:41,  2.46it/s]training loss: 0.2802:  74%|███████▍  | 298/401 [02:55<00:41,  2.46it/s]training loss: 0.5455:  74%|███████▍  | 298/401 [02:55<00:41,  2.46it/s]training loss: 0.5455:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2155:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1977:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1980:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1644:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2958:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1985:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1623:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2096:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1949:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2027:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2378:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2509:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1987:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2137:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2277:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2125:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2162:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1928:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2171:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2146:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1703:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2015:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2110:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2013:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2022:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2589:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2532:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2108:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2536:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2564:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2038:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1781:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2290:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1796:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2643:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2191:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2414:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1975:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2759:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2179:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2053:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2648:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1711:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2110:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2622:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1798:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1752:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2458:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1925:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.3079:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1463:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2538:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2825:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2282:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2138:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1781:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2578:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2079:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2616:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2602:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2072:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2427:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1832:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2058:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1979:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2274:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1398:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1364:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2100:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1583:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2082:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1610:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1753:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1714:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.3084:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1986:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2141:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2051:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2069:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2069:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2270:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1957:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2040:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1752:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1766:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2017:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2517:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1694:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2257:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2669:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2515:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2364:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2256:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1739:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1593:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1964:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1912:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2755:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2788:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2444:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1851:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2107:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2267:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2349:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2912:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2051:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1966:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1804:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2095:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2313:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2673:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2212:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1770:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2127:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2103:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2960:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1833:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2087:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2011:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2093:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2222:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2506:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2302:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1861:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1862:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1883:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2207:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2523:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2302:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2837:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2026:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2195:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2613:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2679:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2797:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1767:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2220:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2242:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2153:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2151:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2756:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2674:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2514:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2399:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1893:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2270:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1952:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1816:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2245:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2205:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2051:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1870:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1753:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1929:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2427:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2254:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2790:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2584:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1292:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1292:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1848:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2030:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1679:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1729:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1998:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2111:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1902:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2254:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1841:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1827:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2078:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2581:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2121:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1817:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2123:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1420:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2764:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2279:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1942:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1873:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1864:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.3165:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1832:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2141:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1859:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2267:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2020:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2551:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1842:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1878:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2101:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2153:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1791:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2477:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2545:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2261:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2038:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1932:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2143:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2050:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2057:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1916:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2134:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2521:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2375:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2558:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2183:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2633:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1628:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2672:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1974:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2016:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1863:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2274:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2040:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2141:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2571:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2554:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.3039:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2748:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2409:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2880:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1682:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2451:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2505:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2702:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2253:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2314:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1471:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2290:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1934:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2126:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2602:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2518:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2137:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2068:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2177:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1668:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1054:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1054:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1819:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1869:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1917:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2911:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2396:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1559:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2007:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1876:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2144:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1746:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1973:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1985:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2168:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1975:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2295:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1919:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2045:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1872:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2844:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2430:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2242:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2169:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2202:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1898:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2623:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1441:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1939:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1967:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2279:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1942:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2346:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1782:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2931:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1649:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2197:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2713:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1851:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2216:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1935:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2078:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2491:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2126:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2637:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1993:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2375:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1720:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2080:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2241:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2363:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2026:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1575:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2416:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2607:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2248:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.3023:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1992:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1981:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1990:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2302:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2473:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2502:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2374:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2350:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1841:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2154:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1799:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2265:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1778:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1935:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2088:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2574:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2560:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2551:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1849:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1763:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1843:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2423:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1891:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1595:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1595:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2177:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2398:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2851:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2439:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2614:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2038:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2431:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2043:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2052:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2459:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2169:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2327:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1781:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2292:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2502:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2664:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2202:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2594:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1771:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1523:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1639:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2250:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1971:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2060:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2136:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1818:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1844:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1705:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1842:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2188:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2612:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2226:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1940:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2302:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1992:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2250:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1756:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1924:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2607:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1938:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2029:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1843:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1774:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2088:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1945:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2431:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1984:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1765:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2548:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2104:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2262:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1886:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2313:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1806:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2187:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1752:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2438:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2253:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1394:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2020:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1933:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2397:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1773:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1973:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2467:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1662:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1997:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1945:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1758:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2316:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2684:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2159:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2436:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2359:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2143:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1834:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1750:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1997:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2894:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2894:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1791:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2543:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2283:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1964:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1590:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1765:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2254:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2560:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2965:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1929:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2121:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1941:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2445:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1858:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.3208:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2277:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1975:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1743:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2540:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1947:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2349:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2193:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1955:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1949:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.3141:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2003:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2108:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1601:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2367:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2606:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2573:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1816:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2057:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2041:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1639:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2065:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2153:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1716:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2182:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2361:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1823:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1927:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2246:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2099:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1818:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2069:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1819:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1857:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2156:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1906:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2209:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1517:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2985:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2118:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2136:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2122:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2320:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2202:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1764:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2018:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2391:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2871:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1938:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2125:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2820:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1760:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2059:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1570:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1754:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2728:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2040:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2076:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2038:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2133:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1894:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2380:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2382:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1929:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1063:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1063:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2347:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1388:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1832:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2281:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2371:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2049:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2367:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2469:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1826:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2649:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1767:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1866:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2052:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2599:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1605:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1538:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1819:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2026:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2205:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2142:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1734:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1990:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2300:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1762:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1870:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1685:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2917:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2179:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1912:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2300:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2212:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1847:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2345:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2279:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2052:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2049:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1522:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2511:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2015:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2203:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2256:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2396:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2035:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2929:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2292:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2221:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2341:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2116:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2072:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1827:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2273:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1916:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2115:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2076:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2158:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2135:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2499:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2766:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1605:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2728:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1812:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1824:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2373:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2845:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2183:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2286:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2484:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1967:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1881:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1931:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2151:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2183:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1916:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2600:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2505:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2075:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1819:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1995:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1233:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1233:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1881:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2081:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2264:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2382:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2115:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1767:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2183:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2168:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2331:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2344:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1640:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2180:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2181:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2199:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2323:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2021:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2697:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2136:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2384:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2714:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1861:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2470:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2025:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1683:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2570:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1570:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2178:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2157:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2010:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2544:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2181:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1961:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2420:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1738:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2511:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2228:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2416:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1769:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2386:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2387:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2153:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2109:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2201:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1808:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1801:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2516:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2397:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1548:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2012:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2124:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2116:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1899:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2103:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2434:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2225:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1837:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2281:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2761:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2180:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1980:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2341:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2649:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2797:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1932:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2026:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1925:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1780:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1572:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1819:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1800:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2151:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2137:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2244:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2573:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1962:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1944:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2226:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1949:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.3116:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.3116:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1411:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.3213:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2158:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2146:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2379:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2199:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1941:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2834:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1929:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1543:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2289:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1618:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1481:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1594:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2545:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2225:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1997:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2062:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1845:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2329:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2138:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1570:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1813:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1921:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1814:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2292:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2876:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2347:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2527:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2409:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1784:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2085:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2044:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2039:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2421:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2304:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2012:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2175:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2022:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2081:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2081:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2573:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2537:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2550:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1902:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1800:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2045:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1811:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2901:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1708:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2381:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1763:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2051:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2248:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1908:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1776:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1866:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2838:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2235:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1424:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2112:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1895:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2493:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2462:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1769:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1945:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2399:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2130:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1818:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2369:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1705:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2007:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2109:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2224:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1995:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2231:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1818:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1801:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.4836:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.4836:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2422:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2119:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2234:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2271:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2155:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2566:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1702:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2137:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1879:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2260:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1639:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2361:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1701:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2270:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2065:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2329:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2098:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2489:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2506:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2297:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1903:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2199:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1867:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2267:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2389:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2269:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2978:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2057:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2179:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2014:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1994:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2316:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2771:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2043:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1847:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.3306:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2718:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2129:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2240:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1856:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2261:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2767:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2370:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1851:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1786:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1943:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2373:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2063:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1588:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2590:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2611:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2444:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2019:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1865:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2228:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2721:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1924:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1765:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2595:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1997:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1825:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2210:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2098:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2105:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2407:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2119:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1932:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1705:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1967:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2685:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1824:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1949:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2101:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1466:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1584:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1961:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2213:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2119:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1825:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1825:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1905:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2680:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2228:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2169:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2683:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2041:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1803:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1931:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2486:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2539:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1923:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2326:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2322:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2487:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2042:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2261:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2128:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1682:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2142:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1833:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2221:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1641:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2536:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2584:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1572:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2673:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1867:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1758:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2156:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.3310:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2605:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1959:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1990:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1835:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2225:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2262:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2369:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2090:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2191:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1863:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2841:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2945:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1963:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2502:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2122:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2029:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2062:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.3022:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2017:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2408:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2448:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2250:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2164:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2915:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1814:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1841:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2563:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2268:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1978:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1954:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2526:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2151:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1900:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2508:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1974:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1737:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1524:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2147:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1665:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1951:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2305:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2077:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2155:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2464:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2954:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2005:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2241:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2164:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1536:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1536:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2372:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1999:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1636:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2269:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1927:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2359:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1504:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2077:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1866:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2213:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1934:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1988:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2280:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1863:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1790:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2650:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1898:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2181:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1811:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2180:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1911:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2170:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1947:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1961:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2153:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1676:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2114:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2885:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2142:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2937:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2065:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2095:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1671:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2257:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2577:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2070:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2689:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2223:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1850:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1694:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2163:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1738:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2360:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1791:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2612:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1528:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1812:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1345:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2295:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2092:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2496:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1704:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2090:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1964:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1984:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2541:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2177:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1886:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2137:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2105:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1578:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1957:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1531:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1718:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1992:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2042:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1934:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2236:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.3310:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2189:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2484:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1921:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2070:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.3090:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2235:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2170:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1829:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2095:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.3592:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.3592:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1596:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2202:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1920:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2113:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1704:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2190:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2094:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2105:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2999:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1541:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2061:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2153:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2536:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2087:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1908:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2465:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2383:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2674:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2442:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2687:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2180:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2211:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1962:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2020:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1773:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2092:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2174:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2064:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2351:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2006:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2176:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2336:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1877:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1740:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2114:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2138:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1541:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2445:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2249:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1702:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2581:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2316:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1682:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2152:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1523:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1882:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2023:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2173:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2814:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2378:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2141:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2400:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2051:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2058:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.1783:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2068:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2634:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.1902:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2235:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2072:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2249:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.1918:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2481:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2124:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2356:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.1858:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2212:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.1922:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2766:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2400:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2094:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2045:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2542:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2220:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.1997:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2016:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2382:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2469:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.1003:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.1003:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1867:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1889:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1494:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2644:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1552:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2546:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2722:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2225:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1788:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1757:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1814:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1935:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2503:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1967:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1967:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1966:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2212:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2462:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1868:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1944:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1668:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2616:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2246:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2207:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2419:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2272:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1828:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1696:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2182:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2275:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1970:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2169:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2196:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.3066:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1823:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2670:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1785:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2064:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2483:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2102:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2425:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2147:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2767:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1911:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1767:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2299:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2348:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1841:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2484:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2356:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2812:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1830:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2051:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2061:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2051:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1674:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2238:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2316:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1858:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1766:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2212:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2106:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2114:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2171:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2520:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2218:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2121:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2240:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2406:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2248:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1973:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1947:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1492:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1724:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2985:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2066:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2039:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2003:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1662:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1662:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2399:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2154:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1723:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1715:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1644:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1738:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1959:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2244:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2893:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2183:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2020:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1652:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1702:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1958:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2026:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2113:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1825:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2998:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1666:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2186:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1865:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2233:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2269:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2261:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2133:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2567:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1978:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1836:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1664:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2370:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1555:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1593:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1986:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2513:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2224:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2448:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2345:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2214:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.3762:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1784:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2549:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1963:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2364:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1753:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1979:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1564:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2186:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2532:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2716:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2173:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2105:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2144:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1620:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2360:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2135:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2251:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2218:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2263:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2244:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2273:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2065:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2389:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2333:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2612:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1949:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2264:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2209:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1999:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2956:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.1952:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.2251:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.1869:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.2632:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.1959:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.1697:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.2845:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.2263:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.1812:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.1725:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.1725:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2379:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2620:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2390:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2011:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1508:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2091:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2229:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2434:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2506:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1868:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2341:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2113:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2464:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2349:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2607:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.3565:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2329:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1951:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1880:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1823:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1665:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2775:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2341:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2540:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2138:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2741:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2138:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2196:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1949:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2189:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2434:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2310:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2502:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2371:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1864:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2119:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2257:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2727:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2760:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2244:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2608:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1808:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2083:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2034:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2108:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2250:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2741:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1734:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2650:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1798:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2333:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2336:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2085:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1121:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2207:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1631:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2227:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2518:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2772:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2230:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2447:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2084:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2623:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1964:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1917:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1749:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1937:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1751:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2260:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1848:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2259:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2179:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2432:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2687:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2240:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1957:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2817:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2735:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1604:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1604:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2086:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2160:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2228:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2616:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2234:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2879:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1842:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2704:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1585:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1887:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1895:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1622:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1850:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2361:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2363:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2287:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2251:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2096:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2264:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2654:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2463:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2026:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2189:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2149:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2091:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1857:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.3239:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2085:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1671:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2277:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2316:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1735:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2548:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2694:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1697:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1773:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1878:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2016:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1884:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1919:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1608:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2456:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2063:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2099:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2389:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1877:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2244:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1332:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2506:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2211:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1861:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2137:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1948:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2341:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1635:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2540:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1534:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2310:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2257:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1814:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1624:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2307:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2350:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2095:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1716:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2710:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2999:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2119:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.3616:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1904:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1608:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1676:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2194:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2114:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2199:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2044:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2306:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2766:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2239:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2239:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2198:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.3015:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2436:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1981:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2284:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2192:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1867:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2009:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2087:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2654:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1782:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1697:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1939:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2166:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.3113:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2231:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1678:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2835:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1948:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2684:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1949:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2376:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2482:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2298:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1764:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1959:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2422:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1804:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1694:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2275:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2100:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1876:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2122:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2301:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2062:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2646:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2004:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1628:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2491:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1766:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2097:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2060:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2413:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1739:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2552:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2146:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1662:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2019:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1807:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2056:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1708:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1936:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2560:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2137:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2606:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1710:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2726:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1887:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2040:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2521:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1940:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1858:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2408:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2066:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1715:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2128:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2294:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2248:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2042:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1827:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2125:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1868:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2215:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2828:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2320:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1966:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2248:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2432:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.3098:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.3098:  79%|███████▉  | 317/401 [03:05<00:35,  2.36it/s]training loss: 0.2094:  79%|███████▉  | 317/401 [03:05<00:35,  2.36it/s]training loss: 0.2918:  79%|███████▉  | 317/401 [03:05<00:35,  2.36it/s]training loss: 0.1703:  79%|███████▉  | 317/401 [03:05<00:35,  2.36it/s]training loss: 0.1892:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2172:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2352:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2257:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2380:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1860:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.3023:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2156:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1800:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2015:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2002:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2173:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2024:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1698:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2126:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1549:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2146:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1861:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1783:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2718:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2602:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2565:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2278:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2064:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2322:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1846:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1450:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2875:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1812:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2169:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1941:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2970:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1763:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1560:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2191:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2143:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2415:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2358:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1820:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1884:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2150:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2403:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2248:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1612:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1446:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2036:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1716:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2665:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1713:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2469:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2381:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1974:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2073:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2096:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2195:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2395:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2715:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2871:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2267:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2798:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2593:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1835:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2454:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2038:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1680:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1883:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2052:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2675:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2039:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2604:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2072:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2207:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2447:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2404:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2159:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1970:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1970:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2074:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2164:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2400:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1554:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1967:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2421:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1826:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2064:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2176:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1936:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1743:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2007:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2277:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1676:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1787:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2101:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2344:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1786:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2403:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1571:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2512:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2362:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2921:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2616:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2056:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2190:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2874:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2619:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2136:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1750:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2516:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2180:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1793:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2098:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2037:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2018:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2189:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1808:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2232:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2387:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1553:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2595:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1828:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2003:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2414:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2286:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2395:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2172:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2088:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1925:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2127:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2267:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2118:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2209:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1482:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2472:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2034:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2500:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1996:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1926:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1732:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1705:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1815:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1928:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2011:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2213:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1858:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1660:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2322:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2325:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1975:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2898:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2505:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1544:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2196:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2147:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2851:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2288:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2323:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2323:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2254:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1872:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2212:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1768:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2367:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2078:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2137:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2350:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2386:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1628:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1895:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2444:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2126:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2416:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2339:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2026:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2829:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1730:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2192:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1829:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1658:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2082:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2182:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2085:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1914:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2107:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2662:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2066:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2075:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2721:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2739:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2731:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2097:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1472:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2038:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2589:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2314:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2480:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1775:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1944:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2448:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2472:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1512:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2296:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2075:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1679:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2141:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2227:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2363:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2707:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2447:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1918:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2345:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1731:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1971:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2857:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2322:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1784:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2148:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2278:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2178:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1848:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2010:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2011:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2242:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2331:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2395:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.1752:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.1753:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.1588:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.1841:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2307:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2111:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2343:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2199:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2230:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2139:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.1583:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2079:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2079:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2159:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1963:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1887:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2100:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2434:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1874:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1774:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1835:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2646:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2572:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2226:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2552:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1774:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2511:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1844:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1972:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2216:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1755:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1364:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1936:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2251:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2139:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2368:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2347:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2013:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1730:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1903:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1903:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1831:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1926:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2467:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1816:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2304:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2176:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2226:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2101:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2370:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1951:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2496:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1826:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2066:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2104:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2046:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2427:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2834:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2750:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1578:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2115:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1917:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2440:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2175:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2375:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1979:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2594:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2571:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1709:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2145:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2048:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2244:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2667:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2315:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1910:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1697:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1968:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1963:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2278:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2129:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2189:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2414:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2119:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2360:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1909:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2184:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2429:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2367:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2816:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2686:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2210:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.3037:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.3037:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1977:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2290:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1928:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2640:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2174:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2543:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2240:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2538:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2137:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2092:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2701:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2146:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2146:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1979:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2197:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2061:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2098:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1991:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2054:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2118:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1538:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2995:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2192:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2056:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1854:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1923:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2438:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2069:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2006:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2738:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2111:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2242:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1510:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2192:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2027:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2356:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2032:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2105:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2697:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2286:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2175:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2134:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2696:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1725:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1696:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1955:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1889:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1943:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1931:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2226:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1898:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2117:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2508:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2018:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1935:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1510:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1877:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1771:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2275:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1880:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1656:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2430:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2088:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1666:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2080:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2037:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1742:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1779:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1868:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1812:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1414:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2300:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2081:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2295:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2156:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2058:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1757:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2243:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2649:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2649:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2056:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1828:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2511:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1973:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1793:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2742:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1928:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2501:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2080:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2488:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2453:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2207:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2046:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2200:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2113:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2204:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2974:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2155:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2597:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1765:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1920:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1923:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2315:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2280:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2303:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2050:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1689:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2298:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2359:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2039:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2477:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1974:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1940:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2020:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2110:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2337:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2217:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2040:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1835:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1926:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1761:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1491:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2531:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2277:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2484:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1774:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1984:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1824:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2107:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1989:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2280:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1945:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2223:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1926:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1988:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2596:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2094:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2258:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2157:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2347:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2059:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1955:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2438:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1627:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1566:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1984:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1804:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2563:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1838:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2015:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1770:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.3106:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1647:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2145:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1928:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1895:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1880:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2157:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.0993:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.0993:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1251:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1897:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2422:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2084:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2646:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2353:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1789:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2060:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1865:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2602:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2102:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1982:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1976:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2135:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2012:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1970:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2161:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1740:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1728:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2487:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2337:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1838:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2269:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1883:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1714:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2136:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2313:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2079:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1979:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1968:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2900:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1921:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2127:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2714:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2282:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2004:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2488:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2807:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2364:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1999:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2396:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1975:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2051:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1713:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1870:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2109:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1829:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1896:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2004:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2697:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2194:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1575:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1520:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1531:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1982:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2022:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2560:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2191:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1791:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2603:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1730:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2221:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2276:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2483:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2195:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2147:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1931:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1756:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.3049:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2007:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2022:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2558:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2115:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2612:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2613:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1236:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2463:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2071:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1351:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1351:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2163:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2867:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1707:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2064:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2884:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2468:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1859:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2687:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2710:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2775:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2539:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1694:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2176:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2321:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1739:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1722:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2020:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.3033:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1755:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2005:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2232:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2182:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2078:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2018:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2002:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1819:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2005:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1578:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2380:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1923:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2327:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2381:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1764:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2336:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2076:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2322:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2728:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2279:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1499:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2041:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2096:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2035:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2461:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2264:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2237:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1951:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2382:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1804:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1858:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2120:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1833:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1837:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1617:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1856:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2112:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2189:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1591:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1878:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1683:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2143:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1991:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2135:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2270:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1715:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1872:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2048:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1750:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2134:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2027:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2193:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2179:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1887:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2244:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2483:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2175:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2238:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1583:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2109:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.4247:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.4247:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1552:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2175:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2100:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2081:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2219:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2678:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1869:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1847:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1721:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2533:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1831:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2174:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2379:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2389:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1989:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.3051:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2115:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2500:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1861:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2063:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2153:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2172:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2107:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2346:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2762:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2717:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.3097:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2135:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1685:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1888:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2588:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1522:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2265:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1852:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2085:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1859:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2176:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2028:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2710:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1812:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2243:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1952:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1842:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2078:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2767:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1983:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2147:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.3041:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1693:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1958:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2669:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2231:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1846:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2060:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1710:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2236:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2381:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2689:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1956:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2169:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2824:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2721:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2127:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2219:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.1907:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2534:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2381:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2103:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.1822:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2236:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2086:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2218:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2012:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.1736:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.1531:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.1710:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2143:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2806:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2548:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2548:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2202:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1990:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1846:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2255:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2269:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2978:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2515:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2507:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1986:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2938:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2046:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2388:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2109:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1846:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2415:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2317:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2232:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2733:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1910:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1785:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2229:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2314:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1984:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2298:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2010:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1910:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2074:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2329:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2236:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2465:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1770:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2206:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2229:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2100:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2068:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2405:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1919:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1530:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1943:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1847:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1889:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2401:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2095:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2111:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1915:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2215:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2512:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2549:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2345:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.3128:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1755:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2284:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2196:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2291:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1716:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2381:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2099:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2132:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1877:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2244:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2421:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2661:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1817:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2468:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1847:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2607:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2371:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2237:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2512:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2490:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2116:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1756:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1783:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2329:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1912:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1726:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2080:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1955:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1932:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1932:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2042:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2494:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1656:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2284:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2888:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2890:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2633:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1666:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2114:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2535:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1867:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1657:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2327:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2038:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2518:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1919:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2420:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2685:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2138:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2046:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1934:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2103:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2490:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2272:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1813:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2465:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2399:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1793:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2185:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.3028:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2758:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2248:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1963:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1821:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2519:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2243:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1677:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1712:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1792:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2280:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2471:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2206:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2122:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2068:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2290:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2805:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2168:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2032:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1789:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2041:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2372:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1764:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2508:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1761:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2780:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1879:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2070:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2527:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1966:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1620:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.3009:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1897:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2791:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2084:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2353:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1963:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1688:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1776:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2136:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2520:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2110:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2374:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1904:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2117:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2226:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1923:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1884:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2568:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1398:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1398:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2144:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2728:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2122:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2128:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1831:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1812:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2284:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1853:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1997:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2201:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2279:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1854:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2241:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2682:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2585:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2137:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2707:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1814:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2645:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2550:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2243:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1946:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1936:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2101:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1673:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2225:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2343:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2188:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2184:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1448:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1902:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2282:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2079:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2534:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2345:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2171:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2414:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2206:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1835:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2286:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1896:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1597:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2361:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1274:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2455:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2247:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1612:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2206:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1936:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1630:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2149:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2225:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1606:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1563:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2603:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1822:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2209:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2250:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2403:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1930:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1512:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1851:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2176:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2134:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2239:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1989:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1603:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2270:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2126:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2000:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1554:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2323:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2506:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2539:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.3207:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1700:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2048:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2387:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1072:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1072:  82%|████████▏ | 329/401 [03:11<00:24,  2.88it/s]training loss: 0.2283:  82%|████████▏ | 329/401 [03:11<00:24,  2.88it/s]training loss: 0.2642:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2394:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2249:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2078:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2531:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2033:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2298:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1957:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1602:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1628:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2533:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2016:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2910:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2024:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2190:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2610:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2447:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2758:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1881:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1776:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1907:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2407:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1789:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2892:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2426:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1640:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1903:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2395:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2599:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1627:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2227:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1940:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2039:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2210:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1791:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1990:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1165:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1877:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2082:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1803:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2471:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2154:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1879:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1747:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2362:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1851:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2009:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1706:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2788:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2002:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2309:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1997:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2680:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1397:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2134:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1983:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2618:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2173:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2193:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2703:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2193:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2327:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2374:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2239:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2165:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1716:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1987:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1941:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2322:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2311:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2065:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1610:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2231:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2541:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1903:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2275:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2170:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1106:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1106:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2265:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2264:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2044:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1522:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1960:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1778:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1788:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1766:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2284:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2285:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2368:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1944:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2388:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1734:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2222:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2150:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1752:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2699:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2221:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2178:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1980:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2113:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2022:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1893:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2260:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1804:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2293:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1716:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2109:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2202:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1678:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2106:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1926:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1624:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2232:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2087:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1493:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2133:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2272:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1761:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2586:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1995:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2454:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2131:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2202:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1421:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1663:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2345:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2326:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2371:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2258:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2165:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2122:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2216:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1682:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2159:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2123:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2046:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1872:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2007:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1708:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2413:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1952:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2038:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2392:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2509:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2240:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2286:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1853:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1800:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2001:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2812:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1776:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2251:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2088:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2049:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1994:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2126:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1109:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1109:  83%|████████▎ | 331/401 [03:14<01:10,  1.00s/it]training loss: 0.1990:  83%|████████▎ | 331/401 [03:14<01:10,  1.00s/it]training loss: 0.2126:  83%|████████▎ | 331/401 [03:14<01:10,  1.00s/it]training loss: 0.2984:  83%|████████▎ | 331/401 [03:14<01:10,  1.00s/it]training loss: 0.2352:  83%|████████▎ | 331/401 [03:14<01:10,  1.00s/it]training loss: 0.2712:  83%|████████▎ | 331/401 [03:14<01:10,  1.00s/it]training loss: 0.2288:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2000:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1934:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2046:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2105:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2060:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2375:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1915:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1977:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2590:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1609:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2116:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2222:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2966:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2881:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1956:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2311:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1437:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1571:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2117:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2063:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2354:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2379:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1667:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2387:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1973:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1777:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2134:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2219:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1947:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2205:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1806:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2588:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2773:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.3157:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1700:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2118:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2336:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2286:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2124:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1798:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1625:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1979:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2237:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2194:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2280:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2254:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2283:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2222:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2057:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2115:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1699:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2317:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2183:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2195:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2272:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.3226:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2154:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1861:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2139:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2144:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2115:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2126:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1752:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2429:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1867:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2856:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2232:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1921:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2100:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1815:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1802:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2589:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2691:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2691:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1975:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2545:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2248:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2364:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2265:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2259:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1705:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2289:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1579:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1959:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1909:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.3100:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2718:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2120:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2025:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1934:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1127:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1799:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2164:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1720:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.3022:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1915:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2182:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2175:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2488:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1965:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2451:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1927:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2036:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1681:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1766:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2456:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2036:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2956:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1957:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1898:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1491:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2067:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1803:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1837:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1884:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2448:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2396:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1718:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1988:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1927:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2581:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1832:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2011:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2095:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1802:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2351:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2052:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2253:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2252:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1438:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2068:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1992:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1867:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2579:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2466:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2294:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1869:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2194:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2903:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2207:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2068:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1826:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1884:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.3078:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1904:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2032:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2468:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2305:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1808:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1968:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2364:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1956:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.4507:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.4507:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1940:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2483:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1889:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2183:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1954:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1602:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1892:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2087:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2146:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1904:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2267:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1714:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1856:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2014:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2134:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2262:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2227:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1970:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2175:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2259:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2269:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2569:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2127:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1610:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.3032:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2985:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1930:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1713:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2114:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2033:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1844:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2409:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2294:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2395:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1941:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1833:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1769:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2726:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1832:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2366:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2210:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2022:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2531:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1911:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2088:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1663:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1838:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2866:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2185:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2263:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1628:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2043:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1781:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1665:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2750:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2022:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1920:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1681:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1831:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2147:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2048:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2205:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2587:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1869:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2348:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2108:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1489:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1856:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2409:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2773:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2530:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2038:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2175:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1972:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2619:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2232:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1981:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2743:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1356:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1356:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2136:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2022:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1957:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1539:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2399:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2084:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1611:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1670:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2266:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2138:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2267:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2469:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1843:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2593:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2020:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2181:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2625:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2236:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1982:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2279:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1913:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2486:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2301:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1834:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2402:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2614:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2444:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2269:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1585:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1985:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1769:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1925:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1670:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1913:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2121:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1420:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1754:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1761:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2059:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1896:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1886:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1846:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1644:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2041:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1748:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2131:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2107:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2317:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2479:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2253:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1954:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2203:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2468:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1952:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2019:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2129:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2356:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2078:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2027:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1878:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2300:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2912:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.3033:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1911:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2079:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2006:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2095:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2495:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1753:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2337:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2001:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1639:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1822:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1857:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1641:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1813:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2400:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2192:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.4509:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.4509:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1897:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2312:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1959:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2330:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2259:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1749:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1906:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2321:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2121:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2371:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1270:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2155:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2174:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2559:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2181:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2391:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1712:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2136:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1646:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2671:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2576:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2326:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1878:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2130:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1978:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2005:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2327:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1749:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2226:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1923:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1868:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2000:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2416:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1907:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2025:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1815:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1679:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2262:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2163:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2300:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2134:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1954:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2580:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2384:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2923:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2297:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2334:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2460:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1861:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1334:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1822:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2153:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2250:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2056:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2095:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2078:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2066:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2006:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2409:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2078:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2036:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2115:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2067:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1747:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1861:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2470:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1691:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2101:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1808:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2200:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2016:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1965:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2222:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2979:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2556:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1799:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2313:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2056:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1042:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1042:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2178:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2229:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1991:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2487:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2118:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2204:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1950:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2707:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2557:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2707:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2603:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2111:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2740:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1900:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2262:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2240:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1832:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2839:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2280:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2114:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2515:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2694:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2061:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1736:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1996:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1772:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2118:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1883:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2484:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1888:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1645:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2257:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1765:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2023:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1968:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1731:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2828:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.3060:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2572:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1665:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2463:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2307:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1940:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2547:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1538:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1998:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2311:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2150:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1989:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1583:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1891:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1955:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1817:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2325:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2150:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2059:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2323:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2178:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2809:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1891:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1942:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2502:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2162:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2395:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1518:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2092:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2857:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2330:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2324:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2117:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2758:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.1649:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.1972:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.1939:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.1836:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2316:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2136:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2030:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2406:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2406:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2059:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1516:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1640:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2190:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2554:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1796:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2411:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2283:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2210:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2676:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1612:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2298:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1972:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2106:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2018:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.3163:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2540:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1970:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2055:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1965:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2417:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2092:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1984:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2542:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2323:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2218:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2002:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2789:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2073:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1875:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1994:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2465:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1637:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1692:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1964:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2559:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2051:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2206:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2211:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2258:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1771:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1777:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2399:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1839:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1590:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2536:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2347:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2952:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1635:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2815:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2788:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2610:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.3123:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2466:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2377:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1487:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2627:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1915:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1991:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2003:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2448:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2159:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2120:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1887:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2462:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1861:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2292:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2012:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2308:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2598:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1512:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2665:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2251:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1929:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2329:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1743:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2259:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2126:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2353:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2353:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2287:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2108:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1708:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1825:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2319:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2915:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1788:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2309:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2427:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2818:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2372:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2447:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2009:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2549:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2390:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2088:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1429:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2244:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1831:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2107:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1525:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1893:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1976:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2077:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1987:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1882:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2033:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1806:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2271:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2301:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2444:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2440:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1889:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2476:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1957:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2261:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1705:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2593:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1878:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2181:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1729:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1369:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1833:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2217:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2125:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1754:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2013:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1444:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2205:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2911:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1713:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2092:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1718:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2351:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1581:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2859:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1663:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1890:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1972:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2015:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1816:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1575:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1769:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2525:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2324:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2432:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2088:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1654:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2123:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2798:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2042:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2089:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2243:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2055:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2284:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1711:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2426:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2259:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1612:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1612:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1979:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2351:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1936:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2534:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1585:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2192:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2250:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2287:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1875:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2257:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2293:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1741:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2332:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1649:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2016:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1843:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1680:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2704:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2288:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2025:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2237:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2300:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1829:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2769:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2280:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2360:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2453:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2180:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2038:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2170:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2271:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1651:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2694:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1904:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2224:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2251:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1702:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2312:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2109:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2312:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1980:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2124:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2435:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1677:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1708:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2992:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1999:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2639:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1447:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1856:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2185:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1926:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2444:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2297:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1601:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1859:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2021:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2128:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2289:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1922:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2058:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1979:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2103:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1994:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2123:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2170:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1890:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1776:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1859:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2341:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2568:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2587:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2412:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2213:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1861:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2180:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2887:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2378:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1375:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1375:  85%|████████▍ | 340/401 [03:17<00:21,  2.88it/s]training loss: 0.1513:  85%|████████▍ | 340/401 [03:17<00:21,  2.88it/s]training loss: 0.2149:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1960:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1985:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2353:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1843:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2059:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1515:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1474:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1995:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2368:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1536:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2668:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2890:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1847:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2387:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1915:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2479:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1769:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2049:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1896:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2543:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1603:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1960:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1957:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2440:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2370:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1907:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1859:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2540:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1706:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2143:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2136:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1687:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2700:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2368:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1900:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1914:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1960:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1275:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2475:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2301:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2275:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2330:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1783:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2664:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1700:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2541:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2647:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1672:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1743:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1752:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2143:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1896:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2249:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2421:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2354:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2352:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1484:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1734:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2308:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2110:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2349:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1956:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1779:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2268:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2499:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2253:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2260:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2023:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1687:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2066:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2134:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2167:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1975:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2323:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2669:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2259:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2409:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2409:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1987:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1818:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2164:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2056:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2470:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2504:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1916:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2063:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2297:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1734:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2428:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2037:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1620:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1679:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2550:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1628:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1447:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2126:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2054:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2103:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2066:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1850:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1993:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2493:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2095:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2394:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1966:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2139:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2207:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1406:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1945:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2362:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2548:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2349:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1602:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2921:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2189:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1688:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1551:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1714:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2422:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2124:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2204:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2127:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2140:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.3012:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2119:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2555:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2766:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2162:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2380:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2062:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1619:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.3122:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2346:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2841:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1900:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2248:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1399:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2003:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2132:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2675:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1868:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2487:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1926:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2639:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.1930:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2286:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2303:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.1773:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2256:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2554:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2344:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.1954:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2073:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.1767:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2145:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2290:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2229:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2229:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2602:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2242:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2187:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1758:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2057:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.3061:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1804:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1643:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2371:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2349:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2257:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2238:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2687:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1987:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1854:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.3040:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2427:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1925:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1584:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2009:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1810:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2163:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1558:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2057:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1769:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2135:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1605:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2538:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1718:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2401:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1675:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2050:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1991:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2093:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2507:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1809:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2072:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1733:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2377:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2152:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2068:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2118:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2134:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1705:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2389:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1665:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2547:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2442:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2762:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1807:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2218:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2512:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1852:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2362:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2312:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2300:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1878:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2743:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2379:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2693:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1945:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2050:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2048:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2346:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2249:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2088:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2419:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1841:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.3038:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2335:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1470:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1795:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1731:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2289:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1749:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2101:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1732:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2735:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1991:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1991:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2096:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2136:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1928:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1997:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2225:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1680:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2045:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2018:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2244:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2342:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2108:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2070:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.3353:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2590:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2316:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2147:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2263:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1956:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2413:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.3098:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.3125:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2318:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1865:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2345:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2442:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2260:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1900:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1586:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2088:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1847:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1690:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2223:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1884:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1697:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2301:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2025:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1691:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1756:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1982:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1800:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2502:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2243:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1800:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2006:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1963:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2828:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1776:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2326:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2505:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2193:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1789:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1794:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1765:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2428:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2023:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1562:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2474:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2021:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2707:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1936:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1965:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2489:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2210:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2184:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2316:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1968:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2031:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2152:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1801:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2806:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1880:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2370:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2454:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2258:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1516:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2020:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1472:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2735:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.3563:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.3563:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1998:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2158:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2130:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2187:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2278:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2426:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2041:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2047:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2372:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1648:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2106:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2199:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2048:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2442:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1933:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1912:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2877:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1364:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2030:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1826:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2437:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1841:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2004:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1820:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2041:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1606:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1812:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2333:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2307:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2347:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2515:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1947:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2001:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1767:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2282:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1956:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1865:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2457:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1772:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2167:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2164:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1986:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1696:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2233:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2285:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1882:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2305:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2522:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1861:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1957:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1859:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1710:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2086:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2401:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2418:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2166:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1659:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1718:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2320:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1949:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2037:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1909:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2140:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2175:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1943:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2499:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2093:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2502:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2859:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1946:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1861:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2523:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2351:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1953:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2145:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2160:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2287:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2166:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.3676:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.3676:  86%|████████▌ | 345/401 [03:21<00:27,  2.03it/s]training loss: 0.2365:  86%|████████▌ | 345/401 [03:21<00:27,  2.03it/s]training loss: 0.2226:  86%|████████▌ | 345/401 [03:21<00:27,  2.03it/s]training loss: 0.1951:  86%|████████▌ | 345/401 [03:21<00:27,  2.03it/s]training loss: 0.2292:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2297:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1502:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1879:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1762:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2122:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2424:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2161:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2147:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1697:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2266:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2098:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1785:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2306:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2297:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2498:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2200:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2152:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2177:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1770:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2683:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2497:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2331:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2168:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1604:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1492:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1684:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1915:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1261:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2492:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2638:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2084:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1864:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2219:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2418:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2669:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2006:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2051:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2517:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1732:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2054:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1903:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1975:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2358:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2675:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1969:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2319:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2472:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2174:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2238:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2065:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2299:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2671:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2073:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1796:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1833:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1945:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2415:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2043:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2504:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1446:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1809:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1696:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1862:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2102:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1486:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1852:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1916:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2120:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2233:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2431:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2177:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2345:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2085:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1943:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1583:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1583:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2944:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2794:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1879:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2190:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2234:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2552:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2112:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1702:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2168:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1597:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2495:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1537:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2200:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2459:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2125:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1858:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2325:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1416:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2383:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2153:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1922:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1935:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1970:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2475:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1802:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1793:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2022:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2124:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1914:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2077:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2491:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2163:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2536:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2417:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2414:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1686:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2649:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2504:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2052:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2621:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2806:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2109:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2293:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2360:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2030:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2116:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2216:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1558:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1633:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2996:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1832:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2300:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1960:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2327:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1608:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2107:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2460:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1927:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1827:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2137:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2230:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2575:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1966:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1847:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1886:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2285:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1836:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2399:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2114:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1940:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1522:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1440:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2143:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1733:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2767:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2017:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1806:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2357:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1862:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1862:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1965:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2179:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1984:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2060:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1769:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2360:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2090:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2271:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2531:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2199:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1841:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2638:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2071:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2297:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2262:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2281:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1820:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1887:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1778:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2053:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1884:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1975:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2729:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1930:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1988:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1785:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2272:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.3211:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2171:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2300:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2816:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2231:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2120:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1950:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2268:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2629:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2256:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2195:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2114:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1940:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2139:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1761:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1673:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2627:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2017:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2251:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2319:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1570:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2243:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1798:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2143:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1883:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2245:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1877:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2005:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2493:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2327:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2783:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2347:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1557:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2478:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2122:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2556:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2015:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1914:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2119:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1971:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2064:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2601:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2086:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1485:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2230:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1855:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2237:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2277:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2091:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2463:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2348:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1048:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1048:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.1949:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.2605:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.2007:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.1789:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.1812:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.1540:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.2037:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.1394:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.2497:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.2750:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.1869:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.1642:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.2243:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.2233:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.3035:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2343:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1968:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1745:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1687:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2068:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2109:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1987:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1877:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1787:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1870:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2178:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2740:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2136:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2322:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1936:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2256:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1931:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1835:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2352:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1930:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1764:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2194:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2274:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1795:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1764:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2251:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1953:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2080:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1962:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2619:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1889:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2052:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2223:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1521:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2197:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2461:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2294:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2425:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2033:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2107:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2089:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1916:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1928:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2286:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2639:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2356:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1801:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2126:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1550:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2551:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2577:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1696:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1710:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1907:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.3080:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2150:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2425:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2432:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1782:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2434:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2201:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2209:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1918:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2399:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2399:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2627:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1758:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2089:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2463:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2687:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1875:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2258:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2205:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1772:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2398:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2576:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2600:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1961:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1508:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2335:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2285:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1832:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1972:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2279:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2352:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2025:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2230:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.3047:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1806:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2532:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1912:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1793:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2095:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2598:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2337:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1903:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2072:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2221:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2265:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2161:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1684:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1734:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2477:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2594:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2042:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1747:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2473:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2240:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1859:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1673:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2478:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2200:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1941:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1987:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1663:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2059:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1789:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2325:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2032:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2465:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1551:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1580:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2085:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1797:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1793:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2486:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2293:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1869:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2010:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1870:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1546:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2515:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2120:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2139:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2528:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1856:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1735:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2010:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1808:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2028:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1584:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1734:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1376:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.0580:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.0580:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1976:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2440:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1888:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1499:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1851:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2469:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1984:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2266:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2727:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2545:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1856:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1710:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2739:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2085:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2253:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2662:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1842:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1873:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2171:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1624:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2028:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2049:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2031:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2504:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1698:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2050:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.3165:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2123:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2418:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1692:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1799:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1962:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2363:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2269:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2471:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1711:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.3365:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2508:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1889:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1817:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2275:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1508:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1909:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2123:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1816:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2018:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2096:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1588:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1444:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2050:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1910:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2247:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1985:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2181:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1700:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2269:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1852:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2080:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2156:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2608:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2997:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1760:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1961:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1875:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1723:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1820:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2424:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2028:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2062:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2007:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2028:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2181:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2178:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1755:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1876:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1662:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2103:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2055:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1759:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1759:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2473:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2307:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2226:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2311:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2094:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2180:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2409:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2307:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1836:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1817:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1997:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2421:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2136:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1910:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2819:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1624:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2100:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1995:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1959:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2376:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1638:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1829:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2184:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2305:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2269:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2201:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2378:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1442:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2387:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2182:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2187:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1637:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2585:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1974:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2046:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1975:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1900:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2262:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2015:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2351:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1899:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1811:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2217:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1772:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2495:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2000:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2337:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2317:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2499:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2726:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2140:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2249:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1655:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2256:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2150:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2709:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1951:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2126:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2423:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2275:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1774:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2335:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1543:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2289:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1608:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2314:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2700:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1731:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1940:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2602:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2406:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2081:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1792:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2062:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2487:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1445:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2160:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1819:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2377:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2377:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2562:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2349:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2647:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2074:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2027:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2069:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2206:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1406:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1494:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2689:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1792:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2096:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2073:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1745:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2058:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1776:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1517:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2462:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2083:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2131:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2100:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2086:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2340:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2401:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2569:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1680:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2747:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2453:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2173:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2661:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2332:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1884:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2509:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1545:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2113:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1794:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1788:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2058:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2646:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2669:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2050:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2567:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2339:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2220:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1760:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2540:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1922:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1844:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2245:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2415:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1686:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1988:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2204:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1701:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2028:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1847:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2199:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1951:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1823:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2163:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1456:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2135:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2472:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1975:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2356:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1979:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1684:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1540:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2003:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1890:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2135:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1894:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2115:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2259:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2270:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2045:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2370:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1648:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1307:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1307:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2206:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1479:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1985:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2490:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1630:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1714:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1911:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2557:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2643:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2396:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1768:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1840:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1547:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2185:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2385:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2244:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2858:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1673:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1630:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1896:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1767:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2704:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2321:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2285:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2158:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2088:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1986:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2562:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1923:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2343:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2756:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1919:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2615:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2223:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1695:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2096:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2135:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2120:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2203:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1858:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1643:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1953:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1938:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2066:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1781:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2217:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2304:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1819:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2173:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1489:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1664:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1782:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2548:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2159:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1933:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2716:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2054:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1733:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1705:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2229:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2659:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1858:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2070:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1855:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1748:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2342:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1892:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2359:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2793:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1914:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2520:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2121:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1650:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1918:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2440:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2072:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1731:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2488:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1213:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1213:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2003:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.3086:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2700:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2328:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2268:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2062:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1857:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1920:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2174:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2311:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1789:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2023:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2153:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2217:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2334:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2466:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2231:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2305:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2434:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1916:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2337:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.3268:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2103:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2069:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1950:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2381:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2215:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1956:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2440:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2504:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2697:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2298:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1793:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2272:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1786:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1796:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2160:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1847:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1785:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2116:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1994:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2023:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1993:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1642:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2133:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2078:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1875:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2341:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2220:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2314:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2047:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2001:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2251:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2223:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1538:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2444:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1935:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1853:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2267:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2133:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1889:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1508:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2379:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1978:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2185:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2746:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2107:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2670:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2497:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2370:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1842:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1928:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2659:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2597:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2299:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1608:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2664:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2320:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1504:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1504:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2166:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1801:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1817:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2170:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1988:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2483:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2326:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1794:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1352:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1756:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1987:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2354:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2410:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1963:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2016:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2124:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1715:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1771:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1824:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2110:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2179:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1498:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1988:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1836:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2240:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2192:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2144:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1551:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2028:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2133:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2596:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1872:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2038:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2103:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2107:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2276:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1840:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2513:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2467:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1797:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1938:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2364:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1855:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2359:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1798:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2067:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1930:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1959:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2373:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1805:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2125:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2246:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1713:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2373:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1946:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2175:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1518:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1986:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2567:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2494:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1819:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2200:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2066:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2028:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1677:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2285:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2204:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.3018:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2262:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1663:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1872:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2129:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2510:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2532:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1994:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2149:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2341:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2206:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2978:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2978:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2235:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2622:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2065:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2469:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1739:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2467:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2431:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2020:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2763:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2079:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1748:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2258:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2702:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2026:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1809:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2548:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2094:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2598:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2182:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2366:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2000:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2445:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2151:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2778:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2041:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1714:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1666:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2188:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1676:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2228:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2196:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2177:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2135:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1281:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2463:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2716:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2573:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1738:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1850:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2270:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2415:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2200:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2101:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1797:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.3054:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2102:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2286:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2189:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2415:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2089:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1738:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1965:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1870:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1371:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1915:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1475:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2548:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1979:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2072:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2372:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2293:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1923:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1729:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1428:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2389:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1874:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1668:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2120:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.3400:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2062:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2469:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2572:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2585:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2361:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2110:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2370:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2230:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2128:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2476:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2476:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2340:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2891:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2147:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2146:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1981:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1937:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2398:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1594:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2026:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2345:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1857:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2264:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2246:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2327:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2544:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2337:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2009:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1703:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2364:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1896:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2407:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1902:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2541:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1777:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2258:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2499:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2155:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1548:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1838:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1664:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2391:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1520:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2082:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2536:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1973:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2764:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2175:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2029:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2015:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2878:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2833:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2166:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2156:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1985:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2303:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2843:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2431:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2336:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2017:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1724:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1789:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1774:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2916:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2114:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2463:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2434:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2891:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1995:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1697:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1846:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2470:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1878:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1946:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2213:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2172:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2384:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1987:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2962:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2703:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2121:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2572:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2199:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1979:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2243:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1884:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2627:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1875:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2311:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1492:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1492:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2140:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1748:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1727:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1674:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2539:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2520:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2039:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2164:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2368:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2152:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1807:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2296:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2434:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2305:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2340:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1918:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1958:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2230:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2810:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1690:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2111:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2349:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1881:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2296:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2396:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1759:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2003:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2019:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2234:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1953:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2203:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2489:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1822:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1472:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2267:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1524:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1802:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1909:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2096:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1948:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1935:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2216:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1851:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2953:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2535:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1928:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2233:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.3113:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1835:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1865:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2219:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2102:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1775:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2221:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1828:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2285:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.3043:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2713:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2086:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2086:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1990:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1883:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1781:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2012:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2315:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2199:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2253:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2433:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2939:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2078:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1328:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1677:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1709:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2523:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2418:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1714:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1962:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2405:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2169:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2169:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2090:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2514:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1664:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1928:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.3065:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2709:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2024:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2451:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1979:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2039:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2159:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2563:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1965:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1990:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1784:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1847:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1427:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2111:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2273:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2336:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1482:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2244:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2490:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2077:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1659:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2152:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1952:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1822:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2318:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2327:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2171:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2015:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2103:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2350:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2178:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2303:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2761:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2740:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2267:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2051:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1574:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2385:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1724:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2361:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1505:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2816:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2624:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1876:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1729:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2028:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1762:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2004:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1638:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1970:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2505:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2201:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1969:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2110:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2693:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2334:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2150:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2429:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2307:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2088:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1759:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2677:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2732:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2598:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2757:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2445:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1945:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2224:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.3028:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2534:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2484:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2219:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2629:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1730:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1776:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1776:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2509:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2941:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2436:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2549:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2524:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2323:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1612:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1708:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1898:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2126:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1722:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1699:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2095:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1670:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2554:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1731:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2041:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1658:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1811:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2678:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2542:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1762:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2130:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1926:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1928:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2055:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2316:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2734:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1690:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1608:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2456:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2005:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2085:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1839:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2360:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1894:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1680:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2022:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2080:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2927:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2513:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1980:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1847:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2431:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2337:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.3010:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2057:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2391:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2105:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2261:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2209:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2405:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2299:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2416:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1686:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2099:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1827:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1539:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1767:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2050:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1845:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2026:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2088:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2521:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2072:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2156:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2376:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1975:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2359:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2176:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2331:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2324:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2470:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2512:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2261:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1906:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2148:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2169:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1026:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1026:  90%|█████████ | 361/401 [03:31<00:39,  1.00it/s]training loss: 0.1989:  90%|█████████ | 361/401 [03:31<00:39,  1.00it/s]training loss: 0.2193:  90%|█████████ | 361/401 [03:31<00:39,  1.00it/s]training loss: 0.1971:  90%|█████████ | 361/401 [03:31<00:39,  1.00it/s]training loss: 0.1573:  90%|█████████ | 361/401 [03:31<00:39,  1.00it/s]training loss: 0.1833:  90%|█████████ | 361/401 [03:31<00:39,  1.00it/s]training loss: 0.1734:  90%|█████████ | 361/401 [03:31<00:39,  1.00it/s]training loss: 0.2027:  90%|█████████ | 361/401 [03:31<00:39,  1.00it/s]training loss: 0.1916:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1997:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2092:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2523:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1761:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1799:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1976:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1975:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2060:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1992:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2479:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1733:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2061:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2136:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1849:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2157:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2300:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2013:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1343:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2408:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2184:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2079:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2190:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2066:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2163:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1956:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2265:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2501:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2368:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1982:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2297:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1975:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2113:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2963:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2011:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2357:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2018:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2197:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1861:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2100:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2609:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2172:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1734:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2761:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2981:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2397:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2626:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2016:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2323:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1996:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1872:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1500:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2251:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2038:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1524:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2463:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2353:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2200:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2014:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2182:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2025:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2142:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2134:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1824:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2959:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2597:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2234:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1555:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1665:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1912:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2318:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2437:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2437:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2684:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2726:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2374:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2319:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2190:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1691:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2359:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1875:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2113:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2287:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2028:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1592:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1869:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1877:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2531:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2416:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2507:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2349:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2094:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2560:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1845:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2266:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2420:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1776:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1755:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2279:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2041:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1935:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2611:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2422:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2194:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2223:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2373:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2204:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1778:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2305:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1611:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2792:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2290:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2488:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2174:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2241:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2009:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2169:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2121:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2182:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2373:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1753:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2974:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2240:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2056:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1465:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2526:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2137:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2091:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2005:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1821:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1699:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1888:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2349:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1865:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2251:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2347:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2295:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1811:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2404:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2301:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2103:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2153:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1618:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2065:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2053:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2905:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2082:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1679:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1941:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2004:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1735:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.3110:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.3110:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2299:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2313:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2144:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2076:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1848:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2264:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2302:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2254:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2138:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1757:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2455:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2457:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2670:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2039:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1886:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1787:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2638:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2382:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1765:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1826:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2077:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2500:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2135:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2327:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1583:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1884:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2397:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1565:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1843:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2340:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2219:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2102:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2075:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2511:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2370:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2255:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1836:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2681:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1732:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2521:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2368:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1886:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2665:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1983:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1662:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2490:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2641:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2556:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1962:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1868:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1998:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2311:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2110:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2237:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2131:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1998:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1899:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2128:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2476:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1717:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1953:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2502:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1724:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2237:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2740:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1884:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2236:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2549:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2230:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2260:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2412:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1743:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2103:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1352:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2252:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1779:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2920:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1750:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.3027:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.3027:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2080:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2543:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2181:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.1953:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.1921:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2681:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2410:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2180:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2428:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2048:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.1902:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.1855:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2333:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2819:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.1931:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2110:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2124:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2273:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2335:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2195:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2193:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.1729:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1480:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1341:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.3135:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2677:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2651:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2549:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2432:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1787:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2474:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2179:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2246:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2225:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1798:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1698:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2027:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2037:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2477:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2174:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2371:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2630:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2464:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1662:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2004:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2599:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1503:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1975:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2354:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1771:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2122:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2529:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2031:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2166:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1856:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2362:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1654:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1714:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2612:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2214:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2432:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1931:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1722:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2288:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1599:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2383:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2030:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1838:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2145:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1800:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2473:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2177:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2565:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1859:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2140:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1721:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2575:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2159:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1010:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1010:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2621:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2138:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1873:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2726:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2109:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1645:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2368:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1629:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1531:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2623:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2259:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2551:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1770:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2294:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2305:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1881:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2285:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2755:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1960:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.3154:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.3251:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2263:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1586:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1969:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2351:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1677:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2123:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2093:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2228:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2237:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2226:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2088:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1694:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2302:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1981:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2087:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1712:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1910:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2304:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1786:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2450:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2236:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2320:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1926:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2502:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1618:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1992:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2335:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2141:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2501:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2764:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2168:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.3166:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2282:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1594:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1770:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1804:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2147:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.3204:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1714:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2383:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1747:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1874:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2078:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2760:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2264:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2268:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1998:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2050:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1490:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2001:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1982:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1633:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2369:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2358:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1940:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2052:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1860:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1771:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1771:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2280:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2544:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1666:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1895:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2108:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2658:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1762:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2159:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1629:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1695:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1216:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2848:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1745:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2088:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2058:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2273:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2139:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2270:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2362:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1935:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2269:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2171:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2540:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1993:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1909:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2108:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2060:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2129:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1778:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2021:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2753:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2137:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2057:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2417:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2213:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2633:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1846:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2164:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1926:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1457:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2279:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1964:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2119:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2371:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2216:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2249:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.3121:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2031:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1614:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1836:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2028:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2270:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1994:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1823:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1904:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2093:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1847:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1869:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2096:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1858:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2917:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1720:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2093:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2222:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1969:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2041:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1871:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2606:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1572:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1976:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1902:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2145:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1844:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1912:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2180:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1920:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1946:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2193:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1055:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1055:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2038:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2482:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2227:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2410:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2463:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1791:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2053:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1751:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2618:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1894:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1842:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2195:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2238:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2301:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1731:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2104:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1807:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2286:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1759:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2236:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1888:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1621:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2037:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2021:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2001:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2297:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2208:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1799:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2031:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1737:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1887:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2098:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1871:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2252:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2332:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1852:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2652:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2113:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1826:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2242:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1948:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2224:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2462:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2247:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1959:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2413:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2041:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1986:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1665:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1928:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2222:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1854:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2099:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2317:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2209:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1978:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2566:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2782:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1795:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2025:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2141:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1838:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2502:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2101:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2302:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1690:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2115:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2144:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2279:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2051:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2629:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2179:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2011:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1769:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2220:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1768:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1423:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2801:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1557:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1557:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2439:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1625:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2145:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1533:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2088:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1427:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2798:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1785:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1819:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2089:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2367:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2180:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2664:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1872:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2230:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2183:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1485:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2270:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2385:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2366:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2322:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2243:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2325:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2278:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1710:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1692:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1989:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2290:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1908:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1995:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1616:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1957:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1924:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2363:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2109:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1637:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2360:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2361:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2105:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2556:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1947:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2474:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2487:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2481:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2338:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1952:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2545:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2337:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1834:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1640:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1697:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1813:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2479:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2033:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1680:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2446:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2638:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1956:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2097:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2096:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1884:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1673:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2348:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2037:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2302:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1936:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1974:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1950:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2225:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2226:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1753:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2146:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1979:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2222:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2460:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1662:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2059:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2578:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.3616:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.3616:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1767:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2095:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2187:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2010:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2125:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2189:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2926:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.3251:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1775:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1978:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2288:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2009:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1900:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2195:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2078:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2344:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2584:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1722:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1852:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2049:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2588:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1588:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2137:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2028:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2412:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2220:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2429:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2425:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1659:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1896:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2405:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2239:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2203:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2202:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2032:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2204:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2021:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2580:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2214:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2192:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1952:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2456:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2005:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1627:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.3605:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2120:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2117:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1480:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2378:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2834:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2054:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1905:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2045:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2094:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1930:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2452:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2171:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1935:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2585:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2345:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2078:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1881:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1885:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1857:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1730:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2310:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2133:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1633:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2296:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2231:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2175:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1934:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2132:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2027:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1806:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2425:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2082:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1957:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1565:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1565:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2787:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2546:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2202:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2068:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1960:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1823:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2553:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2482:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2386:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2407:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1981:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2657:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2340:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1755:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1814:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2824:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1782:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1921:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1870:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2621:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1894:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2314:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1790:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2039:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1669:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1835:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1654:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2149:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2048:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2042:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2108:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2463:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2252:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1992:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1699:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1602:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2078:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1758:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1806:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1605:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2679:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2124:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2550:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2267:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2224:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1498:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1695:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1710:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2350:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1652:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2044:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2220:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2717:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2047:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2247:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2163:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2094:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1726:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2200:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2628:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2014:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2072:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1574:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1995:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1996:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1939:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.3093:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2000:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2143:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1854:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2606:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2656:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1821:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1829:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2950:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2176:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2300:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2421:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2368:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2368:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.1753:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.1610:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2842:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.1824:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2068:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2219:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.1907:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2128:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2150:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2063:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.1725:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2546:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2209:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2660:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2122:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.1982:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2126:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.1780:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2064:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2203:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2262:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2489:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2328:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1905:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1974:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1919:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2553:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2111:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2296:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1907:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2193:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1993:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2213:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1943:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2666:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2031:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1905:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1782:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1786:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2491:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2008:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2176:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1956:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1704:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2125:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2470:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2339:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2106:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2357:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1754:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2406:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2480:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2036:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1657:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2878:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1699:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2373:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1822:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1726:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2172:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2553:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2106:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1742:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1828:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1554:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1998:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2018:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2303:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1833:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2448:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1965:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2537:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2231:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1846:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2471:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2493:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2450:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2430:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2310:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2310:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1899:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1808:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2857:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2353:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1990:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2006:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1827:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2026:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1649:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2519:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2442:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2125:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1995:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1945:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2378:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2631:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1951:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2233:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2475:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1610:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2429:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2092:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2041:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2110:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1818:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1590:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2633:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2293:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1765:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1878:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2293:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2282:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2348:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1986:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2304:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2146:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1779:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2532:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1619:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2451:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2084:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2344:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2499:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2187:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2524:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2039:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1895:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2386:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2060:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1742:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2277:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2310:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2438:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1673:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2776:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2066:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2359:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1789:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1994:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2195:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1339:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2214:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1952:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2049:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1929:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2115:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2229:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2215:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2045:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2184:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1865:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2417:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2369:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2074:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1834:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1795:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1901:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2364:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.6529:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.6529:  93%|█████████▎| 373/401 [03:38<00:23,  1.20it/s]training loss: 0.2480:  93%|█████████▎| 373/401 [03:38<00:23,  1.20it/s]training loss: 0.2310:  93%|█████████▎| 373/401 [03:38<00:23,  1.20it/s]training loss: 0.2170:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2348:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2137:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1538:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2208:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2029:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2202:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2340:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2088:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1673:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2467:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1769:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2118:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1628:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2980:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1884:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2643:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2282:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1738:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2593:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2402:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1584:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2355:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1671:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2526:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1685:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2000:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2244:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2440:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2074:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2053:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1843:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2701:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2776:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2032:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2662:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1761:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2606:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1677:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2620:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2348:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2099:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1980:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1942:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2058:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1866:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2392:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1867:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1843:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2305:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2581:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2317:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1665:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1721:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1849:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2268:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2071:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2130:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2302:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2411:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1705:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2169:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1978:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1812:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2095:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1931:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1830:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1933:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1670:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1859:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2637:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2472:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1655:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1776:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2445:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2308:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1788:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1788:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2141:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2740:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1472:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1820:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2129:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1967:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2091:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2518:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1842:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2194:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1552:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2061:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2115:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2062:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1698:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1566:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1601:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2252:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2460:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1776:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2022:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1844:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2539:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1458:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2034:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1604:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2029:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2335:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2450:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2421:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1772:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1930:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2046:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1746:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1606:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1706:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2407:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2358:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2632:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1998:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2597:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1900:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2500:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2187:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2104:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1783:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2561:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2440:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2164:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2198:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1731:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2141:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2692:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2789:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1672:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1680:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2855:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2232:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1816:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2386:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2198:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2395:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2199:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2790:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2328:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1816:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1743:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2829:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2372:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2204:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1864:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2330:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2394:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1510:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2362:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2617:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1586:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1996:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.3300:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.3300:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2945:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2134:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.1988:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2097:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2247:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2041:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.1881:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.1586:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2776:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2308:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.1773:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.1911:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.1682:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.1776:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2165:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2255:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2367:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.1263:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1925:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1948:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1937:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1780:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1455:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2018:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1999:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2772:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2056:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2618:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1952:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2544:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2126:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2314:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1700:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2141:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2015:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2193:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1950:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2164:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2321:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1758:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2250:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2025:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2412:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1741:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2471:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2191:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2130:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1939:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2065:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1842:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2268:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1791:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2147:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1889:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1955:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2094:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2344:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1807:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2598:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2744:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2095:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2101:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.3208:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2204:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2785:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1670:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2249:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1947:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2580:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2172:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2497:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2017:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1820:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2335:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2295:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2685:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2703:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1911:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1110:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1110:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2828:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2590:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2252:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2212:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2206:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2654:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2166:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2075:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2306:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2134:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2042:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1942:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2244:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2227:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2953:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2218:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2001:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2432:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2390:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2253:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1744:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2082:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2213:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2058:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2336:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2419:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2402:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2203:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2158:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1995:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2183:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1946:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2172:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2011:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2249:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2691:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2093:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2040:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1831:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1273:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1965:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2579:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2553:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2311:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.3101:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1478:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2173:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1902:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2139:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2025:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1672:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1863:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2451:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2202:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1768:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2555:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2584:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1867:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1314:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2068:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2509:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1853:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2145:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2086:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.3609:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2915:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2131:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1971:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1899:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1906:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2186:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1801:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1662:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1850:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2698:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2111:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2103:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1868:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.0909:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.0909:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1415:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2461:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1864:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1896:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2612:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1755:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2688:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1952:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1967:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1865:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2069:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1976:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2279:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1963:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2069:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2442:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2146:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1976:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2281:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1402:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2204:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2167:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1932:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2075:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2320:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1676:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1963:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.3228:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2487:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1751:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2385:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2166:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1896:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2672:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1977:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2270:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1816:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1941:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2057:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1990:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2042:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1936:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1839:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2252:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2495:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2233:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1476:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2125:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2078:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2025:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2126:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1940:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2283:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2828:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1745:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1710:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2478:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1994:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2521:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1731:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2410:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1737:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2787:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2299:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2799:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2263:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1520:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2174:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2276:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2036:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2514:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2075:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1928:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1422:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2207:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2873:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2708:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1906:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2845:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2845:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2674:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2003:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2199:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2156:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1673:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2300:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2783:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2024:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2254:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2093:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2073:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2179:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2347:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2194:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1944:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1954:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2109:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2189:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2100:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1838:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1698:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2463:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2135:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2345:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1911:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2715:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1788:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1931:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1738:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2025:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1883:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2034:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2060:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2355:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2073:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2798:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2575:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1985:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1549:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2102:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1840:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2962:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1729:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2244:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2196:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2349:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2431:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2116:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1882:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2540:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2152:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1891:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1491:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2330:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2126:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1895:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2662:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1522:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2473:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2237:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1698:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2640:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2092:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2654:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2311:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2164:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2276:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2071:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2168:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2095:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2238:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2585:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2001:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2085:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1954:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2424:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1996:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1834:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2249:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2249:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2688:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1734:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2171:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1783:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2041:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1773:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1956:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1994:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1869:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1755:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2721:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1695:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1716:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2223:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2816:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2399:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2129:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2332:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1943:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2267:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.3022:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2251:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2734:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2098:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2306:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2787:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1910:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2542:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2502:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2638:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1936:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1811:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1881:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1897:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1751:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2345:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1798:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2058:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1656:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2241:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2094:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1751:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2246:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2163:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2144:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2064:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2126:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2293:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1799:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1931:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2365:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1420:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1842:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1622:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1691:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2369:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2343:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2188:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2237:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1545:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2167:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2418:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1877:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1956:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1702:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2213:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2664:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2140:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2063:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1693:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2565:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2473:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2426:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2432:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2314:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1737:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1537:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2377:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.3329:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.3329:  95%|█████████▍| 380/401 [03:41<00:10,  1.98it/s]training loss: 0.2109:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1884:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2576:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1566:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1892:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1653:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2120:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2633:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2278:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2582:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2275:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1934:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2292:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2629:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1847:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1860:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2181:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2275:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2607:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1624:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2376:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2147:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1705:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2755:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1888:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2146:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2590:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1944:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2188:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1976:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2261:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1757:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2211:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2411:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1634:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1833:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2246:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1778:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1955:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1818:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2067:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2560:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2270:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2097:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2452:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2245:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2377:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1638:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1970:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1862:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2280:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2721:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2049:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1936:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1888:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2963:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2531:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2872:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2324:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1669:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1445:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1787:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2579:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2341:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2329:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2324:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2441:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2355:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2227:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1831:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2252:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1689:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1602:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2137:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2335:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2480:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2287:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2841:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.0767:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.0767:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2093:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2194:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1871:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2529:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2079:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2070:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.3024:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1515:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2846:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1669:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2359:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2107:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2749:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2305:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1961:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2026:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1693:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2170:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1882:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2204:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2553:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2232:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1423:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2885:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2284:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2454:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2006:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2498:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2479:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2282:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1951:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.3163:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2111:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2003:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1748:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2066:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2032:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2386:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2145:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2204:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2673:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2077:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1941:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2046:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2788:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2085:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2251:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2063:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2086:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2346:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2014:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2111:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2175:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1630:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2497:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1601:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1636:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1704:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2086:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1923:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2076:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1656:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1410:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1732:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1998:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2551:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2233:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1716:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1880:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2076:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2422:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2339:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1820:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2722:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2519:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2066:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1864:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2098:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.0837:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.0837:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1716:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2612:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1855:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2172:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2732:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2781:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2115:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1769:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.3009:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2531:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.3180:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1938:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1697:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1996:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1976:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2381:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2101:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1904:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2285:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2075:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2447:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1766:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2155:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2456:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2232:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1827:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1890:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2197:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2143:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2367:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1757:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2336:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2476:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2086:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2268:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1691:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2425:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2100:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1821:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1680:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2418:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2444:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2345:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1510:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2398:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1981:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2869:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2379:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2253:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2320:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2348:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2304:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1880:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2026:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1614:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2032:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1485:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1785:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2880:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2126:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2146:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2230:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1774:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2214:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2122:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2381:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2880:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1941:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2425:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2141:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1717:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2503:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1839:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2074:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2414:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2103:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1985:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2267:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2063:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2063:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2062:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2654:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2465:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2193:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1761:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2337:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2443:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2190:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2605:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2652:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1921:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2082:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1653:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1998:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2375:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.3267:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2086:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1821:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2684:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1998:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2301:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2722:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1525:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2641:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1646:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2400:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2474:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2399:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1682:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2259:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2361:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1931:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1790:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2104:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2173:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1869:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1800:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2153:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2341:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2756:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1843:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2227:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2390:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2064:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1899:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2341:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2428:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1675:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2442:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2239:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2393:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2440:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2215:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2202:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2218:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1911:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2166:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2292:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1899:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.3128:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2291:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1309:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2290:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2321:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2335:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2370:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2227:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2355:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2476:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1776:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2299:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1518:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2663:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1823:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2112:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2105:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1739:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1772:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1578:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1578:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.2078:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.2296:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.1983:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.1748:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.2011:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.1833:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.2176:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.2369:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.1845:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.1781:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.2048:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.2076:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2654:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2263:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2018:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1348:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2283:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2277:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2382:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2063:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1799:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1861:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2288:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1841:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1839:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1823:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.3030:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1796:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2210:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1935:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2277:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2404:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2492:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2468:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1801:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1891:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1671:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2211:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2241:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1755:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1738:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1967:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2122:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2286:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1853:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1320:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2347:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1899:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1857:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2105:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1895:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2140:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1471:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2113:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1751:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2451:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2334:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2306:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1943:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2092:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2143:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2250:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2157:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.3448:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1748:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2340:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2002:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1496:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2062:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2397:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2366:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2359:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1984:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2532:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1538:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2185:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2864:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2307:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2084:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2084:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2017:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2124:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1838:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2944:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1831:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1803:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1630:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2281:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2886:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2475:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1871:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1698:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2193:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1691:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2187:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1930:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2581:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2275:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2097:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2337:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2406:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1678:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1581:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1962:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1952:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2393:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1632:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1547:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2032:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2669:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2635:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2351:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2204:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2416:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2748:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1957:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1943:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2102:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2756:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1907:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2124:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1803:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2713:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2596:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2021:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1578:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2259:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1536:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2087:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1669:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1394:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1898:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2061:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2422:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1617:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1928:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2183:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2215:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1977:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2377:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2122:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2048:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2284:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1614:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1857:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2342:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1871:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1965:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1522:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2039:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2018:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2433:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2984:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1855:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2295:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1822:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2378:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1883:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.3686:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.3686:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2215:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1676:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.3035:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2131:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2534:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2503:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2516:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2456:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2055:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2209:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2172:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2168:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2302:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2718:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2893:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1755:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2215:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1956:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1740:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2055:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1760:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2377:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2243:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1724:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2247:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2867:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2314:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2204:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2231:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2101:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1800:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2230:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2136:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2235:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2133:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2039:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2598:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1951:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2098:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1563:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1672:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1944:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2445:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1790:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2441:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2456:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2380:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1726:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2080:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2026:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2588:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2076:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1750:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2004:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2248:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2001:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2324:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2291:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2356:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1838:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1892:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2569:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2345:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1767:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1846:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1403:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1571:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2441:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1633:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1813:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1760:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.3233:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2802:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2119:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1826:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1552:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2618:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1986:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1925:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1925:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2518:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2136:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.1900:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.1956:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2450:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2430:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2263:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2253:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2137:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2152:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2116:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2121:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.1850:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.1962:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2434:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2593:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2434:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.1884:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.3377:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2125:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2202:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2267:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2720:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2287:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.3264:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2514:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2562:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1688:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1979:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2389:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2275:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1788:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1785:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1639:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2708:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2300:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2345:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1965:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1746:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2442:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2436:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2858:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1969:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2715:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2333:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2305:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2524:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2586:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.3247:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2304:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2906:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2829:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2117:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2784:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2353:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2465:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2467:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2135:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1771:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1922:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1908:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2096:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2084:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2076:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1785:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1919:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2020:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1813:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2028:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2335:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2063:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1981:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2535:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2257:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1736:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2261:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1664:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1914:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2003:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2003:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1999:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2478:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2581:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2040:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2508:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1966:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1908:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2060:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1383:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1719:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2279:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2089:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2124:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1973:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1949:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2104:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1923:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1616:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2129:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2323:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2340:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1585:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2027:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1606:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1871:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1913:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1961:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2499:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1812:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2222:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2329:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1684:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1960:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1688:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2389:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1566:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2226:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2212:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2145:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1769:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2162:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1923:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1619:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2304:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2044:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2182:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1799:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2247:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2113:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1652:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2340:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2240:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2408:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2447:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1767:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2175:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2447:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2532:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2402:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2047:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2114:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1847:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2354:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1973:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1939:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1493:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2191:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2266:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1985:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1977:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1910:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1605:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2898:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2224:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2182:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1835:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1625:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2550:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.3077:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.3077:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2283:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2317:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1969:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1663:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1754:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1990:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1927:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1928:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1904:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1719:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2220:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2211:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2730:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1731:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2050:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2564:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2894:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2491:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1773:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2126:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1739:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2138:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1995:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2607:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2260:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2010:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2054:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2782:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.3074:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2011:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1498:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1916:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2549:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1920:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2310:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2092:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1885:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2412:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2604:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2035:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1938:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2430:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2193:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1933:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2416:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2443:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1535:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2556:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2495:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2029:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1677:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2083:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2051:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2111:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2471:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2102:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2002:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2039:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2450:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1426:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1984:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1982:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2409:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2797:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1816:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1949:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2152:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2120:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2124:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1944:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2279:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2956:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2270:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1999:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2481:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2285:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2667:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2473:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.3141:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.3141:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2564:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2617:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2126:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1909:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1987:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2584:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2049:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2668:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1894:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2456:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1689:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2354:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2441:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2344:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.3267:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1421:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2785:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1723:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2645:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1599:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2399:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2041:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1101:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1523:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2265:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2152:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2652:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2302:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1746:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2199:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2699:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2169:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2447:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2602:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2391:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2858:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1994:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1736:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2093:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1923:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2443:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2252:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2065:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2291:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2067:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1966:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1741:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2022:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1937:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1525:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1946:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1983:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2413:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2213:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1870:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2116:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1844:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2199:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1827:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1993:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1772:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1721:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2015:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1964:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1406:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1663:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1919:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1809:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2494:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2482:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1978:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1795:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2707:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2047:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2284:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2742:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2693:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2509:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2034:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2034:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1701:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2072:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2215:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1826:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2218:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2284:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1770:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2149:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2199:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1957:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2034:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.3134:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2374:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1844:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2019:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2303:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2140:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2344:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2200:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2559:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1954:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2281:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1733:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1889:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1967:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2103:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1891:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1786:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1807:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1956:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1513:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2058:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2096:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2239:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2222:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2001:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2952:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2394:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2147:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1919:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1604:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2476:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1908:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2690:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2167:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2514:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2269:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1797:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1386:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2779:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1967:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.3239:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2399:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2518:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2750:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2312:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2353:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2107:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1907:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2155:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1906:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2285:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1897:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1929:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1672:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1975:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2049:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2332:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2190:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2420:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1701:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2003:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2519:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2579:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2437:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1949:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2100:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1448:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2069:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2069:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.1950:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2406:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2430:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2334:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2109:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2288:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2068:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2192:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.1626:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.1625:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2403:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2360:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2065:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2014:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1407:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1799:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2689:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2010:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2643:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2341:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1902:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1706:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1915:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2217:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1794:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2522:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2005:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1930:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2107:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1900:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2086:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1764:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2181:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1740:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2321:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2592:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2305:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2111:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2397:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2371:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1744:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2397:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2693:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1687:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1941:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2234:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1936:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2353:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1889:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2355:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2241:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1789:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1744:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2682:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2018:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1998:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2033:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1757:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1798:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2502:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2017:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2183:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2159:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2250:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2092:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1773:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2385:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1664:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1738:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2151:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2042:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1932:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1206:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2220:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1786:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2149:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2292:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2675:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1689:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1689:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2484:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2627:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1976:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1831:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1770:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2181:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2426:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1839:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2469:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1803:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2259:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2665:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1727:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2092:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1737:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2120:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2339:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1641:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2149:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1995:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1955:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1706:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2341:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2476:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2537:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2376:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2052:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2264:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2507:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1812:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2272:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1940:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2453:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1893:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2217:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1966:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1680:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2165:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1626:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1883:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2255:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2018:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2466:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1645:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2296:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1879:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1973:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2338:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2459:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2433:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2196:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.1650:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2286:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2404:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2961:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2492:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.1929:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2315:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2535:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.1640:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2266:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.1877:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2278:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2352:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2023:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2163:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2306:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2677:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2280:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2335:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2335:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2298:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2026:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2672:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2276:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2054:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2529:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2067:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.1747:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.1747:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2460:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2580:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1935:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2093:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2120:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2107:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2013:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2065:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2052:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2112:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2155:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2528:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1524:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2090:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2530:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2304:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1931:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2057:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2442:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2228:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1900:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1730:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1805:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2450:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2307:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2530:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1629:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2780:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1961:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1726:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1817:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2245:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2218:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2080:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1852:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2400:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2401:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1859:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2512:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2071:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2042:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1690:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2162:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2349:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2289:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1806:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2472:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1726:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1685:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1555:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2589:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1658:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2098:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1833:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2134:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2225:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1902:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1697:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2488:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2496:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2428:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1812:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2774:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2429:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1960:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2623:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2005:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1949:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2072:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2187:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2399:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1633:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1854:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2438:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1871:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2321:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2136:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1976:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.3319:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.3319:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1931:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1880:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2470:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1807:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2004:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2019:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2187:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2588:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2230:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2538:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2681:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1899:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1856:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2653:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1551:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1870:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2012:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2515:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2066:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2431:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1925:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2370:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1978:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2494:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2090:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2131:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1769:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1580:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1782:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2407:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1702:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1941:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2856:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1829:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2677:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1829:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1741:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2247:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2577:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2032:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2177:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2508:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1648:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2053:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1776:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1994:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2703:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2471:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1984:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2097:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1563:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2870:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2161:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1790:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2304:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1974:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1469:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2547:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1269:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1555:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2113:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1788:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2262:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1906:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2307:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2302:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1815:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2468:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2498:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2096:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2570:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2312:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2052:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1919:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2362:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2135:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1620:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2601:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2966:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2966:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2029:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1827:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2012:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1959:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2015:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2164:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2118:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2605:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1725:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2666:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1878:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2268:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1212:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1890:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2207:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2105:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2047:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1812:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2241:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1651:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.3109:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2192:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1997:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2532:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1916:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1655:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2331:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2552:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2229:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1856:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2544:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1778:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2377:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1900:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2746:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1833:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2292:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2308:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2711:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1878:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2438:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2168:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2241:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2204:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2798:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2532:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1696:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1764:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2194:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2064:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1664:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2308:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2146:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2455:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2068:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2360:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2195:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1696:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1981:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2548:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2309:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2629:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2309:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1862:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2049:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1853:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2033:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2941:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1823:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2194:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1883:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2084:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1658:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2699:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2252:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1869:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2009:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1645:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1272:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1272:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1989:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2680:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2260:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2223:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2186:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2213:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2004:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2304:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2249:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1592:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2920:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2055:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2352:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1836:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1737:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2079:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2452:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2396:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2169:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1870:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1830:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2400:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1989:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2226:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1574:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2368:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2687:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2079:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2083:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1801:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1655:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2428:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2788:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2161:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1808:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2375:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2833:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2471:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2292:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2164:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2796:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2524:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2231:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2193:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2338:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1804:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2272:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1850:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1775:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1671:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1499:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2282:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2109:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1964:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1773:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2355:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2305:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2015:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2738:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1976:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2012:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1917:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2142:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2251:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2054:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2164:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2500:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1926:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2272:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1745:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2115:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2389:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2414:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1889:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2299:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2406:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2433:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2656:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.0614:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.0614:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2118:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1665:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2127:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2153:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2062:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1514:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2141:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2118:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2101:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1977:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2236:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1918:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2954:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1884:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1976:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1974:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2368:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2921:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1923:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2280:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2217:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2386:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1981:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1933:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1829:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2195:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1959:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2163:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2329:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2491:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2527:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2687:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2937:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2356:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1848:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2666:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2303:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2462:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2040:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2285:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2826:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1886:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1875:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2114:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1939:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2024:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2088:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2476:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2174:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2216:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1929:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1983:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2556:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2105:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2344:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1891:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1715:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2458:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2509:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2076:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1657:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1720:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2758:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2093:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1876:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1746:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2404:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2763:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2163:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1788:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1878:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2223:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2697:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2052:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1722:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2058:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2234:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2206:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2298:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2298: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1470: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1673: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2192: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2042: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1762: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1737: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1804: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2069: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2104: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2512: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1819: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1834: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2224: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2131: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2719: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2263: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2149: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2009: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1881: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2065: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2010: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1911: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2634: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1855: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2200: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1816: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2214: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1953: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2509: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2186: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2645: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1984: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2374: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2026: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2344: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1702: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2166: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1759: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1882: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2814: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1647: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2825: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2312: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1942: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1709: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1805: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2541: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1775: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1950: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2275: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2331: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2671: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1828: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2488: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1713: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2175: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2109: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2118: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1979: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2892: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2406: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2952: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2294: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2090: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2502: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1846: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2085: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1696: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2260: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1919: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2221: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2586: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2284: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1986: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2601: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1878: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1960: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2322: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1356: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1356: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2095: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1638: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1742: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2044: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2190: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1747: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2404: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2188: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1969: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2756: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1187: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2413: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.3020: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2223: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1972: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2564: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2431: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2471: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2112: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2138: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2586: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1965: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1982: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2131: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1841: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2181: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2011: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2139: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1904: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2142: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1660: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2539: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2794: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2712: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2614: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2730: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2670: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1714: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1650: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2008: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1745: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1771: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1632: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2168: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2475: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2330: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2448: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2362: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2467: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1844: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1889: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.3061: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2083: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1881: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2860: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2216: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2440: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2159: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.3059: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2198: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2706: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2353: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1797: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1747: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2461: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1926: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2079: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2413: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2002: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2155: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2517: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2013: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1939: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1983: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1971: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2074: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2348: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2414: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2317: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2317: 100%|██████████| 401/401 [04:01<00:00,  1.06s/it]training loss: 0.2317: 100%|██████████| 401/401 [04:01<00:00,  1.66it/s]
diff --git a/slurm/logs/pidm_toy_9912070.out b/slurm/logs/pidm_toy_9912070.out
new file mode 100644
index 0000000..47e61cf
--- /dev/null
+++ b/slurm/logs/pidm_toy_9912070.out
@@ -0,0 +1 @@
+checkpoint saved to ./trained_models/toy/toy_9912070/model
diff --git a/slurm/logs/pidm_toy_9912868.err b/slurm/logs/pidm_toy_9912868.err
new file mode 100644
index 0000000..a1eb07b
--- /dev/null
+++ b/slurm/logs/pidm_toy_9912868.err
@@ -0,0 +1 @@
+  0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.2058:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1982:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0949:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1346:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0314:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9701:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0410:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0620:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0337:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1986:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1010:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0316:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0776:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0617:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0909:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9676:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9663:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9796:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9878:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9521:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0103:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9968:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9858:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0548:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9408:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9245:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9670:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8810:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9462:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9350:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9005:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9148:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8771:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8890:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8924:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8764:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8986:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9557:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9422:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8499:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8616:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8220:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8637:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8173:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8403:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8041:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8023:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7869:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8560:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7341:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7978:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7849:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8068:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8580:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7902:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7880:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7553:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6713:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7542:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7313:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6840:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7217:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6834:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6893:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6888:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6602:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6741:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6553:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6278:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6584:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6945:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6876:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6415:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6640:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.5898:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.5838:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6260:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6535:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6066:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6066:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.6010:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5982:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5991:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5915:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5446:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5361:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5602:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5140:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5296:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5399:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5337:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4943:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4923:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5144:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4841:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4302:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5372:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4286:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5130:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4739:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4746:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4532:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3928:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4751:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4745:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4230:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4592:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4365:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3625:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4101:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4328:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3846:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4140:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4070:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4289:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4107:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3955:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3531:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3984:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3722:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3582:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3530:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4647:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3561:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3761:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3386:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3735:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3549:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3964:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4156:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3807:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3535:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3786:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3511:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3604:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3520:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3678:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3509:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3451:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.2772:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3459:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3318:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3958:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3337:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3833:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3339:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3127:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3131:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3228:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3573:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3143:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3365:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3485:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.2986:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3544:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.2889:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3381:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3546:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.4217:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.4217:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3157:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.4043:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3795:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2985:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3418:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3049:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3064:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3535:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3088:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3517:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3253:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3763:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2849:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3725:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3152:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3095:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3142:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3551:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3480:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3176:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3070:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3140:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3200:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3293:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3468:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2611:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.4087:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3448:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3127:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3386:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.4052:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3582:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2791:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2552:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3147:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3946:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3129:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3317:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3146:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3199:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2642:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3700:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3184:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2861:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3015:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3223:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2895:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3054:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3631:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3950:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3036:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3497:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3155:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3220:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3388:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2732:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3010:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3155:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2877:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2951:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3159:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3063:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2699:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3168:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3275:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2897:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2519:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2603:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2848:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3115:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3421:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3025:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3766:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2997:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3415:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3430:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3195:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3886:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3801:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3801:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2995:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3489:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3158:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3159:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3234:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3658:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2946:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3349:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2657:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3535:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2733:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3374:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2958:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3491:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3419:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2759:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3857:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3116:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3062:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3471:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3386:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2709:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3068:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3184:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2987:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3690:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3516:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2809:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2722:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2899:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3764:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3132:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2876:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2990:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3029:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2357:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3656:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3373:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2538:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3361:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2955:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3210:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3323:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3531:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2840:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3392:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2641:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2882:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2843:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2827:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3006:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3145:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3319:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3123:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2810:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3326:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3127:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3500:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3077:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2821:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3084:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2767:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2823:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3048:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2702:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3431:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3086:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2778:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2701:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3132:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2789:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3380:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2566:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2486:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2890:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3077:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3637:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2922:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2376:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2376:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2649:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2719:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3005:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2318:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3042:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3250:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2298:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3716:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3385:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3552:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3523:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3275:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2215:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3098:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3308:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2820:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3419:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2928:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2965:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3018:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3366:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3257:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2595:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3395:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3209:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2711:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3567:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2931:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2201:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2970:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3503:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2502:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3184:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2839:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2688:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2969:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2561:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3028:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2514:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2913:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3270:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3043:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3208:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2757:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3047:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3011:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3101:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2989:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3735:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3051:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2509:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2825:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3097:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2968:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2987:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3214:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3104:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3386:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3441:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3267:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3069:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3473:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2645:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2843:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2738:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2733:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3393:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.2669:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.2695:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.3285:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.2904:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.3085:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.3331:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.2772:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.3514:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.2792:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.2576:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.3067:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.3508:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.3508:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2744:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2847:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3297:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2528:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2197:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3150:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2847:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3645:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3277:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2572:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2832:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3406:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3120:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2631:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2652:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3439:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2829:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3267:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3924:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3266:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3118:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2727:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3026:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2636:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3240:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3140:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2548:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3355:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3169:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2885:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3363:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2812:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3346:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2649:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2932:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3384:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2861:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2487:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2733:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2719:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3044:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3205:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2783:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2632:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2541:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3381:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2978:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2987:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3200:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2895:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2777:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2495:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2913:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2674:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3103:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3129:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2974:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2985:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2648:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2352:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2854:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2902:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2843:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3207:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3110:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2349:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2738:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3415:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2502:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3473:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2840:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3024:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3228:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2657:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2830:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2592:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2738:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2732:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2512:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2512:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3243:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2847:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.1928:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3185:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3071:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3098:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3133:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3011:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3408:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2789:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3515:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2803:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2425:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3017:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3454:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3000:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2914:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2814:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2304:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2815:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2912:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3012:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2426:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2742:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2958:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3277:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3158:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3147:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2314:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2741:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2538:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2447:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2571:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2748:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3112:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2707:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2313:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2886:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2563:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3373:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3290:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2947:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2904:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2947:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3264:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2591:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2922:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2955:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2572:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3181:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2551:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2381:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2866:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3331:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2345:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2359:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2656:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3358:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3640:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3503:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2683:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2664:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3813:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3217:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3334:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3326:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2686:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3222:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3412:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2496:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3270:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2770:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2926:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2314:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2932:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2801:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2792:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2411:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.1884:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.1884:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3649:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2753:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3488:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3473:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2642:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2812:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2653:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2374:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3391:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2779:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3322:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2430:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2957:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3245:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2759:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3103:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3109:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3008:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2587:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2879:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2753:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3231:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3050:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3186:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3208:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3108:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3189:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2336:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2963:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3360:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3469:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2767:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2099:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2790:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2887:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2707:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2430:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2837:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3021:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3407:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3003:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2700:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2595:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2731:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2532:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3108:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2845:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3891:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3443:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3002:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3045:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2800:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3120:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2416:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2318:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2756:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2989:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2663:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2960:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2658:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2466:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2747:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3388:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2816:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3090:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3070:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2526:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3110:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2785:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3127:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2973:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2905:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2456:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3156:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2663:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3121:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2266:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2451:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3717:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3717:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3181:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3535:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3034:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2612:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2665:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3022:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2543:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2802:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2792:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3246:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3221:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3406:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2436:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2860:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3169:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3148:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3154:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2957:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2532:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2968:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2509:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2606:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3768:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2704:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2719:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2738:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2696:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3056:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3274:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2769:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2920:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3346:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3320:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2638:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3234:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3124:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2918:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2802:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3015:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2574:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2595:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3056:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2836:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2814:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2757:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3020:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2924:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2545:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3083:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3441:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3598:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2640:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2811:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2925:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2263:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2637:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2686:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2604:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2649:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2789:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2617:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2745:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2504:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2696:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2546:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3293:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3120:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2694:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3025:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2976:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2737:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2401:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3404:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2859:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3245:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2527:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2123:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3204:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2806:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2806:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3052:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3127:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2745:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2735:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2894:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2690:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3309:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2482:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3440:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2515:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2537:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2700:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3275:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2996:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3538:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2900:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2742:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2811:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3461:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3088:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2443:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2998:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2826:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2703:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2817:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3120:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2801:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2604:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2687:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2270:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3155:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2598:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2696:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2866:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2226:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3341:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2571:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2741:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2613:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2633:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3534:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2597:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2254:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2946:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3054:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2534:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3408:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2139:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2741:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3136:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2686:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2222:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3262:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2745:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3073:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2850:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2266:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3056:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3084:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2219:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2933:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2547:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2874:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3157:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2749:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2769:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2736:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3039:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3116:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2650:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2358:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2857:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3599:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2794:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2983:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3397:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3592:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3324:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3211:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3211:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2746:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.3140:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.3207:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.3644:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.3405:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2641:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2797:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.3191:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.3017:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2964:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2747:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2355:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2767:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2593:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2796:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2911:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2933:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.3584:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.3190:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2693:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2752:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2521:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2526:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2716:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2527:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3124:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2659:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2534:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2865:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2942:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3014:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2265:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2718:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2771:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2279:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3013:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2358:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3106:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2851:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3192:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2932:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3210:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3060:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2607:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2951:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2714:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3224:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2644:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2775:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2936:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2889:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3297:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3004:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2185:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2975:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3315:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3027:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2784:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2966:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2785:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2717:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3122:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2498:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3252:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2632:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3111:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3294:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3239:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2845:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3124:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2589:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2455:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3663:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2488:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3584:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2916:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2786:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2994:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2096:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2096:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2966:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3248:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2472:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2998:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3073:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2572:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2768:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3049:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2752:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2931:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2955:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2165:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2269:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2881:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2795:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2631:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2611:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2537:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2733:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2776:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3254:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2304:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3145:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2903:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3438:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3216:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3089:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2800:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2406:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2817:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3029:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2986:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3247:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3146:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2893:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3124:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2882:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3208:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2828:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2741:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3259:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2858:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3040:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2443:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3138:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3217:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2859:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3115:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2965:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3052:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2896:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2518:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3659:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3188:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2476:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2517:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2480:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2546:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2854:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2565:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3130:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2262:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2946:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3139:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2910:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2310:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2810:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2808:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.3258:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.3143:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2428:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.3078:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2871:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2775:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.3605:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2873:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2624:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.3083:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2301:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2301:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3111:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3560:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2729:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2831:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2325:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2816:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2791:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3006:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3629:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3359:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2914:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3561:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2685:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2819:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3340:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3254:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2688:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2648:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3069:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3341:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3421:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2593:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2651:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2717:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2559:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3287:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2832:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2564:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3173:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2351:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2502:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3084:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3297:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3398:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3158:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3347:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2764:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3343:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3146:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2826:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2827:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3118:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2740:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3180:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3250:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2934:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3462:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3181:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3095:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2870:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2887:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3016:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2787:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2656:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3095:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2745:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3012:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3201:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2967:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2723:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3425:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3043:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2801:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2482:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3624:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2286:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2824:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2688:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2681:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3239:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2932:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2617:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3140:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2969:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2435:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2783:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3226:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3115:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3566:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3566:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2719:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2975:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2323:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2430:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2849:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3149:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2452:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2907:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3131:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3207:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2897:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2937:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3671:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2998:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3264:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3262:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2925:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3007:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3025:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3310:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3125:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2400:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2716:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2912:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3197:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2529:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3246:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3242:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.1802:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2954:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3532:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2714:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2402:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2346:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3038:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3047:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3036:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3342:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2891:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3400:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2889:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2278:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2797:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2825:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2727:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3205:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2603:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2912:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3693:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2841:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3110:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2811:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3382:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2888:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3402:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2806:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3214:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2974:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3008:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2539:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2662:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3087:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3240:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3209:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2667:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3129:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2385:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2826:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2463:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2535:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3006:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2744:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3044:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2737:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2587:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3063:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2242:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3468:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3641:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3641:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3053:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3036:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2474:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3156:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2703:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3571:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2886:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2451:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3163:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2737:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2965:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2475:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3138:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3653:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2784:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2765:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3189:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2474:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2833:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2499:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2273:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3453:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2876:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3082:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2992:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2771:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2931:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2676:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2686:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2730:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3029:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2800:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3052:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2826:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2515:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2425:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3119:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2157:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3236:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2861:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2694:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2955:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3088:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2708:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2982:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2702:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2648:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2652:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2524:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2881:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2801:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2808:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2635:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3376:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2678:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2666:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3104:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2447:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2865:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2993:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2895:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2830:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2611:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2587:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2784:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3035:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3164:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2525:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2268:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3490:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2813:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2929:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2720:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2717:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3227:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3580:   3%|▎         | 14/401 [00:11<03:51,  1.68it/s]training loss: 0.2602:   3%|▎         | 14/401 [00:11<03:51,  1.68it/s]training loss: 0.3117:   3%|▎         | 14/401 [00:11<03:51,  1.68it/s]training loss: 0.2874:   3%|▎         | 14/401 [00:11<03:51,  1.68it/s]training loss: 0.2874:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3003:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2869:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2852:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2617:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2863:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3401:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2816:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2713:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3130:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2718:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2644:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2479:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2560:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3454:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2866:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3090:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3191:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3438:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3382:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3062:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2402:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2770:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2796:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2590:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2595:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3186:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2746:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2795:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2908:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3313:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3142:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2836:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3404:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3557:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2356:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2628:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2609:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3311:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3329:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2786:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2696:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2806:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2692:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2625:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2688:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2896:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2592:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2098:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3168:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2785:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2703:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2218:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2721:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3349:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3228:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3154:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2932:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3007:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2719:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2999:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3659:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3095:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3117:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2651:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3116:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3226:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2937:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3127:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2290:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2897:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2605:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2929:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3317:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2951:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3307:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2929:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3105:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2642:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2411:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2411:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3178:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3112:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3563:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2980:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3291:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2831:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2809:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3028:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2981:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2012:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2851:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3382:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2953:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2563:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2427:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2226:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2810:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2231:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2349:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2675:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2659:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2661:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3215:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2691:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2507:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2621:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3014:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2968:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2317:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2827:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3079:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2698:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2907:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3711:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2581:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2717:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3436:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2834:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3290:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3151:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3396:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3251:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2694:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2888:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2240:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2830:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2383:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3177:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2792:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3154:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3035:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2430:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3347:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2525:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3329:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2821:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2561:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2617:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3437:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2619:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3046:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2647:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2240:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2824:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2655:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2527:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2918:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2392:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2983:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2866:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2991:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2698:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2419:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2932:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2676:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3258:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2909:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2785:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.1982:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.1982:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2875:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2337:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2899:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3328:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2828:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3194:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2771:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3381:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3117:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2838:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2889:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2659:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2814:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2183:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3518:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2616:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2719:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3393:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2885:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3715:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3436:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2958:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2863:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2667:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2690:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3082:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3430:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2672:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3138:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2650:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2472:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2813:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2604:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3338:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3072:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2897:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2756:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3330:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2673:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2842:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2661:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3293:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2629:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3136:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2857:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3729:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3187:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2507:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2512:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3462:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2880:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3464:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2717:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3666:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2896:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3073:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2923:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3186:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2962:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2086:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2530:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2976:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3222:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3191:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2566:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3333:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3263:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2991:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2899:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2523:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3098:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3002:   4%|▍         | 17/401 [00:12<02:40,  2.39it/s]training loss: 0.3437:   4%|▍         | 17/401 [00:12<02:40,  2.39it/s]training loss: 0.3175:   4%|▍         | 17/401 [00:12<02:40,  2.39it/s]training loss: 0.2780:   4%|▍         | 17/401 [00:12<02:40,  2.39it/s]training loss: 0.2841:   4%|▍         | 17/401 [00:12<02:40,  2.39it/s]training loss: 0.3053:   4%|▍         | 17/401 [00:12<02:40,  2.39it/s]training loss: 0.3090:   4%|▍         | 17/401 [00:12<02:40,  2.39it/s]training loss: 0.2142:   4%|▍         | 17/401 [00:12<02:40,  2.39it/s]training loss: 0.2142:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2669:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2985:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3196:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2660:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3318:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2715:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2963:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2815:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2874:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3726:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2514:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3277:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3428:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3324:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2957:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2416:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2678:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2539:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3477:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2613:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2876:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2628:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2718:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2595:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2655:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2277:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2532:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2861:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2432:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2329:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2770:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2958:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2320:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2805:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2713:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2470:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2269:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3117:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2948:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3322:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2805:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2958:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3128:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2771:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2856:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3277:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2443:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3651:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2194:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3171:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2649:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2659:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2942:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3178:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2557:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2959:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2801:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3385:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2703:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3055:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2629:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3099:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3249:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2640:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3104:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2789:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3464:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2981:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2514:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2617:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2505:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3487:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2286:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2667:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3138:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2557:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2266:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3360:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2690:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2690:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2765:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3055:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2814:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2743:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2976:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2692:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3277:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2532:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2946:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2816:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2906:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2441:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2682:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3121:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2961:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2783:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3030:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2968:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3308:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3175:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2990:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3454:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3013:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3417:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3258:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2669:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2732:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2552:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3206:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2737:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2652:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2984:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3117:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2724:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3015:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3064:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2762:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3252:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2995:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3274:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3005:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3063:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2826:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3106:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2542:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3041:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3138:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3295:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3458:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3182:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2671:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2381:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3222:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2776:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3084:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3083:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2519:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2786:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2731:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2924:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2979:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2901:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2231:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2396:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3444:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2713:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3225:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2459:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3300:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2668:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2239:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3465:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2793:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2709:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3016:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2937:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3206:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3470:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3565:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3565:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3172:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2948:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3503:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2703:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2791:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3121:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2841:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3281:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2845:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2887:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3124:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2921:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3828:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3011:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2536:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3156:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2731:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2703:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2215:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2776:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2785:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2730:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2958:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3018:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2361:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2551:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3240:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2745:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3096:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3118:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2299:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3016:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2955:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2313:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2720:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2716:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2737:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3264:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2772:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3234:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2750:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2990:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2471:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2942:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2834:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3066:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3090:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2555:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.1987:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3801:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2893:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3159:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2950:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2761:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2280:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2548:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2285:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2844:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2743:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2784:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2673:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3221:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2985:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2623:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2850:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2857:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3067:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2701:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2512:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2226:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2576:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2671:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2821:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2947:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2538:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2695:   5%|▍         | 20/401 [00:13<02:18,  2.75it/s]training loss: 0.2893:   5%|▍         | 20/401 [00:13<02:18,  2.75it/s]training loss: 0.2599:   5%|▍         | 20/401 [00:13<02:18,  2.75it/s]training loss: 0.3918:   5%|▍         | 20/401 [00:13<02:18,  2.75it/s]training loss: 0.3918:   5%|▌         | 21/401 [00:15<07:53,  1.25s/it]training loss: 0.2676:   5%|▌         | 21/401 [00:15<07:53,  1.25s/it]training loss: 0.2783:   5%|▌         | 21/401 [00:15<07:53,  1.25s/it]training loss: 0.3005:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2902:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3027:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2615:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2946:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2841:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3436:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2676:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3435:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2730:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3166:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2765:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2609:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2805:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3132:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3519:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2569:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2767:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2960:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2864:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2551:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2566:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2473:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2972:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2384:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2950:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2803:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2654:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3317:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2958:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3157:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3719:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2975:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2309:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2671:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2630:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2945:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2774:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2642:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2638:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3506:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2916:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2735:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2798:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2946:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2615:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2844:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2823:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2868:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2511:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2565:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2027:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3261:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3231:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2846:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2868:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2830:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3445:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3174:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2730:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2991:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3395:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2946:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2818:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2842:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2667:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2579:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2960:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2758:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2540:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2720:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2790:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3142:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3148:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2651:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3165:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2935:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2935:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2395:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2586:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3091:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3364:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2426:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3118:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2693:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3060:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3340:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2790:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2921:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2605:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2888:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2652:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2370:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2824:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2705:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3071:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2695:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2493:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2572:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3181:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2421:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2497:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2955:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3087:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3280:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2870:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2280:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3179:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3015:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2986:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3448:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2686:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2584:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2927:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3398:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3274:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2374:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2759:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2952:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2242:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2955:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2671:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2996:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2781:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2806:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3387:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2821:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3092:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3223:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3448:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2730:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3176:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2878:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2640:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2965:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2279:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3199:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3028:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3054:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3148:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2239:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3106:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3372:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3062:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3768:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.2750:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3015:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3215:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3108:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.2695:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3350:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.2469:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.2564:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.2780:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3056:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3580:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.2201:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.2201:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2922:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3877:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2635:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2789:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3259:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2636:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2963:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2425:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2767:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3058:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2857:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2913:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2883:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3079:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2899:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2712:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2626:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2804:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3059:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2337:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2743:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2674:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3064:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3458:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2557:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2467:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3326:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2607:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2916:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2828:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3573:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2886:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2664:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3025:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2485:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3232:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2655:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2532:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3223:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2204:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3116:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2541:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2507:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2687:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2410:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2694:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2761:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2853:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2081:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2594:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3169:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3082:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3081:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3323:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2393:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3085:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2621:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3108:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2925:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2538:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3414:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2075:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2432:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3011:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3173:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3167:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2538:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3106:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3076:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2652:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2549:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2732:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3077:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2836:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2978:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2854:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2510:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2738:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2750:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2750:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2943:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3356:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3269:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3397:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3000:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2869:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3206:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3065:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2755:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2622:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3050:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3177:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2509:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2964:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2331:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2692:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2794:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2577:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2837:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3031:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3174:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2213:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2564:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2952:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2778:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2716:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2332:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2826:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2954:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2683:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2596:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2579:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3224:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3022:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3402:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2796:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2992:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3020:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3322:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2441:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3297:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2439:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2753:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2645:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2859:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3505:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2731:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2682:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2900:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2546:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2628:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2693:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3008:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3365:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3561:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2811:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2960:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2935:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2943:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2763:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2781:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2780:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2615:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2735:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3077:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2600:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2752:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2817:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3281:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2841:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3101:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3263:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2999:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2960:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2921:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3103:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3096:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2431:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2733:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2733:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2896:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2520:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2581:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2728:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2908:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2851:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.3097:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.3049:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2451:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.3061:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.3008:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2513:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2842:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2266:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2862:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2818:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2718:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2814:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2825:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3118:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3075:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3210:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2906:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2694:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3033:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2510:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2927:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3020:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2608:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2437:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3251:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2827:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3243:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2268:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2805:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2953:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2609:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2450:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3072:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2459:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3070:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3116:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2558:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2777:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3117:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3283:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3171:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2667:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3604:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2652:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2491:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3201:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3053:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2344:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3400:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3309:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.1988:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2641:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2397:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3070:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2606:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2657:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3547:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2908:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2702:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2776:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3817:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2617:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2787:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2510:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3112:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2563:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3116:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3113:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2308:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3176:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3001:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3094:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2586:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2586:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2963:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2524:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3389:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3452:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2999:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3250:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2824:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3393:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2627:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2408:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2739:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2613:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3192:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2537:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3125:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2320:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3251:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2248:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3049:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3290:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2476:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2991:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2510:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2971:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2930:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3423:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3571:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2810:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3210:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2985:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2920:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3095:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2487:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2843:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2349:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2696:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2647:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3152:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2973:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2816:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3142:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2908:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2989:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2943:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3278:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2786:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2780:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2173:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2942:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3146:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2689:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3309:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2935:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2375:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3136:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3111:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3210:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2796:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2124:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2796:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2299:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3026:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2749:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3042:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2963:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2603:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2891:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2418:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3123:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2667:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2810:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3494:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3208:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2838:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3144:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2907:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2196:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2878:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3133:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3133:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2986:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3489:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2698:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3307:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2439:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2889:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3027:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2446:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2830:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2792:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3163:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3148:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3153:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3267:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3092:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3139:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2862:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2642:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2665:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2383:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2971:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2830:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3332:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2778:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2570:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2846:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2722:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2516:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2562:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2428:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2808:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2524:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3099:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3068:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2902:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2316:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3176:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3757:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2933:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3243:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2573:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3601:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3164:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2981:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2910:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2487:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2397:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2848:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2341:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2990:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2892:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2596:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2448:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3309:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2704:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2944:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3197:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2818:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2707:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2781:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2926:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2590:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.3346:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2957:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2630:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.3020:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2630:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2944:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.3424:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2500:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2670:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2728:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2745:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2883:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2661:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2904:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.3747:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2671:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2601:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2601:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2792:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3070:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2713:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3054:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2851:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2648:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3487:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2603:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2591:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2712:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3616:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3223:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2756:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2417:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2410:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2883:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2725:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3050:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2679:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2505:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2840:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2446:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2655:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2696:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3341:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.4335:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2976:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2973:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2608:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3402:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2743:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2810:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2799:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3006:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2484:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2629:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2842:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3221:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2857:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3446:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2502:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2319:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2575:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3218:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3002:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2826:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3180:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3644:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2980:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2469:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2664:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2846:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2784:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2882:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3268:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2653:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2584:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2936:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2957:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3296:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3066:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2633:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3301:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2557:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2927:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3354:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2922:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2426:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2665:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3700:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3313:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2820:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2729:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2633:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2462:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3401:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2835:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2586:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2954:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2954:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2427:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2940:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2743:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2458:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2491:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2827:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3120:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3371:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2698:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2925:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2964:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3224:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3130:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2375:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2715:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2630:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3242:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2781:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2685:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2776:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3255:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3082:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3132:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2821:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2794:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3241:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2518:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2832:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2569:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2588:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3061:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2835:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2861:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3156:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3582:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3026:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3345:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3064:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2574:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3541:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3592:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2660:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2842:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2301:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2600:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3118:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3126:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3152:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2815:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2804:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2846:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3026:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2827:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2576:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3391:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3512:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2638:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2659:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3041:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2657:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3301:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3220:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2912:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3099:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3218:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3199:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3001:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2851:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2994:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2900:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2693:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3656:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3374:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2743:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2758:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2830:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2424:   7%|▋         | 29/401 [00:20<03:05,  2.00it/s]training loss: 0.2272:   7%|▋         | 29/401 [00:20<03:05,  2.00it/s]training loss: 0.2278:   7%|▋         | 29/401 [00:20<03:05,  2.00it/s]training loss: 0.2278:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2904:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2653:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2773:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2949:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3112:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2256:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3102:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3109:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2925:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3046:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2353:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2956:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2651:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3044:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3064:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2766:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2832:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2919:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2990:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2841:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2772:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3197:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3089:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2800:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3153:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2646:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2831:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2661:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2683:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3016:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3119:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2774:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3260:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2658:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2694:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2842:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2685:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3462:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2920:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2906:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3200:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3139:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2828:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3499:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3347:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2905:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3254:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2922:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3283:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3340:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2652:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2606:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3476:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2805:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2931:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2370:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2731:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3220:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3190:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2839:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2648:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2672:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3154:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3029:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2588:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3262:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2539:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3293:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2987:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2810:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2380:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3284:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2827:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2451:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2904:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2822:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3479:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3148:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.1882:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.1882:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2768:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2849:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2314:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3286:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2779:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2513:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3066:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2870:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2999:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2851:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3064:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3392:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2803:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2921:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2278:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2701:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2443:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2897:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2937:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2797:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3520:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2818:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2961:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2485:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3249:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2499:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2641:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2938:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2994:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2764:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2856:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2705:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2883:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2770:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3236:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2713:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2582:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2314:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2499:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.1840:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3131:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3058:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2776:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3143:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3090:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2458:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2495:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3021:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3235:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2598:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2784:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3264:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2930:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2981:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3243:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3052:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3380:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3024:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3048:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2722:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2657:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3268:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2423:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2942:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2467:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2309:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2774:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2430:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2881:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2997:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.3077:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2557:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2535:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2809:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2443:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2700:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2842:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.3220:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2497:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2497:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3286:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2539:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3391:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3171:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2180:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2492:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2374:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3031:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2697:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2974:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2685:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2862:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3300:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3325:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2458:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3279:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2823:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2786:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2801:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3068:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2414:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2896:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3259:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3170:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2752:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2896:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2949:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2818:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2371:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2511:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3517:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3345:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2643:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3095:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2540:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3010:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3033:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3207:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3051:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2647:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2970:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2608:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2761:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3268:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2882:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2822:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3059:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2484:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2625:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2767:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2720:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2675:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3127:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2698:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3452:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2335:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2899:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2623:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3607:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2833:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2847:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2711:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2548:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3439:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2599:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2764:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3574:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2872:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2829:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2839:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.4136:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2921:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2840:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2834:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2730:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2663:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2647:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2641:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3842:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3842:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2472:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2541:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2897:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2472:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2450:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2703:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2556:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2584:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2871:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2836:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2474:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3103:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2766:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2764:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2427:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3075:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2521:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2642:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2558:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2831:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2517:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2438:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2528:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2625:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2955:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2564:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2575:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2594:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2820:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2252:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3317:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2693:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3147:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3325:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2581:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2984:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3093:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2756:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2880:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2474:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2479:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3091:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2996:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2563:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3033:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3238:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3123:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3087:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2361:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2820:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2454:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2968:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2335:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2724:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2892:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2703:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2886:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2962:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2915:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2868:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2399:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3107:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2940:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2632:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2430:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2709:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2615:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2867:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2926:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2876:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2852:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3058:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2479:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2378:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2603:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2607:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2801:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3143:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.4035:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.4035:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2945:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3132:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3196:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2919:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2852:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2667:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2686:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2312:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3000:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2997:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3036:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2703:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2708:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2138:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2236:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3139:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2802:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3209:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2614:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2851:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3564:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2812:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3093:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2898:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2808:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2387:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3076:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2719:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2805:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2201:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2094:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2598:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3497:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3344:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2954:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3160:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3419:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3380:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2510:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3062:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3204:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3175:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2590:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2576:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3180:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3162:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3288:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2591:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2869:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2885:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2944:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2879:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3430:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2456:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3301:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3252:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2754:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2552:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2752:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2903:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2567:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2715:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3414:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2793:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3399:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2824:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2467:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2743:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2865:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2930:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2142:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3332:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2950:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2981:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2636:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3262:   8%|▊         | 34/401 [00:24<03:37,  1.69it/s]training loss: 0.2967:   8%|▊         | 34/401 [00:24<03:37,  1.69it/s]training loss: 0.2376:   8%|▊         | 34/401 [00:24<03:37,  1.69it/s]training loss: 0.1993:   8%|▊         | 34/401 [00:24<03:37,  1.69it/s]training loss: 0.1993:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2974:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2846:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3040:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2686:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3177:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3034:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2652:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2817:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3326:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3026:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2886:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2726:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2998:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3012:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2645:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2712:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2801:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3033:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2531:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2350:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2563:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2653:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3267:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2890:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2832:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3375:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2507:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2893:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3234:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3477:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2876:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2886:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2648:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2818:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2475:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3473:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3028:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2645:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2649:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3147:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2757:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3025:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3028:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3107:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2885:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2471:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3027:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2764:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3200:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2890:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3730:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2701:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2854:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2794:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2778:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2849:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3101:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2719:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3075:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3106:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2550:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2804:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2487:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2868:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3020:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2308:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3053:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3252:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3468:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2786:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2784:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3442:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2747:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2806:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3097:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2158:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2804:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2759:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.4362:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.4362:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2766:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2956:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2878:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3339:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2924:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2646:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2280:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2466:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3059:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3100:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3071:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2777:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2580:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3097:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2225:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2669:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3030:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2727:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2979:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2645:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2981:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2919:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2458:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2729:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2932:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2940:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3338:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3830:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2863:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3081:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2990:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2929:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2968:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2621:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2802:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2869:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3038:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2915:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2099:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3167:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2852:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3088:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2834:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2817:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3192:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2798:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2328:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3200:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3021:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3695:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2882:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3552:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3162:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2887:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3160:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3673:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2828:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2762:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3427:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3310:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2888:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3280:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2536:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2659:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3272:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2659:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3043:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3173:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3642:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3041:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2739:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3082:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2785:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3214:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3537:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.4212:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3425:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2683:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3445:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3445:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2556:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3023:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2777:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2473:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2804:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3372:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2260:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3019:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2377:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2543:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2610:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2469:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2599:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2553:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2281:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2529:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2930:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3173:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2647:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2468:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3438:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3118:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2578:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3344:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3201:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2996:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2718:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2626:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2637:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2855:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3131:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3099:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3108:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3076:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2442:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3090:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2731:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3101:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2529:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2573:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2644:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2473:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3054:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2699:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2451:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.4009:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2666:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2760:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2954:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3175:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2685:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3018:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.3367:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.3145:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2850:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2949:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.3114:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.3751:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2870:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.3063:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2566:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2764:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2896:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.3082:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.3459:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2293:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2381:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2500:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2715:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2682:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2692:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.3140:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2626:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2533:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2998:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2825:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2886:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2595:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.1799:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.1799:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2949:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2685:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3150:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3342:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2770:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2763:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2737:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2959:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2869:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2629:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2317:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3397:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2633:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2699:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2793:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3193:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2889:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2730:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2748:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2605:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2791:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2802:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2936:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3450:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2725:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2688:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2696:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2634:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2904:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3038:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2858:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2957:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3061:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2251:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2767:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2559:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2565:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2570:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3240:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2554:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2375:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2829:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3224:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2532:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2967:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2393:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2918:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2796:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2412:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3102:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2517:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2713:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3015:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2676:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2512:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2706:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2787:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2836:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2797:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2534:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2684:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3562:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2624:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2870:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2897:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2748:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2750:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2526:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2650:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2920:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2565:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2703:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3307:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2520:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2623:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2836:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3316:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2843:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.1699:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.1699:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2916:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2565:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3367:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2223:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2757:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2947:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3008:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2780:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3260:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2502:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2792:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2219:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2901:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3258:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2750:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3435:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2784:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2798:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2835:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2579:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2723:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2684:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2326:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2896:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3138:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3047:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2452:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2767:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3049:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2910:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2515:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2628:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2401:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2368:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3058:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3128:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2860:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3693:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3322:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2276:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2279:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3052:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2823:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2570:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2596:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2579:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2759:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2553:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3209:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3507:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3277:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3038:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2592:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3104:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2479:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2491:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3647:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2744:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2866:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3727:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2396:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2980:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2768:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2754:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3544:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2229:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3586:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3055:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2830:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2753:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2672:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2670:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2805:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2649:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2444:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3332:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2919:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2821:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2464:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2464:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2600:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2989:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3032:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2522:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2600:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2432:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3025:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2751:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3532:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2745:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2953:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2856:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3000:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2821:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3086:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3231:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2981:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2628:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2230:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2486:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3139:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2901:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2824:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3158:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3881:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2925:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3014:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2781:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2733:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2478:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3037:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3135:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3332:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2915:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2993:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2633:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2833:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3067:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2844:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3213:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2534:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3158:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3344:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2720:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3212:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2340:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2620:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2653:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2833:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2659:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2714:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.1965:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2951:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2234:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3251:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2477:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2568:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3673:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3060:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3282:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3453:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2798:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2634:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2564:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.3222:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2321:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2900:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2801:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2889:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2515:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2901:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2388:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2996:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.3109:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.3162:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2288:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2750:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.3066:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.3605:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.3605:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2453:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2832:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.3392:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2913:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2659:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.3401:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2585:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2407:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2914:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2689:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2703:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2837:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3241:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2949:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3019:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3357:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3013:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2610:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2700:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2964:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2936:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2942:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2550:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2753:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2682:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2722:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3018:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2805:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2554:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3145:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2338:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2563:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2912:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3040:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2919:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3047:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2516:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3129:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2608:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3680:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3039:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2647:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3093:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2327:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2599:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2430:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2475:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2799:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2821:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2853:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3225:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3489:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2927:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2911:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2958:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2873:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2820:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3183:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3261:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3142:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2509:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2773:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2448:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3060:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3118:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3166:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3037:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2469:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2789:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2645:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2296:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2247:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2901:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2557:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2998:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2984:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2490:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2733:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.1883:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.1883:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3285:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2519:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2883:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3028:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2582:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3596:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2952:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2621:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2693:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3628:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3250:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3058:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2473:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2994:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2447:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3007:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2925:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3043:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2172:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2297:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2866:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2669:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2758:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3523:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2642:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2084:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2670:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2842:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2743:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2538:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3386:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2862:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3538:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2495:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2790:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2987:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2420:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2574:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2916:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3071:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2720:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3268:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2467:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2995:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2980:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2934:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2626:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2770:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2966:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3451:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3011:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3197:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2134:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2454:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2839:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2801:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3101:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3431:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2563:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2898:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2519:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3103:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2534:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2706:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3326:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2697:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2307:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2592:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2888:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3001:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2195:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2364:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2577:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3063:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3084:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3193:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2638:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2887:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2973:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2973:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2401:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.3019:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2621:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.3281:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2789:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2544:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.3216:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.3529:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2730:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2880:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2426:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2665:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.3266:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2366:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.3193:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2257:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2788:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2728:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3409:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2630:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3257:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2974:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2792:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2803:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3510:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2729:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2900:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2394:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2750:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2779:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2972:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2814:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2887:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3260:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3514:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2824:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2799:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3355:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2507:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2896:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3068:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2360:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2987:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3352:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2887:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2592:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2588:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3011:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2822:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2973:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2936:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3041:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2552:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3002:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2856:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2734:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2576:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2365:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3174:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2392:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2659:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3716:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3111:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2755:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2487:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2614:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2717:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2752:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2845:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2288:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2753:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2469:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3389:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2482:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3194:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2627:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2465:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2449:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2739:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2739:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2170:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2919:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2999:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2449:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2653:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2758:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2837:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3070:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2950:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2613:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2414:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3021:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3162:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3057:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2932:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2771:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3142:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3053:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3014:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2561:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2884:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2598:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2989:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2980:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2208:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2919:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2613:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2578:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3014:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2809:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2864:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2923:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2878:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2362:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2463:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2701:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2706:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2390:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2507:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2716:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3022:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2910:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2479:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2458:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2722:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2895:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3206:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2407:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2803:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2766:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2690:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2389:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2693:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2551:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3504:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3014:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2150:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2723:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2963:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3204:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2985:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2839:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2314:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3008:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3143:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2528:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2267:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3108:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2245:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3624:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2982:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2863:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3143:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2569:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2312:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2511:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2817:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2972:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2336:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2336:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2779:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3045:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3168:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2299:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2419:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2316:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2801:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3010:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2651:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3247:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3127:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2857:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2149:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2964:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2319:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2597:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2833:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2717:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2565:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3128:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3315:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2267:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2909:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2753:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2729:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2896:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3167:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2403:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2495:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2690:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2891:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2796:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3210:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2762:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2602:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2439:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2632:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3242:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2500:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2989:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2517:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2763:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2578:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2139:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3198:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3004:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2504:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2700:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3075:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2291:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3442:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2931:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3373:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2832:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2977:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2789:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2583:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2597:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2764:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2888:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3238:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2660:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2501:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2968:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3157:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2520:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2384:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3174:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2384:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2569:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2827:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2288:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2608:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2633:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2938:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2964:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2721:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3041:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2060:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2060:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2608:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2548:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3359:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2989:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2543:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2712:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2988:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2640:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3238:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2716:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2700:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3052:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3128:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2478:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2644:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2934:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3004:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3311:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2731:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2819:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3497:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3280:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2702:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3145:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2612:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2694:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2909:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2784:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2608:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2957:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2726:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3385:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2748:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2726:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2508:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3287:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2946:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3168:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3200:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3016:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2494:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2861:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2871:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2961:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2801:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2996:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2411:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2551:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2911:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3109:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3077:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3325:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2749:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2923:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2498:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2761:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2408:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2894:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3440:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2865:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2642:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2558:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2777:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2775:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2861:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2744:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3182:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2897:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2846:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2639:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2505:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3366:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2753:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2692:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2720:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2390:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2352:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3268:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3258:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3258:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2331:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3362:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2860:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2796:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2807:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3459:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3235:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3458:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2713:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2552:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3806:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2752:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3406:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2194:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2478:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2947:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3443:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2757:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2852:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3076:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2828:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2733:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2438:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3321:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2716:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2917:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2955:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2659:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2716:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2863:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3065:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2764:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2961:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3407:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2739:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2601:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2968:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2682:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2491:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3035:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2973:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3488:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2685:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2629:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3202:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3371:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3216:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2862:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2619:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2946:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3121:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2721:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3095:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2869:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2718:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3355:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2583:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2800:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.3567:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2580:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2653:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.3117:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2643:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2871:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2578:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.3434:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2578:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2893:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2722:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2822:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2841:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.3224:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2442:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2804:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2868:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2834:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2485:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2599:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2895:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2895:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3081:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2831:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2688:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2537:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2745:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2690:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2809:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2632:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2986:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3234:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3174:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2834:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2844:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3653:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2532:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2663:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3659:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2677:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2819:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3148:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2584:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3238:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3186:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2555:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3460:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2877:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2691:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2831:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3127:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3655:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2576:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2969:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3081:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2982:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3100:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2704:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3185:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2830:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2689:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3293:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3285:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2651:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2405:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2943:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2730:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3062:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2869:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2676:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2161:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.1887:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2485:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2970:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3043:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2644:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2641:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2530:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2383:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2534:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2857:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3057:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2377:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2649:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2679:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3322:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2467:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2524:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2990:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2573:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2628:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3019:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2278:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3134:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2653:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3056:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2873:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2259:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2505:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2442:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.4119:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.4119:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2593:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2872:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2606:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2487:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3358:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2802:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3158:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2674:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3308:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2886:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2596:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2574:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2612:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3157:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3002:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2295:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2488:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3108:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2953:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3050:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3831:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3020:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3227:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2710:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3128:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3579:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2900:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3051:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2767:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3020:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2845:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2787:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3158:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2907:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2871:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3150:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2562:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3137:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3371:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2783:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2501:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3424:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2292:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2969:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2803:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2762:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2628:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3504:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2618:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2872:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3371:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2770:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2657:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2810:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2109:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3215:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3408:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2807:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2986:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2565:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2969:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3375:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2882:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2682:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3109:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2633:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2704:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2739:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3088:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3730:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2846:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2339:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3435:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3388:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3410:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2979:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2984:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2732:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.1423:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.1423:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3726:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3115:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2839:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2593:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2408:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3243:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3014:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2659:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3118:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2537:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2873:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2717:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3057:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2860:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3127:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2248:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2939:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2315:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2647:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2391:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3167:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3282:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3188:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2548:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2356:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2605:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3487:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2666:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2806:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3067:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2277:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2845:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2958:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2278:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2909:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2650:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2568:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3153:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2617:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2737:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2763:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2962:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3005:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3385:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3147:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2717:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2705:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2698:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2139:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2661:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2699:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2617:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2310:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2840:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2819:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3094:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3518:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2508:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3191:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3329:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2489:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2817:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2512:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3122:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2993:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.2617:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.2647:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.2638:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.2870:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.2421:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.3505:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.2474:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.2927:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.3279:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.3019:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.3338:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.3336:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.2615:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.3070:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.3070:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3363:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2601:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2779:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3264:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2560:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2406:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3439:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3007:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2680:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2992:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2890:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3263:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2833:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2765:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2950:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2898:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2969:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3355:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3209:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2640:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3102:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3129:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2649:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2890:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3089:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2888:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2395:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3082:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2634:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3362:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2961:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.1990:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3318:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3132:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2803:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3395:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3104:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3137:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3622:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3156:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2745:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2306:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2732:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2412:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2571:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2527:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2730:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3069:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2943:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2783:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3354:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2566:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2422:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3281:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3167:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2498:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2536:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2844:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2726:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2532:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3661:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3703:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2796:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2975:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3076:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3123:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3227:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2622:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2893:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2961:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2829:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2484:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3051:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2918:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3128:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2730:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2774:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2603:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3138:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3138:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2707:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3260:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3277:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3671:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2939:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2509:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3140:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3508:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3003:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2126:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2296:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3218:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2483:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2740:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2819:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3217:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2764:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2821:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3134:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3134:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2941:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3159:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2677:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2832:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3339:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2846:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2546:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3184:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3039:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3077:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2893:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3170:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2384:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2519:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2965:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2467:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3702:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2745:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2336:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2372:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2018:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3158:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2393:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2721:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2817:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2433:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2762:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2486:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2567:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2667:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2887:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3005:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2568:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2916:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2674:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2975:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2634:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2520:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2676:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3446:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2772:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2678:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2896:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2708:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2718:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2648:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3047:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2936:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3201:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2861:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2461:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2683:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2504:  13%|█▎        | 52/401 [00:36<04:53,  1.19it/s]training loss: 0.2810:  13%|█▎        | 52/401 [00:36<04:53,  1.19it/s]training loss: 0.2447:  13%|█▎        | 52/401 [00:36<04:53,  1.19it/s]training loss: 0.3155:  13%|█▎        | 52/401 [00:36<04:53,  1.19it/s]training loss: 0.3365:  13%|█▎        | 52/401 [00:36<04:53,  1.19it/s]training loss: 0.3552:  13%|█▎        | 52/401 [00:36<04:53,  1.19it/s]training loss: 0.1915:  13%|█▎        | 52/401 [00:36<04:53,  1.19it/s]training loss: 0.1915:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3022:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2462:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2594:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2723:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3145:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2634:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2788:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2694:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3244:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2852:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2524:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2598:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2729:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2896:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2948:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2586:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2779:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2587:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2851:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2809:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2791:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3250:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2924:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3254:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2812:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3350:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2734:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3078:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3121:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2985:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2741:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2481:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2737:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2549:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2158:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3803:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2837:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2232:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2000:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2351:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2369:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2672:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2711:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2674:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3394:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2579:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2626:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2657:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2913:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2674:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2641:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3194:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2886:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2568:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2611:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3110:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2768:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2801:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3428:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2208:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3458:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2447:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2728:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2528:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2709:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2809:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2586:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3125:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3140:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2180:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2307:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2549:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3003:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2379:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3250:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3142:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2501:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2658:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.1464:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.1464:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3126:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2450:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2248:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2373:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3183:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2517:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2477:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3232:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3133:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2776:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2727:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2670:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2817:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3283:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2910:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2462:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3239:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3143:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2736:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2550:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2871:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2415:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2994:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2573:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3564:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2593:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2855:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2783:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2955:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3358:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2784:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2337:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3325:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3319:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2332:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.4037:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2698:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2272:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3589:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2705:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2209:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2042:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2775:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2183:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2596:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2970:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2519:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2785:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2869:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3270:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2796:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2843:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3137:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2933:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3747:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2581:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2454:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3359:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2648:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2516:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2959:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3667:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2544:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2543:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2671:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2731:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2854:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3071:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2578:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3331:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2497:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2804:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2666:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2734:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3137:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2272:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2281:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3038:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2647:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2647:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2569:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2648:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2560:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2622:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2459:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2445:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2038:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2451:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2337:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2500:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2704:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2654:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3188:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2665:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2270:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2891:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2661:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3178:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2761:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2791:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3091:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2502:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3306:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2182:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2854:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3212:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2973:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2463:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2870:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2554:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2506:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3594:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2670:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2835:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2897:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2967:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2892:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2812:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2746:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3138:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3052:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2901:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3360:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2703:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2148:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2858:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2907:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2694:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3394:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2954:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2693:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2773:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2591:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2848:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3320:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2852:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3486:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2926:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2718:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3231:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3089:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2366:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3673:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3044:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2615:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3416:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2615:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2742:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3208:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2737:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.2377:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.2513:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.2372:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.2914:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.3013:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.2720:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.2666:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.2768:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.1821:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.1821:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2708:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2857:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2559:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2702:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2875:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2651:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2672:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3109:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2511:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3273:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2957:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3384:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2936:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2436:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2390:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2802:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2925:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2869:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2821:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2672:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3506:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3397:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2734:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2487:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2821:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2960:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3181:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2521:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2661:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2834:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3631:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2279:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3081:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2400:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2823:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3148:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2418:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2735:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2536:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3488:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2891:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3262:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2647:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3227:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2932:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2850:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2852:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3123:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3078:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2998:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2572:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2905:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3024:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2806:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2573:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3708:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3219:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2854:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2689:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3055:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2633:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2674:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3077:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2982:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2868:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2269:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2792:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2590:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3502:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2556:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2727:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2293:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2816:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2657:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2544:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2787:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2927:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3173:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.4347:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.4347:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3630:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2858:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2254:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2496:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2890:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2921:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2390:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2815:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2299:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2162:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3347:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2946:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3076:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3226:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2704:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3258:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2809:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2818:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3380:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2992:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2246:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3220:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2854:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3132:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2401:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2769:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2343:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2768:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2810:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3114:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3247:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2938:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2683:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2698:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2729:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2933:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2788:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2872:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2705:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2766:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2766:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3033:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3361:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2956:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2296:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2876:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3323:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2389:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2984:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3022:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2737:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3299:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2785:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2713:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2776:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2863:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2802:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3168:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2925:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2373:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3363:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2228:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2768:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3319:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3482:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2565:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3222:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3060:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2854:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2713:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3097:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2984:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2757:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3040:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3260:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3664:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3230:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2829:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2829:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2829:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3139:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2471:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2588:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2645:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2746:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3056:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2035:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3065:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3025:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2564:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2902:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2811:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3099:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2850:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2693:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2901:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3032:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2589:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3047:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2503:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2441:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3131:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3042:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2510:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2905:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2889:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2626:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2794:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2708:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3212:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2698:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2431:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2871:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2998:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2765:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2788:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2776:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2715:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2722:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2187:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2873:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2908:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3343:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3084:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2363:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2323:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2757:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2346:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2812:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2717:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2349:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2563:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3415:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3016:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3251:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2827:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3083:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3000:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3019:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2638:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2598:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2351:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3176:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2403:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3244:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3032:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2185:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2362:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2623:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2961:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3302:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2520:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3212:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2927:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2767:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2676:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2735:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2338:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2021:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2021:  15%|█▍        | 59/401 [00:37<02:04,  2.76it/s]training loss: 0.3152:  15%|█▍        | 59/401 [00:37<02:04,  2.76it/s]training loss: 0.3488:  15%|█▍        | 59/401 [00:37<02:04,  2.76it/s]training loss: 0.3007:  15%|█▍        | 59/401 [00:37<02:04,  2.76it/s]training loss: 0.2552:  15%|█▍        | 59/401 [00:37<02:04,  2.76it/s]training loss: 0.3325:  15%|█▍        | 59/401 [00:37<02:04,  2.76it/s]training loss: 0.3364:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2949:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2641:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2852:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2955:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2873:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2854:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3003:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2435:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2969:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2777:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2431:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2447:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3277:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2698:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3052:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2436:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3615:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2727:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2956:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3202:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2433:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3620:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2935:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2713:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3151:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3214:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2724:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2855:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2928:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2810:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3273:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2492:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2531:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3206:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2844:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2559:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2994:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2901:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2340:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3045:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3058:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3098:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3030:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3211:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2887:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2785:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3699:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3147:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2434:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3003:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3214:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3472:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2651:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2760:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2816:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2590:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2249:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3026:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2875:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2407:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2741:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2818:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2816:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2942:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2931:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2464:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2845:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2933:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2574:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2132:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2638:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2910:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3291:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3291:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2678:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3363:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2678:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3141:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2965:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3189:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2725:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3696:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3176:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2955:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3092:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2875:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2925:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2776:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3174:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2585:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3271:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2952:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2315:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2523:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2617:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2849:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3007:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2801:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2376:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3040:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3071:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2565:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3316:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2780:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2598:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3340:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2428:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3147:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3348:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3128:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3038:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2815:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2298:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3579:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2824:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3064:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2320:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2638:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2323:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2610:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2904:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2484:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2568:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2750:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2722:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2926:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2401:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3141:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2600:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3111:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2335:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2766:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3001:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2656:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2904:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2843:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2392:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2819:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2564:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2789:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3776:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2473:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3110:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2380:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2575:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2414:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3166:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2704:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3166:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3053:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2520:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2303:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3204:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3204:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3059:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2515:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2694:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2768:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2601:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2660:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2831:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2046:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2703:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2684:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2561:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3592:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2781:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3561:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2581:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2767:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2984:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3144:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3284:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3329:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2489:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2492:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2320:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2938:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3330:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2433:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2336:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2928:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2909:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2368:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2866:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2984:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2974:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3066:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2655:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2305:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2475:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3013:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2890:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2270:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2461:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2532:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3323:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3158:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2785:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3422:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2404:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2307:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3012:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2777:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2813:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2559:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2721:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3055:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2507:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2523:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3298:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2713:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3079:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2532:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2922:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2683:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2687:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2670:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2641:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3213:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2784:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2293:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2707:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2450:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2535:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3626:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2473:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2862:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2915:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2540:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2919:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3883:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2736:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2736:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3028:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3317:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3100:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2303:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2947:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2530:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2503:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2909:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2828:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2805:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3021:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2539:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2840:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2596:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3232:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2457:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2873:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2670:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2769:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2499:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3021:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2320:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2703:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2945:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2780:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2824:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2843:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3094:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2736:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2868:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2804:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2820:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2776:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2998:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2709:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2507:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2484:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3427:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2615:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2651:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3282:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2987:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2398:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2826:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2609:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3109:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2256:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2462:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3065:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3079:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2993:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3656:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2783:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2925:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2432:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2902:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2436:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2638:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.3357:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2830:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2661:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.3128:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2359:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2899:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2967:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.3001:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2649:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.3025:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2606:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2921:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.3352:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2469:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2901:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2903:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2919:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2749:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2409:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.3008:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2661:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2661:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2829:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3083:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3252:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2817:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2700:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2368:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2866:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2879:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2953:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2963:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2545:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3280:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3333:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3172:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2596:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3426:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2985:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3155:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3151:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2365:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2295:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3101:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2362:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3458:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2545:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2676:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3274:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3088:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2622:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2761:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2472:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3051:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3172:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2720:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2844:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3184:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3427:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2831:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2644:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2471:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2459:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2408:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2944:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2390:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2914:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2954:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2285:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2935:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3178:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2529:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2857:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2371:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2754:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2815:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3339:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2647:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2581:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2767:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2770:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2664:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2996:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2504:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2781:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2590:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3114:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2175:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2759:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3010:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2747:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2977:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2898:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2900:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2989:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2178:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3020:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2944:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3185:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3149:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2476:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2476:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3076:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2954:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2628:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3121:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2822:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3271:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2732:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2820:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2875:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2195:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2690:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3041:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2104:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3213:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2673:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3082:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2252:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2634:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3344:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2632:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2574:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3252:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2587:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2510:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2635:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2968:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2966:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2431:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2646:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2698:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2547:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3301:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3508:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3019:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2433:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3171:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2459:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2653:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2753:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2516:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2771:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2874:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3211:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3334:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2573:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2462:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2752:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2866:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3158:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3147:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3109:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2774:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2530:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2934:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3091:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2327:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3642:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3134:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2713:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2841:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3070:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3255:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3017:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3398:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2574:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2446:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2696:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2940:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2638:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2571:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2546:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3631:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2587:  16%|█▌        | 64/401 [00:43<03:30,  1.60it/s]training loss: 0.3823:  16%|█▌        | 64/401 [00:43<03:30,  1.60it/s]training loss: 0.2509:  16%|█▌        | 64/401 [00:43<03:30,  1.60it/s]training loss: 0.2555:  16%|█▌        | 64/401 [00:43<03:30,  1.60it/s]training loss: 0.3108:  16%|█▌        | 64/401 [00:43<03:30,  1.60it/s]training loss: 0.2137:  16%|█▌        | 64/401 [00:43<03:30,  1.60it/s]training loss: 0.4211:  16%|█▌        | 64/401 [00:43<03:30,  1.60it/s]training loss: 0.4211:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2381:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2815:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2882:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2497:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3533:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2699:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2761:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2387:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3648:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3058:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3069:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2732:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3031:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3041:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3383:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2604:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2423:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3089:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2523:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3111:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3301:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3328:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2430:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2536:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3516:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3057:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2168:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3288:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2700:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2629:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3517:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2697:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2994:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3133:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2631:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2825:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2543:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3208:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2933:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2708:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3219:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2677:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3398:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2850:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3498:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2614:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3193:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2896:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2954:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2559:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2313:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3341:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2973:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2933:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2889:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2972:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2677:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3023:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2609:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2741:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3251:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2545:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2665:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2620:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2801:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3155:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2578:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2905:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2927:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2849:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2289:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2187:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2748:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2723:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2715:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3410:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2636:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2633:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.1294:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.1294:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2576:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3879:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2350:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2464:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3066:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2966:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2653:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3017:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2813:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2628:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2948:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3072:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2726:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2550:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3089:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2503:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2578:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3324:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3003:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2650:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2952:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3076:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3040:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3162:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2768:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2535:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2780:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2928:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2982:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3150:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2978:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2566:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2400:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2724:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2745:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2778:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2845:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3376:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3283:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2579:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3328:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2924:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2652:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2102:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2301:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2990:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2895:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3538:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3402:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3497:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2670:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2869:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2592:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3105:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2848:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3082:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3349:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2589:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3033:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2511:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2940:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2394:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2974:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2870:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2805:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.1731:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3371:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3342:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3189:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2953:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3458:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2578:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2657:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3065:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2803:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2715:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2691:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2303:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2756:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2756:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3017:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2886:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2947:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2852:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2085:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2535:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2598:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3025:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3361:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2942:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2368:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2426:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2265:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3135:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2835:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3228:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2946:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3143:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2981:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2874:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2744:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3402:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2833:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2593:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2692:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2374:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2791:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2725:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3067:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2679:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2353:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2618:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2426:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3050:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2265:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3046:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3247:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2768:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2879:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2790:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2609:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2771:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2628:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2891:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3086:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3115:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2515:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3264:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2499:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2325:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2628:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2769:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2396:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2788:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2671:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2362:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2637:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.3027:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2928:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2659:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2721:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.3297:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2680:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2841:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2690:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.3003:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.3075:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2438:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2634:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2088:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2700:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2958:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2897:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2593:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.3130:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.3291:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2372:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2398:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2573:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2573:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2689:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2556:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2730:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2669:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2271:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3265:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2222:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2655:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3261:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2527:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2778:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2773:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2600:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2794:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3152:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2972:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2886:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2727:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2731:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3334:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2926:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2782:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2230:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2725:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2372:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2439:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3107:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3504:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3036:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2697:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3226:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2829:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2950:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2891:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2979:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2760:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2886:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3253:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3180:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2198:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2811:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2675:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2637:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2716:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2751:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2799:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2987:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3398:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3245:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2169:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3000:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2974:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2920:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3061:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2575:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3012:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2193:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3062:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2850:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2663:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2949:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3347:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2426:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3182:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3365:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2549:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2325:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3004:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3091:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2703:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2984:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3214:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2501:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2477:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2219:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2691:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2596:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2877:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3720:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3720:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2784:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2620:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2719:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2850:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2791:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2907:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3393:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2498:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2489:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2846:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3089:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2443:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2920:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2490:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2101:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2598:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3441:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2965:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2787:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2132:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3172:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2739:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2787:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3070:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2829:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2742:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2672:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2742:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2795:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3034:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2683:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3104:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2041:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3245:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3344:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2766:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2640:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2592:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2263:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2722:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2757:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2246:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2597:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2717:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2451:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2968:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3159:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2432:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2881:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2714:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2477:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2813:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2939:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2881:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2888:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3115:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2657:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2953:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2599:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3438:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2716:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2920:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2541:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2408:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2356:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2775:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3003:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3587:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2456:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2482:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2810:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2383:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2870:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2721:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3425:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3366:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3271:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2644:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.1606:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.1606:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3007:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2890:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3458:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2654:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3073:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2168:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3200:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3041:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2419:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2733:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2674:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2798:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2541:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2452:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2630:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2280:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3119:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2751:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2382:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2865:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2922:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3203:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2565:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2601:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3195:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3412:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2599:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3390:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2788:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2862:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2737:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3208:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3105:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3084:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2781:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2402:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3304:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2630:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2685:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2925:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3673:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3518:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2840:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3055:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3032:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2538:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2820:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3297:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3008:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2264:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2845:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.1893:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2920:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2755:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2299:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2980:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2913:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2483:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2926:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2170:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2442:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.3235:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2961:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.3674:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2572:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.3146:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2920:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2480:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2362:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2570:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2979:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2526:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2521:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.3308:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2844:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2579:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2790:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2725:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2557:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2557:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2438:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3259:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2524:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2975:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3188:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2370:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2670:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2541:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2505:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2366:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2388:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3028:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2645:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2686:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2870:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2782:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2716:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2805:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2634:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2780:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2602:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2966:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3217:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2822:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2429:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2371:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2699:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3479:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2949:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3065:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2596:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3212:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2895:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2698:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2771:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2384:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2518:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2451:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2580:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3037:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2788:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2888:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3060:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2814:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2572:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2962:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3040:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3511:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2663:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2801:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2924:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2687:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2279:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3010:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2473:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3003:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2721:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3039:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2402:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3037:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3133:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3087:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2718:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3307:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2970:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2933:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3039:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2603:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2370:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2925:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3136:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2781:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2601:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2360:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2620:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2717:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2737:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3291:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.4307:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.4307:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2788:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2010:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2437:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2794:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2920:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2644:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2882:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2805:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.3208:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2650:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2796:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2249:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2944:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2670:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.3142:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2886:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2952:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2312:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2861:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.3089:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2224:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2426:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2149:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2843:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2823:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2509:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2601:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2409:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2874:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2899:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2883:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.3280:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.3228:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2874:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2472:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2878:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2351:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2899:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.3452:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2666:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.3067:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2884:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2991:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3240:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2967:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3953:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2994:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3167:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3042:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2863:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2911:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3336:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3448:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2349:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2850:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2196:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2450:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2677:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2902:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2878:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3355:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3316:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2915:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2706:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3055:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2452:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2767:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2613:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2566:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3149:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2401:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3097:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2764:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2964:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2746:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2890:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2718:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2834:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3319:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3319:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2612:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2594:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2708:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2776:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3546:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2835:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2681:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2887:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2757:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2284:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2296:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2881:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2854:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2477:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2482:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3139:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2730:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2708:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2685:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3165:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3101:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2705:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2625:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3384:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3310:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2806:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3001:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3027:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2211:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3192:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3087:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3258:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2511:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2423:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2806:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2512:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2468:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3007:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2861:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2989:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2868:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2781:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3368:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3267:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2522:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2932:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2878:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3331:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2597:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2209:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2715:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2755:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2212:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2498:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2755:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3093:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3013:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3310:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2602:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2627:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2470:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3021:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2114:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2484:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3210:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2581:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3074:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2203:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3514:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2821:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2612:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2731:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2650:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2570:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2494:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2588:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2616:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3088:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2237:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2237:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3046:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3151:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2319:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2830:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2932:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2020:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2698:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2928:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2441:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2644:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2583:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3003:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2431:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2822:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2776:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2821:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2814:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2705:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2834:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2801:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2712:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2943:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3239:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2147:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2589:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2632:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2533:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2932:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2229:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2553:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3189:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3373:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2807:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2812:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2806:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3331:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3451:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3475:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2760:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2649:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3083:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3096:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3153:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2571:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2965:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2733:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2711:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2497:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2815:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2809:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2961:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3046:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2502:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2859:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2749:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3192:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3133:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3171:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2757:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2923:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2775:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3477:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2680:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3267:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2728:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3368:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3112:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2473:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2621:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2750:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3631:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2583:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2487:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2538:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2636:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2665:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2740:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2866:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3804:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3804:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2622:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2573:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2512:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3483:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2359:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3460:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3342:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3279:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2906:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3154:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2720:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3079:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2144:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2682:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2256:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2755:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3385:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2677:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2269:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2626:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2617:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3461:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3032:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2186:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2385:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2182:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3548:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2900:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2699:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2969:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2850:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2969:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2527:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2860:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2603:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2913:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2153:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3027:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2431:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2463:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2536:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2957:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3038:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3173:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3146:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2387:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2516:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2583:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2543:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2380:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2527:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2725:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2611:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2842:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3011:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2790:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3231:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3027:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2838:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2419:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3373:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2555:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3430:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3109:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3202:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3253:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2186:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2529:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3334:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3154:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3035:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2630:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2422:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2886:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2409:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2545:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2505:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3084:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.4297:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.4297:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2501:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3130:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3044:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2260:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2935:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2763:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3036:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3224:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2853:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2561:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2754:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2782:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3225:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2359:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2550:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2620:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3034:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3042:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3061:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2927:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2863:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2520:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3208:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2401:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2878:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3016:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2981:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3701:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2698:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2633:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2941:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2839:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2956:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2711:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2814:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2902:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2938:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2498:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2723:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2596:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2925:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3110:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2941:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2669:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3265:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3027:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2904:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2699:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3440:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2720:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2605:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3452:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2562:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2663:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2487:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2836:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2525:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3618:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2748:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2629:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2927:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2596:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2515:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2829:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2430:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2934:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2801:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2573:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2373:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3526:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3078:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2841:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2468:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3177:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3141:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2672:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2871:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2782:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2707:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2707:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2868:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2708:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2720:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2790:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2586:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2678:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2884:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3230:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2474:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2974:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3219:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2366:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3325:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2447:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2872:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2720:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3035:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2857:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3120:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3200:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2988:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3081:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2647:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3057:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2415:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3071:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2667:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3202:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3479:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2550:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2462:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3240:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2707:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2267:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3133:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2961:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2502:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2957:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2765:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3224:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3102:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3444:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2553:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2564:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3010:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2311:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2943:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3325:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2688:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2555:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2681:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2349:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2976:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2783:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2200:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2845:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2815:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3269:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2659:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2697:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3541:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3158:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2800:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2683:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2789:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2721:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2818:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3297:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2471:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2883:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2946:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2945:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2719:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2667:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2686:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3532:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2721:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2810:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2619:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2619:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2884:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2652:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3129:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2277:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2662:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2530:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2608:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2187:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2496:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3027:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2491:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2561:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2382:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2594:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3066:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2723:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2736:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2463:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2999:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2840:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2656:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2568:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2408:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2506:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2934:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2933:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2643:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2862:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2684:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2638:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3517:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2477:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2821:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2510:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2997:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3510:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2728:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2521:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2713:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2822:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2624:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3343:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2423:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3533:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2584:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2887:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2528:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2497:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3168:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3485:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2392:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2776:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2734:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2417:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2887:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2414:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2911:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2430:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2460:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3068:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2822:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2107:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2815:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3235:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3047:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.3158:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2857:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2838:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2706:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.3075:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2912:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2665:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.3083:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2908:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2925:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2848:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.3006:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2730:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.4330:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.4330:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2466:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2856:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2936:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2889:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2449:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2446:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2714:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2532:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2582:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3700:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2946:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2753:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2380:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3252:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2916:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3045:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2983:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3082:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2778:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3156:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2514:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2198:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2882:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2782:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2908:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3028:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2965:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2393:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3229:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2596:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2548:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2882:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2972:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2432:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2786:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2616:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2971:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2415:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2904:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2782:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3046:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2632:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3109:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3445:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3262:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3140:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2819:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3080:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2599:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2832:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2991:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2732:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2647:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3054:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3179:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2464:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2764:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2852:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2782:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2699:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2755:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2348:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2632:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3168:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2766:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2974:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2419:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2879:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2921:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3148:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2998:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2755:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2645:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2703:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2604:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3967:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2851:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2871:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2429:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2429:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3163:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2778:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2975:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3228:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3791:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3012:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2803:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2777:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3258:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2938:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3322:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2714:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3129:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2896:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2638:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2965:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2532:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3275:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3315:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2761:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3025:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2762:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2649:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2677:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2582:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2912:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3392:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2911:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2696:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2364:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3942:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3117:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3462:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3173:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2198:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2717:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2794:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3094:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3054:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2330:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2461:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2531:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2146:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3095:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3212:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2737:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3760:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3592:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2926:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2710:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2962:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2730:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3009:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3233:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2536:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2382:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2682:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2957:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3185:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2889:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2575:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2679:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3028:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2441:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3079:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3049:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2789:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2761:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3932:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3238:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2580:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2668:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2733:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2213:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3480:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2940:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2544:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3102:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2868:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2868:  20%|██        | 81/401 [00:53<05:28,  1.03s/it]training loss: 0.2492:  20%|██        | 81/401 [00:53<05:28,  1.03s/it]training loss: 0.2922:  20%|██        | 81/401 [00:53<05:28,  1.03s/it]training loss: 0.3132:  20%|██        | 81/401 [00:53<05:28,  1.03s/it]training loss: 0.2677:  20%|██        | 81/401 [00:53<05:28,  1.03s/it]training loss: 0.2650:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2201:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2753:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2808:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2935:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2937:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2553:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2363:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2820:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2614:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2927:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3270:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3032:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2747:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2672:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2794:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2985:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2965:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2613:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3149:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.1937:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2908:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2919:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2749:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2559:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2244:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2950:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2955:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3468:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3338:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2490:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2448:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2913:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3019:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2800:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2839:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3112:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3567:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2508:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2998:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2620:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2340:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2467:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2396:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2432:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2148:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2796:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2830:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3050:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2836:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3403:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2869:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2676:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2291:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3108:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3168:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2736:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2614:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2633:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2301:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2682:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3009:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3013:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2606:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2200:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2860:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2888:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2689:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2693:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2378:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2461:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2746:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3032:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3548:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3601:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3601:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2769:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.1948:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2803:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2722:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2492:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2507:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2727:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3251:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3112:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2796:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2538:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2724:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2561:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2384:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2601:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2495:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3224:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3273:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2459:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2874:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2648:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2428:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2923:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3047:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2540:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2797:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2433:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2720:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2706:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2693:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2439:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2482:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2754:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2597:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3048:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2884:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2758:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2893:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2704:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2661:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3013:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2998:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2758:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2715:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2354:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3013:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2585:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2730:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2548:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3054:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2717:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3226:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3295:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3092:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2915:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3466:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2849:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2499:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2734:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3202:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2200:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2517:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2750:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2679:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2494:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2940:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2923:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2934:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2835:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2553:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2612:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2682:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2813:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2749:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2675:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2872:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3103:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2427:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.4593:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.4593:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3397:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2721:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3013:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3553:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2752:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3031:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2617:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2574:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2770:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2558:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2962:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2569:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2777:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3043:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2894:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2463:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3216:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2443:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2712:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2302:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2920:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3347:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2749:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2787:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2699:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2894:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2924:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2619:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2292:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3006:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2809:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3154:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3604:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2864:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2547:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2632:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3479:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2825:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2712:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2495:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2690:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2659:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2334:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3054:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2650:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3245:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3012:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2794:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2683:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2339:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2585:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2786:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2653:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2535:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3009:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3108:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2614:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3047:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2416:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2849:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2432:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2866:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2942:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2443:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3127:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2843:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2377:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2415:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2924:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3059:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3005:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2574:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2792:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3030:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2858:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2283:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2473:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2653:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.4780:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.4780:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.3174:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2590:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2890:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2782:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2642:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2635:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.3212:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.1993:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2682:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2827:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2605:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.3028:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2908:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.3137:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2856:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2691:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3108:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2836:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3154:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2207:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2053:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2410:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2375:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3273:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3246:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2853:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2642:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2443:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2443:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2772:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2957:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2163:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3122:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2628:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2268:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3834:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2853:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2333:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2761:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2804:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3054:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3115:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2761:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2343:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2891:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2486:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2465:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.1764:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2463:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3119:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3239:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2647:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2537:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2475:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2468:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2843:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3023:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2502:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3004:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2856:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2244:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2403:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2763:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2946:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3068:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2942:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2750:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2297:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2580:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3126:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.1829:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2736:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2790:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2547:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3170:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2995:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3047:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2322:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2727:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2727:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2355:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2692:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2962:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2292:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2567:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3061:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2523:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2821:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2331:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2951:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2447:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2780:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2178:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2601:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2598:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2355:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2809:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2302:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2902:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2912:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2526:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2708:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2878:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2326:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3069:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3491:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2943:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2465:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3469:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2503:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2644:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3157:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2658:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2049:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2758:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2877:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2790:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2904:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2669:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3298:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3092:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2661:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3059:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3062:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2747:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2549:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2622:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2691:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2564:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2910:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2540:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2438:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2899:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3084:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2503:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2954:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2888:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3368:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2452:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3415:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2720:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2929:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3189:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3366:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2836:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2619:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2860:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2630:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2674:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2693:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3169:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2934:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2664:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2377:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2769:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2540:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2599:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2390:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.1167:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.1167:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2644:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2862:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2651:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2820:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2467:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2779:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2985:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2882:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2535:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2816:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2852:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2393:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2555:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2675:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2657:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2928:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2624:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2370:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2785:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3120:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2855:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2796:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2687:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3151:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2606:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2394:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2970:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2107:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2981:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2393:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2908:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2651:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2388:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2711:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3139:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2485:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2749:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2682:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2601:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2478:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2892:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2652:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3080:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2669:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2813:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2607:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3156:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2996:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2676:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3181:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3203:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2950:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2939:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2925:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2788:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2769:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2515:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2609:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2963:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2615:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2710:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2585:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3050:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2874:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2199:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2926:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2449:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2527:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3112:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2791:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2834:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3249:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3083:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3012:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2837:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3027:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2825:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2215:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3054:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3054:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.2289:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.3051:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.2501:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.3191:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.2516:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.3002:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.3092:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.2918:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.3092:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.2788:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.2583:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.2483:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.3564:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.2635:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.3325:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.3131:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2797:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2940:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3123:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2328:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2565:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2575:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3091:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2923:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2229:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2914:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2401:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2861:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2950:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2618:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3041:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2974:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2160:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2384:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2571:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2787:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2918:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3099:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2738:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2604:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2828:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3198:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2835:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2858:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3105:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2856:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2159:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3135:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3012:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2776:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2828:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2717:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3256:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2490:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2886:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2734:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2733:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2833:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2861:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2391:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3195:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2614:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2706:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2673:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2053:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3037:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2673:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2545:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2528:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3006:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2529:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2388:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3084:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3085:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2934:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3289:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3210:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2144:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2822:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2822:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2839:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2609:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2633:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2824:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2054:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3226:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2115:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3027:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2737:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2694:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2748:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2709:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2676:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3130:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2168:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2327:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2762:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2610:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2410:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2755:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2328:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3031:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2404:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2530:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2361:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2585:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2597:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3491:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2837:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3021:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3059:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3051:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2644:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2807:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2536:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2859:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2846:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2616:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2631:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2534:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2715:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2660:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2359:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3192:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2927:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2761:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2425:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2967:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2818:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2294:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2469:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2646:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2428:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2295:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2873:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2715:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2643:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2614:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2246:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2527:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2855:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2783:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2246:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2771:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2623:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2546:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3213:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.1977:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2144:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2922:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2779:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2957:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2543:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3175:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2664:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2775:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2699:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3276:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.1434:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.1434:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2968:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2643:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2489:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2721:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2534:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3047:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3088:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3204:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3019:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2572:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2897:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3221:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2670:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2843:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3594:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2407:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2797:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3064:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3689:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2597:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2349:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2385:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2745:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2750:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2482:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2912:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2484:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2947:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2299:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3054:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2391:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2817:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2772:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2772:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2688:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2880:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2679:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2301:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2281:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2081:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2351:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2853:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3065:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.1867:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2319:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2372:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3011:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3276:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2447:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2747:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3113:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3015:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2445:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2627:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2878:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3134:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2547:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2829:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2778:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2711:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2661:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3840:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2806:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2369:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3278:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2912:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2800:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2466:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2602:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2495:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3125:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2401:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3277:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2315:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2567:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3000:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2697:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2661:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3634:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3634:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2762:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.3039:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2208:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2823:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2505:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.3034:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2846:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2914:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2877:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2935:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2675:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2304:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2628:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2820:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2061:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2707:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2862:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2359:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2945:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2551:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2705:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2945:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2330:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2967:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2072:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2831:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3502:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2771:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2852:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2501:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2627:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3078:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2434:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2365:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2315:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2474:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2492:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2996:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2832:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2525:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2253:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3065:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2448:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2806:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2435:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2651:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2718:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3506:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2762:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2805:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3194:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2364:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2697:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2689:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2534:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3037:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3035:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2803:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2572:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2597:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2998:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2468:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3224:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2446:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3010:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2218:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2384:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2611:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2157:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2924:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2194:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2850:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2396:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2703:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3162:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2915:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2798:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2377:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2970:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2970:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2740:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2480:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2377:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2551:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2893:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3163:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3229:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2892:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3021:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2867:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2224:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3128:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2864:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2149:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2600:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2915:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2772:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2750:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2928:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2388:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3395:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2770:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3175:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2434:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2284:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2060:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2225:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2686:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3069:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2830:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2432:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2825:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2172:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2895:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2806:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2828:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2746:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2316:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2802:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2559:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2352:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2539:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2419:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2608:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2766:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2395:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2652:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3034:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2706:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2635:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2038:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2731:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3205:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2584:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2549:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2723:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2386:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2506:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2913:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2207:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2335:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2405:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2838:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3280:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2586:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2964:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2882:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3013:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3193:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2496:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2632:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2459:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3060:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2767:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2180:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2793:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2732:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2407:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2353:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2353:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2695:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.3036:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.3104:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2991:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2306:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2764:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2803:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2658:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2344:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2999:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2899:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2899:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2586:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2931:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2624:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2301:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2570:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.3159:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2983:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.3024:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2634:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2829:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2808:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2685:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2995:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.3324:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2747:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.3076:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2669:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2897:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2591:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2270:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2667:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2701:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2430:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2549:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2819:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2926:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2927:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2783:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2542:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3014:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3333:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2584:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2669:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2832:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2541:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3130:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3142:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3116:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2283:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2786:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3034:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2845:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2813:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2350:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2454:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2414:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2911:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2226:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2867:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2594:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2329:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2904:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2824:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2650:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2121:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3433:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2417:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2340:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2988:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2577:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3050:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2447:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3166:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2502:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2709:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3059:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2745:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2745:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3021:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2381:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2857:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2360:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3045:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2302:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2381:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2909:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2544:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2603:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2444:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2738:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3235:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2480:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2611:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3214:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2986:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2972:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2746:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2591:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2720:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2457:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2454:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2514:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2473:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2717:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2382:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2168:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3075:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2209:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2732:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3087:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2935:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2517:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2661:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2558:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2626:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2753:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2781:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2643:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3129:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2811:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2952:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2288:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2893:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2638:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2926:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2529:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2453:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3074:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2248:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2581:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2587:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3133:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2452:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2362:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2682:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3033:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2526:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2874:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2864:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2869:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3072:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2689:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3062:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2933:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2390:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2788:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3173:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2433:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2908:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3074:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2414:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3104:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2505:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2681:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2447:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2821:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3132:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3132:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3189:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2847:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3110:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2438:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2570:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2314:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2871:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2527:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2729:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2660:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3216:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2569:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3125:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2444:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2553:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2849:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2798:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2218:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2040:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3284:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2726:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2284:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3259:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3224:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2505:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2977:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2366:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2388:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3120:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2539:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2732:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2344:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2245:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3251:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2702:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2614:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2858:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3233:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3012:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2895:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2709:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2243:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2407:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2895:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2713:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2479:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2540:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3249:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2782:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2884:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2663:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2569:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2364:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2745:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2288:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2626:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2066:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2237:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2778:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2660:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2323:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2843:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2723:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2821:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2422:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2715:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2809:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3047:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2559:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2558:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2749:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2775:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2881:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2936:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3406:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2606:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2457:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3176:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.4094:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.4094:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2832:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2523:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2552:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2245:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.3520:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.3127:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.1945:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2639:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2565:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.3334:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2749:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.3068:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2667:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2433:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.3365:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2489:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2446:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2619:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2934:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2398:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2963:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2681:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2705:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2366:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2569:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3266:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2476:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2200:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2808:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3083:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2630:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2664:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2873:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2398:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2915:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3068:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3201:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2617:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2492:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2878:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3451:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2404:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3026:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2656:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2913:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2912:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2620:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2635:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2520:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2572:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2493:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2669:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2439:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2325:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2806:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3007:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2998:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2816:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.1883:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2700:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2395:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3420:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2295:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2334:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2833:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2862:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2451:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2360:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2253:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2515:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3186:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2655:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2711:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2861:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2743:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2857:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2429:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2716:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.1615:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.1615:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2703:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2384:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2349:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2304:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2461:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2797:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2842:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2993:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2514:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2754:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2586:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2959:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2500:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3339:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2823:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2906:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2657:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2635:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2741:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3182:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2453:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2433:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2915:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2573:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2500:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2892:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3102:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2430:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.1979:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2699:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2639:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2541:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2464:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2560:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2839:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2588:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2368:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2975:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2401:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2583:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2664:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2844:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2195:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2325:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2693:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2506:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2766:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2279:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2465:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2810:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2899:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2860:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3126:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2898:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3284:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2647:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2851:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3083:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3078:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2421:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2366:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2404:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2587:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3229:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3257:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3045:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2960:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2925:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2436:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2001:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3032:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2710:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2625:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3011:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3045:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2837:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2727:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2680:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2261:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2261:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3003:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3208:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2189:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2815:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2951:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3063:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2799:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2677:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3415:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2890:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2403:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2599:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2797:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3445:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2571:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2866:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2275:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2348:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2698:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2890:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2425:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2854:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2559:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2943:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2665:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2592:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2689:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2706:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2531:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2351:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3173:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2512:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2227:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2974:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2760:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2502:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2774:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2809:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2852:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2493:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2432:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2724:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2457:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3003:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2697:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2892:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2715:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3381:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2636:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2595:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2935:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3433:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2395:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2842:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2479:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2005:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2054:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2409:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2799:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.1690:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3227:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3126:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2772:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2426:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3192:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2975:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2096:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3010:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2808:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2714:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2821:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2627:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2633:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2441:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3177:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2374:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2808:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3169:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3151:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3151:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2650:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3217:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2624:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2672:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2484:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2957:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2778:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3180:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2929:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3018:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2537:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2650:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3567:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3033:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3019:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2524:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2257:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3215:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2462:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2852:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3366:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3087:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2614:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2686:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2308:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2272:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3045:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2354:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2416:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2871:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2807:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.3604:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2667:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2303:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2545:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2766:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2530:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2935:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2561:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2408:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.3690:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2648:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2844:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2599:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2350:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2323:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.1937:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2952:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2303:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.3105:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2643:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2863:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.3033:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2731:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2587:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2833:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2566:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2295:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2824:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2382:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2659:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2223:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2749:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2593:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2867:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2759:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2836:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2901:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2750:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.3393:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.3486:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.3195:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2730:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2641:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2550:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2676:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2289:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2770:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2017:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2017:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2463:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2307:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2969:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2441:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3117:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2667:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2227:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3008:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2738:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2201:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2343:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3373:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2869:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2259:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2674:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2937:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3186:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3591:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2543:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3859:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2501:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2674:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3203:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2708:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3051:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2556:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2459:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2721:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2471:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2381:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2652:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2308:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2267:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2635:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2708:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2817:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2934:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2616:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2614:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2585:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2282:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3003:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2590:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2732:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3072:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2695:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2571:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3062:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3363:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2640:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2766:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2440:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2654:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2460:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2089:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2214:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2214:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3116:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3128:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2445:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2771:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2538:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2781:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2185:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2210:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2463:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2630:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2946:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2394:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2367:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3311:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3224:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3090:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2666:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2761:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2906:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2823:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2216:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2304:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2304:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2837:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2361:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.3274:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2801:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2679:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2738:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2414:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2769:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2529:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2722:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2796:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2611:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2561:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2643:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2752:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2670:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.3000:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2806:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2678:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2771:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2852:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.3049:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2827:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.3218:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2719:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2338:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2809:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2924:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2614:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2734:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2909:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2784:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2786:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2542:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2636:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2792:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2774:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2578:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2495:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2808:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2417:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2586:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.3219:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2793:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2904:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2593:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2604:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2796:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2278:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.3219:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2999:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2661:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2655:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2045:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2762:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2445:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2356:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2639:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2443:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.3165:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2627:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2486:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.3053:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2815:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2519:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2232:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2482:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2609:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2941:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2738:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2341:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2732:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2528:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2330:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2890:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2697:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2587:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2816:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2905:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2905:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2209:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2772:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2462:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2788:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2816:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2817:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2904:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3067:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2423:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3022:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2461:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2603:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3318:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2590:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3076:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2996:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2382:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3288:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2613:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3051:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3059:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2616:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3180:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2830:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2338:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2557:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2410:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3337:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2150:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2694:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2850:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2763:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3375:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2466:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2747:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2690:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3133:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2892:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2400:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2895:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2727:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2337:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2203:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2363:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2892:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2935:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3212:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2839:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2497:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2605:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2426:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2339:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2507:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2632:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2617:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2577:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2996:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2541:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2810:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2184:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3156:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3054:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3014:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2670:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2818:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2195:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2444:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2199:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3082:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2520:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2755:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2639:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2224:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2418:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2698:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2810:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2557:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2981:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2680:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2680:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2391:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2263:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2194:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2748:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2074:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2817:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2202:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2448:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2465:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2615:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2573:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2416:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3072:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2441:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2833:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2453:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2962:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2950:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2655:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2704:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2245:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2649:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2707:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3270:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2641:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2344:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2934:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2376:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2629:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2803:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2972:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2339:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3062:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2674:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2825:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2597:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2914:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2782:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3025:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3087:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2113:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2551:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2021:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2499:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2519:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3350:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2492:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2564:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2551:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2506:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3169:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2502:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3263:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2205:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2462:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2484:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2911:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2208:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2361:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3164:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2883:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3057:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2626:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2988:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2012:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2814:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2639:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2865:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2520:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2553:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2873:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.1977:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.3265:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.2972:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.2486:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.2626:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.2588:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.2769:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.2257:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.2257:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2348:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2807:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3306:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2134:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2898:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3025:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2719:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2670:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2845:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2439:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2714:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2939:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2176:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2183:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2828:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2478:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2214:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2437:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2664:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2577:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3025:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2445:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2411:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2606:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2849:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2446:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2528:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2980:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3151:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2993:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2699:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2191:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2335:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2692:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2750:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2610:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3140:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2283:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2617:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2562:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2492:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2397:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3324:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2811:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2719:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2420:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2139:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3228:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3186:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2508:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2626:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2651:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2805:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.1984:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2770:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2966:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2537:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2764:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2920:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2836:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2611:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2892:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2672:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2319:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2960:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2667:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3042:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2124:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2328:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2322:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2556:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3032:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2907:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2041:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2700:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2605:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3109:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3215:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2099:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2099:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2728:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2244:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2764:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2550:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2573:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2821:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2565:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2532:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2358:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2752:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2444:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2335:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2742:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2087:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3441:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2736:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2774:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2311:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2685:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3277:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2838:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2813:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2844:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2677:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2772:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2688:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2738:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2244:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2383:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3050:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2473:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2087:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2873:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2327:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3020:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2766:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2657:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2587:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2471:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3085:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2387:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2691:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2901:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2539:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2303:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2835:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2957:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3143:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2656:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2638:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2756:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2775:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2909:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2331:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2333:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2474:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2270:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2698:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3010:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2662:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2943:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2383:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2668:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2304:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2394:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2896:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2765:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2804:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2354:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.1918:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2750:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2618:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2588:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2754:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2176:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2687:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2787:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2349:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3592:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3592:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2890:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2744:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2997:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2665:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.3344:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2867:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2942:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.3283:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2810:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2385:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2660:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2687:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2205:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2618:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2684:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2996:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2606:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2678:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.3591:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2396:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2555:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2782:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2273:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2399:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2829:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.3370:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2199:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.3005:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.3217:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2527:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2838:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2217:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2511:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2822:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2227:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2555:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2603:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2217:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2584:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.3544:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2457:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2395:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2128:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2738:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2244:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2383:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2552:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2200:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2631:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2515:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2269:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.3286:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2048:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2165:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2789:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2904:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2260:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2697:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2986:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2804:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2358:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2565:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2526:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2768:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.1731:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2843:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2693:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.3024:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2475:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2270:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2928:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2420:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2964:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2993:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.3072:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2191:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2458:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2887:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.1795:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.1795:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2624:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2352:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3203:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2795:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2397:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2665:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2447:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2606:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2389:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3359:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2829:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2904:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2852:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2575:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2492:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2813:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2527:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2358:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2665:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2850:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2517:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2237:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3141:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2618:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2422:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2301:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2296:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2479:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2289:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2922:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2613:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3029:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2774:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2526:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2319:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2258:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2367:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2224:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2937:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2306:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2572:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2779:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2539:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3161:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2816:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3151:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3071:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2446:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2997:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2577:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2701:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3372:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3194:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2806:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3098:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2957:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2654:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2914:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2500:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2499:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2954:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2044:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2900:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2481:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2634:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2637:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2616:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2901:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2961:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2881:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2912:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2739:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2964:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2404:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2572:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2744:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2052:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2754:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.4064:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.4064:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2281:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.3081:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2800:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2555:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2835:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.3166:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2174:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2469:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2788:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2633:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2461:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2624:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2624:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2151:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.1990:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.3030:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2330:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2880:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2344:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2491:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2772:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2485:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2435:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.3308:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.3299:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2283:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2639:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2686:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2882:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2354:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2686:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2384:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2695:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2468:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2796:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2062:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2762:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2574:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2642:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2537:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2690:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2799:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2266:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2635:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2626:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.3331:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2046:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2484:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2590:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2472:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2688:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2855:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2770:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2659:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.3147:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2313:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.3356:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2825:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2987:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2503:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2811:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2918:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2560:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2788:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2687:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2294:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2587:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2337:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2511:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2597:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2319:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2538:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2278:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2799:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2637:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2772:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2668:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2349:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2512:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2512:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2449:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2803:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2642:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2852:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2700:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2072:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2178:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.3034:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.3022:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2689:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2660:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2153:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.3578:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2448:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2260:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2787:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2813:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2878:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2455:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2781:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2065:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2635:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2633:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2685:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.3232:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2404:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2858:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2906:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2330:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2494:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2425:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2639:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2733:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2745:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2901:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2661:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2986:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2626:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2802:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2995:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.3269:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.3020:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2501:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.3151:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2689:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2279:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2220:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2409:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2912:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2735:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2461:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2647:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.3074:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2247:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2404:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2874:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2658:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.3073:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2711:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2326:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2836:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2620:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2352:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.3423:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.3292:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2610:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2534:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2592:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2597:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2630:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2820:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2701:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.3101:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2555:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2357:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2712:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2402:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2671:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2518:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2518:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2399:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2631:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2511:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2594:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2401:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2564:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2091:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2652:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2165:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2280:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2451:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2764:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2460:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3185:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2906:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2327:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3528:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2953:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3545:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2558:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.1965:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2061:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2448:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2491:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2954:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2523:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3131:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2399:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2394:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2743:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2393:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2603:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2954:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2424:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2597:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2762:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3177:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2733:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2431:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2629:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.1896:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2462:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2599:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2841:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2504:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2323:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2461:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2596:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2514:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2506:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3077:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2628:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2378:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2834:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2504:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3120:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3171:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2913:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2132:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2156:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2853:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2141:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2553:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2381:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2668:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2470:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2672:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2145:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2363:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2516:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3114:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2993:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2364:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2962:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2987:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2590:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2685:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2189:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3731:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3731:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2394:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2653:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.3240:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2589:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2716:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2601:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2765:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2917:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2479:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2651:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2279:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2559:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2589:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2321:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2970:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2744:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2243:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2575:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2929:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2703:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2546:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2773:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2375:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2616:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2517:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2574:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2424:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2740:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2553:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2865:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2645:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2762:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2848:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2804:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2523:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2562:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.3158:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2108:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2069:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2156:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.3179:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2105:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2465:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2341:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2545:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2055:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2413:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2469:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2110:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.1948:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2565:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2727:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2781:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2469:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2553:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2850:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.3319:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.3291:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2420:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.1925:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2010:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2718:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2409:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2278:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.1920:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.3191:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2742:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2569:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2522:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.3245:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2544:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2917:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2538:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.3157:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2760:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2414:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2776:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2544:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.1743:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.1743:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2718:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2422:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2642:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2430:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2499:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2723:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2814:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2316:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2714:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.3180:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2228:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2523:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2816:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2323:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2125:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2391:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.1972:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2339:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2367:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2669:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2414:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2628:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2992:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2404:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2445:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2710:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2975:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2307:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2364:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2739:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2581:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2488:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2083:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2436:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2348:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.3205:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2109:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2790:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2828:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2921:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2519:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2054:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2520:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.3235:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.3216:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2671:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2481:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2232:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2237:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2220:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2403:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2111:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2422:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2931:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2925:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2560:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2957:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.3052:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2830:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2426:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2609:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2594:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2395:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2283:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2433:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2550:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2277:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2000:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2770:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.3063:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2856:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2638:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2543:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2825:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.1936:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2247:  28%|██▊       | 111/401 [01:12<05:41,  1.18s/it]training loss: 0.2654:  28%|██▊       | 111/401 [01:12<05:41,  1.18s/it]training loss: 0.2915:  28%|██▊       | 111/401 [01:12<05:41,  1.18s/it]training loss: 0.3409:  28%|██▊       | 111/401 [01:12<05:41,  1.18s/it]training loss: 0.3409:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2501:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2517:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2158:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.1897:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2095:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3040:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2460:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2464:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3176:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2437:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2689:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2465:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2954:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2519:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2774:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2847:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3061:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2575:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2470:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2757:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2544:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2502:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2277:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2153:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2854:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2564:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2330:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3246:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2637:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2199:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2827:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2281:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3197:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2583:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3115:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2442:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2551:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2092:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2798:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2730:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2349:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2580:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2857:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2542:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2762:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2725:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2634:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2251:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3146:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2882:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2500:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3362:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2345:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2345:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2883:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2178:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2864:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2952:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2214:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3134:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2752:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2094:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2641:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2360:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2892:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2904:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2683:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2363:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2708:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2610:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2450:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2031:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2368:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2394:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2395:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2380:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3001:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2391:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3103:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3103:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2217:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2465:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2155:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2464:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2397:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2861:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2195:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2598:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2879:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2230:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2945:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2528:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2919:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.3415:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2745:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.3054:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2436:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2641:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2595:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2406:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2628:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2248:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2848:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2641:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2360:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.3205:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.1890:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2238:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2597:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2250:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2489:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2446:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2534:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2146:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2634:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2263:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2482:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2949:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2992:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2760:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2681:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.3100:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2654:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2741:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2779:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2432:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2896:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2734:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2383:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2671:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2285:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.3389:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2259:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2774:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2812:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2493:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2403:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.3050:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.3184:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2538:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2205:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2924:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2611:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2792:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2865:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2944:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2881:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2556:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.3221:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2810:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2842:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.1965:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2673:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2684:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2799:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2631:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2829:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2865:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2643:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2643:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2702:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2426:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2208:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2895:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2437:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2687:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2629:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2827:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2085:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2263:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2031:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2390:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2576:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2340:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2711:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.3072:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2236:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2607:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2359:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2366:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2146:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2280:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2654:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2326:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2701:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2312:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2585:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2516:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2327:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2328:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2688:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2375:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2728:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2499:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2410:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2830:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2548:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2382:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.3072:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2398:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.1871:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2407:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.3035:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2356:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2665:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2399:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2798:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2980:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2214:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2590:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2319:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2584:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2422:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.3013:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2610:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2440:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2216:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.3007:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2276:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2780:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2493:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2584:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2948:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2729:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2641:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2931:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2794:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2515:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2890:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2501:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2113:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2138:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2521:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.3186:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2315:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2776:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2576:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2556:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2253:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2253:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2463:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2441:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3157:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2351:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2362:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2444:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3017:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2721:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2241:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2998:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2225:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2416:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2699:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2669:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2689:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2917:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2000:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2996:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2461:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3088:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2827:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3040:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2547:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3126:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2886:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2449:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2645:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2263:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2186:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3077:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2558:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2876:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2506:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2791:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2594:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2274:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2753:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2344:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2585:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2296:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2458:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2821:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2238:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2595:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2521:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2841:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2645:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2121:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3212:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2987:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2541:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2867:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2586:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2720:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2575:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2621:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2481:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2337:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3089:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2270:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2796:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2614:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2672:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2355:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2612:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2409:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2393:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2248:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2584:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2563:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2376:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2924:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2625:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2402:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2628:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3491:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2418:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2528:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.1392:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.1392:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2274:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3161:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2484:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3034:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2387:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3166:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2765:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3171:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2687:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2177:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2693:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2814:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2470:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2667:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2541:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2608:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2631:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2181:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2452:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2787:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2460:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2640:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2223:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2128:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2776:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2461:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3141:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2491:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2438:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2866:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2458:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2620:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2548:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2499:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2918:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2305:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3262:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2567:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2800:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2499:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3033:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2698:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2257:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3253:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2348:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3372:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2188:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2362:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2576:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2597:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2684:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2571:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2702:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2602:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2104:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2355:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2902:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2331:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2756:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2419:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2317:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2660:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2333:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2724:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2504:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2184:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2740:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2298:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2744:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2409:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2577:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2785:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3037:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2566:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2239:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2176:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2880:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2825:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.1699:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.1699:  29%|██▉       | 117/401 [01:13<02:19,  2.03it/s]training loss: 0.2265:  29%|██▉       | 117/401 [01:13<02:19,  2.03it/s]training loss: 0.2010:  29%|██▉       | 117/401 [01:13<02:19,  2.03it/s]training loss: 0.3343:  29%|██▉       | 117/401 [01:13<02:19,  2.03it/s]training loss: 0.2245:  29%|██▉       | 117/401 [01:13<02:19,  2.03it/s]training loss: 0.2478:  29%|██▉       | 117/401 [01:13<02:19,  2.03it/s]training loss: 0.2431:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2927:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2563:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2479:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.3035:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2390:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2489:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2126:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2681:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2435:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.3168:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2217:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2540:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2993:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2149:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2209:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2648:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2840:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.1939:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2897:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2481:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2184:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2200:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2097:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.3319:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2590:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2867:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2839:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.3104:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2572:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.3304:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2048:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2680:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2651:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2751:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2876:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2288:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2946:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2374:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2926:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2415:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2480:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.1911:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2751:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2306:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2283:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2551:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2798:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.3012:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2732:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2304:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2257:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2799:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2573:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2806:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2733:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2500:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2511:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2638:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2336:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2464:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2587:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2307:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2550:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2793:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2862:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2384:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.3365:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2764:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2546:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2511:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2419:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2304:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.1821:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.1821:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2514:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2820:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2760:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2999:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2972:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2272:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2258:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2533:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2455:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2506:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2405:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2675:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2200:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2166:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.1965:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.3071:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2896:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2349:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2332:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2501:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2444:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2603:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2595:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2273:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2705:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2833:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2877:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2649:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2666:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2627:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.3049:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2194:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2605:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2669:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2485:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2282:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2932:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.3241:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2557:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2456:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2405:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2471:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2634:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2511:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2243:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2688:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2961:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2781:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2647:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2967:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2642:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2187:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2592:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2607:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2381:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2610:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2859:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2295:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.3044:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2314:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2408:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2160:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2460:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2455:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2679:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2313:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2203:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.3382:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2423:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2070:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2602:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.3024:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2680:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2625:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2702:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2483:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2540:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2770:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.3669:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.3669:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2845:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2122:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2864:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2236:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2005:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2731:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.3429:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2584:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2965:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2594:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2398:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2539:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2811:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2585:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2741:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2287:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2403:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2024:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2387:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2686:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.3099:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2669:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2608:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2676:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2941:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2460:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2514:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2361:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2317:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2245:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2597:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2225:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.3040:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2640:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2750:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2603:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2768:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2378:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2722:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2582:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.3198:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.3012:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2294:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2198:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2499:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2965:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2741:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2303:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2302:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2787:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2401:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2518:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2599:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2138:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.3189:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2336:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2418:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2486:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2943:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2716:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2085:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2276:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2651:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2409:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2909:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2762:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2158:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2115:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2745:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2278:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2960:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2403:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.3658:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2855:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2455:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2189:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2828:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2835:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.1679:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.1679:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.3694:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2847:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2302:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2941:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2477:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2607:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2350:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2352:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2196:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2765:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2883:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2846:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2411:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2633:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2472:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.3024:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2665:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2807:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2740:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2229:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.3124:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2324:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2595:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2889:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2631:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2537:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2907:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2001:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2548:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2734:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2785:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2411:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.3214:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2540:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2482:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2429:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2989:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2365:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2033:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.3111:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2812:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2491:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2590:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2468:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2734:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2377:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.3308:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2363:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2559:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2552:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.3058:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2487:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.1916:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2422:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2873:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2620:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2453:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2425:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2636:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2623:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2469:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2600:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2735:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2374:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2707:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2807:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2507:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2331:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2856:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2705:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2595:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2415:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2726:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2333:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2535:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2423:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2321:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2312:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2824:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2824:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2441:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2296:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3069:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2639:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2761:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2795:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2019:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2625:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2234:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2062:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2588:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2721:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2486:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2632:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2512:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2766:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2980:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2545:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2819:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2359:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2639:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2560:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2257:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3028:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2826:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2481:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2493:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2267:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2562:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2506:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2643:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2217:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2666:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2186:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2756:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2303:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2539:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2501:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2834:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2247:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2441:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2648:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3388:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2348:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2937:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2373:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2781:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2233:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3001:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2937:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2371:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2743:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2740:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2691:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2497:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2545:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2131:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2519:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3076:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3625:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2415:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2807:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2678:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2725:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2477:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2297:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2802:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2683:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2549:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2441:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2737:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2619:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2456:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3087:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2873:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3441:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3550:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2399:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.1094:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.1094:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.1972:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2631:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2046:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2916:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2599:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2833:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2150:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2993:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2915:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.3398:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2542:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2763:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.3143:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.3056:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2683:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2493:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2425:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.3488:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.3157:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2280:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2316:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2634:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2559:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2428:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2398:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2083:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2584:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2574:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2335:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2446:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2292:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2775:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2828:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.1751:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2291:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2494:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.3030:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.3024:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2508:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2130:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2280:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2311:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2170:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2019:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2453:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2606:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2996:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2770:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2049:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2943:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2768:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2527:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.3195:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2461:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2443:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2380:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2974:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2665:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2658:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2640:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2848:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2216:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2565:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2633:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2894:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2677:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2338:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2401:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2306:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2449:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2638:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2761:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.3396:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2448:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2516:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2909:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2634:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2892:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2547:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2547:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2804:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2573:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2559:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2823:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2978:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2174:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2685:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2715:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2629:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2730:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2616:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2153:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2313:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2664:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2390:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2496:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2518:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2593:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2739:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2323:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.3263:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2021:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2888:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2960:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2825:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2242:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2662:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2560:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2788:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2458:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2145:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2721:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2190:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2192:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2827:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.3027:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2395:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2364:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2726:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2520:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2231:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2361:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2767:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2661:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2686:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2406:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2684:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2298:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2626:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2281:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2600:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2848:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2643:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2518:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2226:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2735:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2301:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2748:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2514:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2499:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2837:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2872:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2781:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2739:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2572:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2453:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2745:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2960:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2271:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.1856:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2491:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2666:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2074:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2047:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2582:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.3171:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2640:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2514:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.3807:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.3807:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2591:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2225:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2764:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2952:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2126:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2663:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2256:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.1937:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2695:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2346:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2925:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2275:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2742:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2864:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2894:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2589:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2915:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2859:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3475:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2334:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2754:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3248:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2560:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2803:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2323:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2746:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2686:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2755:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3135:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3057:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2396:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3068:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2282:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2267:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2217:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3139:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3077:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2815:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3168:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2571:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2357:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.1930:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2117:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2822:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2179:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2765:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2869:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3251:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2636:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2609:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2539:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2944:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2639:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2328:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2398:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2998:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2434:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3033:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2364:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2193:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2864:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3020:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2537:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2422:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2763:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2146:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2398:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2888:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2286:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2394:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2309:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2435:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2670:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2066:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2271:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2472:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3268:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2601:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3853:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3853:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2448:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2599:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.3191:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2302:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2213:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2789:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2381:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2287:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2355:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.3012:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2130:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2604:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2606:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2860:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2461:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2475:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.3127:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2381:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2776:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2311:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2865:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2791:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2164:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2399:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2423:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2868:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2769:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2958:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2345:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2423:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2577:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2170:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2651:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2837:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2572:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2566:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2709:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2944:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2720:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2758:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2912:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2458:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2381:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2742:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2264:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2604:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.3051:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2643:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2072:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2460:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2734:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2253:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2931:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2318:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2801:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2995:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2118:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2528:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2911:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2639:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2818:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2343:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2572:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2548:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2561:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2744:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2773:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2364:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2767:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2578:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.3175:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2821:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.3441:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2254:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2818:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2789:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2836:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2625:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.4311:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.4311:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2330:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2942:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2618:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2439:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2464:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2717:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2431:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2946:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2419:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2666:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2120:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2593:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2450:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2429:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2782:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2699:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2399:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2972:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2462:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2441:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2669:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2434:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.3220:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2903:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2330:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2463:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2675:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2882:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2764:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2521:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2940:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2925:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2505:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2321:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2421:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2517:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2690:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2466:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.1977:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2435:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2686:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2340:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2513:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2434:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2507:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2871:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.3164:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2895:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2325:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2621:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2469:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2078:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2643:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2933:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2639:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2419:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2393:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2271:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2527:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2375:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2514:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.3082:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2467:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2007:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2740:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2475:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2476:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2285:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2623:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2580:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2379:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2564:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2523:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2737:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2796:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2468:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2893:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2598:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.1227:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.1227:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2332:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2906:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2468:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2317:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2849:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2404:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2488:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2140:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.3112:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2023:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2428:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2584:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2608:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2548:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.1874:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2287:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2549:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2490:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2763:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2715:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2935:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2029:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2288:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.3051:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2700:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2826:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2764:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2379:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.3133:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2950:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2929:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2855:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2340:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2322:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2057:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2583:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2640:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2628:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.3107:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2819:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2972:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2926:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2434:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2266:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2578:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2773:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2207:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.1956:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2274:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2454:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2612:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.3113:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2538:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2635:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2740:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2574:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2538:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2774:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2320:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2202:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2760:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2524:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2749:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2917:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2563:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2926:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.3402:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2851:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2276:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2440:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2574:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2500:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2365:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2618:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2356:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2713:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2447:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2789:  32%|███▏      | 127/401 [01:21<02:08,  2.14it/s]training loss: 0.2741:  32%|███▏      | 127/401 [01:21<02:08,  2.14it/s]training loss: 0.2741:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2447:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2525:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2795:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2229:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2660:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2860:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3156:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2784:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2611:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2400:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2975:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2241:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2472:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2638:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2666:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2438:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2058:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2794:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3105:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2140:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2097:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2720:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2426:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2251:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.1966:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2879:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2809:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2089:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2681:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2578:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2502:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2919:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2482:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2690:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2731:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2312:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2943:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2305:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2682:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2288:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2339:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2998:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2903:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2555:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2859:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2439:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2106:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2199:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3054:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2636:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2333:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2545:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2047:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2946:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2235:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2451:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2619:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2732:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3186:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2484:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3089:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2292:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3082:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2713:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2271:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2192:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2037:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2521:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3316:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2285:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2465:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3392:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2425:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2738:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2260:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2825:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3204:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2621:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2366:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2366:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.1878:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2102:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2700:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2623:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2921:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2886:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2301:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3015:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2256:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2434:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2553:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2153:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2567:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2260:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2653:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3052:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3405:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2065:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2502:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2933:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2318:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2633:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2434:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3006:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3061:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3207:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2470:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2278:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2820:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2849:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2660:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3271:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2663:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2355:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2555:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2387:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2072:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2699:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2913:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2910:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2850:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2511:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.1980:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3258:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2762:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2567:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2621:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2640:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2918:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2575:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2760:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2446:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2868:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2517:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2460:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3127:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2674:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2763:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2922:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3106:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2075:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2439:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2956:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.1954:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2398:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2634:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2430:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2911:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2228:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2216:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2430:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3059:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2593:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2639:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2822:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3387:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2227:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2548:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2544:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2544:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2629:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2975:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2432:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2674:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2823:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2847:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2504:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2959:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2378:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2611:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.3497:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2158:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2498:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2274:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2655:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2684:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2742:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2411:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.1923:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2746:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2301:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2337:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2412:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2827:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2411:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.1972:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2891:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.3300:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.3114:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2225:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2502:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2865:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2743:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2615:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2452:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2349:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.3112:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2506:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2597:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2405:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2048:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2747:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2522:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2685:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2582:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.3083:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2594:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2676:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2454:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2746:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2161:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.3049:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2936:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2350:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2630:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2722:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2445:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2783:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2227:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2753:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2122:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2233:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2951:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2283:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2899:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2616:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2557:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2267:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2704:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.3186:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2037:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2196:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2056:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2572:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2710:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2377:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2348:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2934:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.3384:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.3384:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2354:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2583:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2596:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.3196:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2470:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2681:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2391:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2332:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2019:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2358:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2279:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2115:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.3098:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2334:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2160:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2676:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2537:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2819:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2395:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2200:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2415:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2853:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2358:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2481:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2305:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2477:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2383:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2671:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2905:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2799:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2335:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2948:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.3115:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2315:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.1982:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2612:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2304:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2468:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2466:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2881:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2507:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2745:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2607:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2685:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2846:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2423:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2132:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2629:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2582:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2927:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2261:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2550:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2345:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2337:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2354:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2211:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2682:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2746:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2617:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2362:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2260:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2780:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2573:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2617:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.3153:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2477:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2727:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2484:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2584:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2455:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2136:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2315:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2989:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2660:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2384:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.3089:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2701:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2796:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2830:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2830:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2439:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3900:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2784:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2442:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2318:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2265:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2887:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3235:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2244:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2592:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2541:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3271:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2880:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2442:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3130:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2750:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3184:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2597:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2484:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2606:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2316:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2109:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2376:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2592:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2530:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2426:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2775:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3115:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2453:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2503:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2255:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2637:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2302:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2795:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2171:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2543:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2730:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2947:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2904:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2032:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2902:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2146:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2737:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2522:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2673:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2136:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2310:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2735:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2748:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2317:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2452:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2464:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2656:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2360:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2454:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2968:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.1786:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2688:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2625:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2205:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2947:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2859:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2029:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2584:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2439:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2139:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3335:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2523:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2193:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2120:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2765:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2423:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2443:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2425:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3012:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3624:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2418:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2544:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2688:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2688:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2098:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2480:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2719:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2928:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2831:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2662:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2726:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2655:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2689:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2420:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2447:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2286:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2681:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2615:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2572:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2468:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2561:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2835:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2574:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2656:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2241:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2163:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2649:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2669:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2416:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2752:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2513:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.1962:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2639:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2414:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2733:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2451:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2273:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2240:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2489:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2497:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2493:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2520:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2113:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.3046:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2269:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.1998:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2403:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2464:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2501:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2914:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2755:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.3110:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2242:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2853:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2261:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2465:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2881:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2669:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.1922:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2924:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2397:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2228:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2067:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2747:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2599:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2672:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2705:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2642:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2481:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2913:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2070:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2249:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2202:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.3404:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.3102:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2757:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2650:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2859:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2597:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.3004:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2323:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2599:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2292:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2292:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2729:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2638:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2439:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2252:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.3203:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2829:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2422:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2361:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2269:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2491:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2251:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2569:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2500:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2415:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2389:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2435:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2438:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2685:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2531:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2699:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2978:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2319:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2468:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2638:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.3012:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2545:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2963:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.3049:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2530:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.3086:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2442:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2708:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2139:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2286:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.3230:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2888:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.3092:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2664:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2329:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2467:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2350:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2527:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2217:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2323:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.3000:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2931:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2494:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.3163:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2475:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2532:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2519:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2187:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2609:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2417:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.1744:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2669:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2007:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2601:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2017:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2887:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2744:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2200:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2436:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2476:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2575:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2407:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2742:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2645:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2017:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2765:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.3118:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.3034:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2795:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2450:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2431:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2238:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2267:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2483:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2976:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2976:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2236:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2564:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2096:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2545:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2367:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2987:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2338:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2692:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2474:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2858:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2479:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2951:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2582:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2279:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2128:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2956:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2604:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3073:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3029:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2733:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2656:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2932:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2541:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2479:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2583:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2762:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2307:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2358:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2482:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3316:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2529:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.1885:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2022:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2922:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3100:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3012:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2433:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2671:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2116:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2848:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2607:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2654:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2801:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2602:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2321:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2901:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2563:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2585:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2140:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.1970:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2449:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3121:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2643:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2287:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3133:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2268:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2354:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3123:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2135:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2624:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2925:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2516:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2022:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2429:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2198:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2974:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2376:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2819:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2570:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2973:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3052:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2696:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3140:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2210:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2342:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2586:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2524:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2530:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3142:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3142:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2507:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2484:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2476:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2736:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2377:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2127:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2172:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2325:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2998:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2358:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2419:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.3121:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2527:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2331:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2311:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2733:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2377:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2962:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2492:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2555:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2139:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2771:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2882:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2272:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2859:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2726:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.1989:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2164:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.1980:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2594:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.3113:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.3157:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2550:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2670:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2843:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2913:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2833:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2403:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2620:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2348:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2642:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2198:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2997:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2738:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2414:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2943:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.1986:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.3000:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2307:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2727:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2734:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2772:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2588:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2192:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2466:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2421:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2578:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2925:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2347:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2731:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2231:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2396:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2599:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2218:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2378:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2655:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.1842:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2346:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2365:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2589:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2799:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2519:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2725:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2201:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2085:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2144:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2508:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2480:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.1533:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.1533:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2670:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2353:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2456:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2818:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2780:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2544:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.3022:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2788:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2413:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2956:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2578:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2660:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2473:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2755:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2242:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.3598:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2642:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2660:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.3046:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2889:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2612:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2296:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2966:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2560:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.3385:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2204:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2360:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2987:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2330:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2764:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2514:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2385:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2126:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2446:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2583:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2499:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2584:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.3291:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2503:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2509:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2387:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2462:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2583:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2433:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2994:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2581:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2411:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2659:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.3155:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2735:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2055:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2571:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2406:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2156:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2765:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2485:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2656:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2313:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2814:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2330:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2139:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2580:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2513:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2416:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2726:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2520:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2710:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2436:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2565:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2325:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2694:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2380:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.3052:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2146:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2545:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2843:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2799:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2228:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.3269:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.3269:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2532:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2303:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2424:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2574:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2835:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2271:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2955:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2672:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2263:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2930:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2664:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2072:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2040:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2731:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2814:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2007:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2379:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2392:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2727:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2900:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2320:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.3156:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2790:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.3462:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2254:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2588:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2547:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2677:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2150:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2517:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2242:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2307:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2879:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2487:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2239:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2448:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2583:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2431:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2409:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2774:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2390:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.3031:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2698:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2766:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2374:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2240:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2396:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.3379:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2672:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2104:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2568:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2662:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2807:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2367:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2493:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2553:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2683:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2201:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2683:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.1920:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2677:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2664:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2667:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2635:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2338:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2245:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2692:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2816:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2710:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2596:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2971:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2339:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2284:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2842:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2435:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2182:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2261:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.3117:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.1945:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.1945:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2457:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2521:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2664:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2774:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2361:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2654:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.1943:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2711:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2507:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2503:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2798:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2449:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2241:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.3304:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2691:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2604:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2453:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2520:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2376:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2146:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2254:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2693:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2879:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2853:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2335:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2625:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2597:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.3149:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2618:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.3298:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2519:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2338:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.1987:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2632:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2063:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2895:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2880:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2739:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2829:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2293:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2555:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.3974:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2276:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2481:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2740:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2328:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2333:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2928:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2203:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2294:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2109:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2445:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2977:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2373:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2377:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2459:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.1779:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2438:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.3110:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2545:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2762:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2691:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2271:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2574:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2205:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2139:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2539:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2289:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2020:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2436:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2115:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2640:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2518:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2886:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.3082:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2626:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2675:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2507:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2333:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2333:  35%|███▍      | 140/401 [01:27<01:42,  2.54it/s]training loss: 0.2463:  35%|███▍      | 140/401 [01:27<01:42,  2.54it/s]training loss: 0.2625:  35%|███▍      | 140/401 [01:27<01:42,  2.54it/s]training loss: 0.3058:  35%|███▍      | 140/401 [01:27<01:42,  2.54it/s]training loss: 0.2988:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2286:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2372:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2591:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2544:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2324:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2512:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2755:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2824:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2724:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2180:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2551:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2665:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2112:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2020:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2469:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2520:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2737:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3189:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2648:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2865:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3018:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3134:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2765:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2151:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2658:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3587:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2456:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2774:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2422:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3440:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2262:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3021:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2886:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2519:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2752:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2450:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2616:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2387:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3017:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2448:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2734:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2603:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2593:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2628:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2935:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2481:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2415:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2602:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2439:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2013:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2703:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2605:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2428:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3205:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2301:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2347:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2736:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2913:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2817:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2914:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2511:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2545:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2444:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2982:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2474:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2710:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2855:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3122:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3097:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2644:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2272:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2662:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2483:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2652:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2407:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2407:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2891:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2863:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2386:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2798:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2775:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2272:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2769:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2627:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2391:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.3162:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2570:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2030:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2771:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2421:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2727:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.1943:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2804:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2462:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2233:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2784:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2849:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2436:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2667:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2793:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2490:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2488:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2447:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2186:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2225:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2865:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2368:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2840:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2092:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.1903:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2118:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2652:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2024:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2063:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2500:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2932:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2264:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2264:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2139:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2489:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2430:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2423:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2653:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2328:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.1826:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2933:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2260:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2580:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2333:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2978:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2608:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2363:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2461:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2759:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.3012:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2408:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2009:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2375:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2815:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2513:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2383:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.1653:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2914:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.3231:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.1885:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2696:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2270:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2216:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2708:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.3017:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2384:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2727:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2436:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2380:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.1080:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.1080:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3383:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2296:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2087:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3408:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2518:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2532:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3098:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2125:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2286:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2483:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2977:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2416:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2645:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2394:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2102:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2267:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2142:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3026:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2532:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2397:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2813:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2296:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2797:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2507:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3122:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2257:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2472:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2532:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3088:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2849:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3109:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2579:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2374:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2200:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2294:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3028:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2823:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2722:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2430:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3353:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2794:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2227:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2705:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2377:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2603:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2815:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2155:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2667:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2622:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2631:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2615:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2587:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2065:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2367:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2863:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3177:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3463:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2445:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2372:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2680:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2205:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2290:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2686:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2795:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2465:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2202:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2265:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2010:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2491:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2500:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2664:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2017:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2964:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3001:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2433:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3374:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2645:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2563:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.1998:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.1998:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2331:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2961:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.1751:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.3062:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2543:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2266:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2430:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.1844:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2442:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.1863:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2544:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2273:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2371:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2573:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2468:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2888:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2935:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2339:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2537:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2599:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2642:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2628:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.1922:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2923:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2298:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2314:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2469:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2602:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2218:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2849:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2223:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2367:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2379:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2716:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2599:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.1971:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2426:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2090:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2346:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2325:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2445:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2571:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2408:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2256:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2504:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2505:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.3287:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2681:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2058:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2444:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.1910:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2487:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2488:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2178:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2359:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2904:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2567:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2895:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2427:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2851:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2308:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2665:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2140:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2691:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2937:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2437:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2794:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2177:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2900:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2045:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2855:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.3041:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2476:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2560:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2890:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.3272:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2957:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2369:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2927:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2927:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2706:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2378:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2231:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2722:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2376:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2425:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2813:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2162:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2904:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2940:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2556:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2311:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2138:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2389:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2888:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2507:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2673:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2572:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2965:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2320:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2259:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2508:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2449:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.3047:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2275:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2433:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2492:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2214:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2612:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.3209:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2400:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2404:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2001:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2352:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2507:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2909:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2711:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2603:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2037:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2458:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2381:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2333:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2801:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2629:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2169:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2720:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2541:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2266:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2556:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2616:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2640:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2429:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2629:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2326:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2399:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2848:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2814:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2921:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.3481:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2389:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2773:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2407:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2001:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2524:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2495:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.3009:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2480:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.3146:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2676:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2655:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2443:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2630:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2084:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2307:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2550:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2832:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2436:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2391:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.3711:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.3711:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2479:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2933:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2366:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2970:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2241:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.3323:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2752:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2594:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2394:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.3215:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2509:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2599:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2846:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2911:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2706:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2351:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2601:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.3071:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2920:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2489:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2209:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2682:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.3019:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2511:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2703:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2589:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2140:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2425:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2732:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2345:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2452:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2939:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2528:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2534:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2677:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2795:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2724:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2689:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2790:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2004:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2528:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2719:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2655:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2756:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2801:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2664:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2271:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2757:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2700:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2543:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2317:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2514:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2392:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2922:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2917:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2023:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2537:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2291:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2356:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.1967:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2500:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2787:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2391:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2254:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2434:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2804:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2645:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2364:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2813:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2369:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2276:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2779:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2808:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2539:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2451:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.1976:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2428:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2757:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2425:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2425:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2622:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2742:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2366:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.3000:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2845:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2433:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2350:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2877:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.3287:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.3097:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2066:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2150:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2174:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2689:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2469:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2740:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2093:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2446:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2707:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2675:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2626:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2336:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2119:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2437:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2661:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2087:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2657:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2738:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2493:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2823:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.3151:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2569:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2374:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2099:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2242:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.3001:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.3162:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2581:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2864:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2520:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2610:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2894:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2672:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2847:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2599:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2843:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2050:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2106:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2696:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2767:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2326:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2429:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2751:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2683:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2348:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2987:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2288:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2873:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2786:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.1906:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2127:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2329:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2550:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2532:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2647:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2554:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2839:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2598:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2267:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2433:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2718:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.3252:  36%|███▋      | 146/401 [01:33<02:06,  2.01it/s]training loss: 0.2179:  36%|███▋      | 146/401 [01:33<02:06,  2.01it/s]training loss: 0.2734:  36%|███▋      | 146/401 [01:33<02:06,  2.01it/s]training loss: 0.2840:  36%|███▋      | 146/401 [01:33<02:06,  2.01it/s]training loss: 0.2804:  36%|███▋      | 146/401 [01:33<02:06,  2.01it/s]training loss: 0.2428:  36%|███▋      | 146/401 [01:33<02:06,  2.01it/s]training loss: 0.2422:  36%|███▋      | 146/401 [01:33<02:06,  2.01it/s]training loss: 0.2233:  36%|███▋      | 146/401 [01:33<02:06,  2.01it/s]training loss: 0.2233:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2788:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2955:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2424:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2573:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2348:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2710:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2323:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2613:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.3103:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2036:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2326:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2973:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2359:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2419:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2087:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.3507:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.3181:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2393:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2960:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2859:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2644:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2481:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2738:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2239:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2693:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2203:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2399:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2574:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2412:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.1995:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2266:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2418:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2708:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.3214:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2737:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2433:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2230:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2433:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2615:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2760:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2593:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2737:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2924:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2464:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2086:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2381:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.1665:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2976:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2375:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2604:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2760:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2386:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2307:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2682:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2548:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2538:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2969:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2423:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2762:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2761:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2515:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2456:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2477:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.1928:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2246:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2136:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2528:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2060:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2627:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2784:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2597:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2639:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2440:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2743:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2243:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2518:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2623:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2202:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2823:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2823:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2017:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2452:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2494:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2595:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2294:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2677:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.1974:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2396:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2439:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2764:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2415:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2871:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2519:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2521:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2358:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2731:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2247:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2512:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2777:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.3043:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2176:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2561:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2402:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2551:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2211:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2591:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2387:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2499:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2210:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2059:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2001:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2752:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2693:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2381:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2268:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2574:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2465:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2359:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.1999:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2705:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2146:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2636:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2654:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2536:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2665:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2599:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2815:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2462:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2763:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2838:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2994:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2777:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2368:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2911:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2187:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2551:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2403:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2496:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2498:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2703:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2411:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2550:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2640:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.1955:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2246:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2260:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2430:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2124:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2835:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2841:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2243:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2335:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2437:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2591:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2638:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2499:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2317:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2817:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2328:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2328:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2861:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2771:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2092:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2864:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2358:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2000:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2483:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2696:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2213:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2662:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2778:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2262:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2590:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2577:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.3062:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2065:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2143:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2041:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2701:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2559:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2469:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2808:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2343:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2264:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2408:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2672:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2124:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2814:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2706:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2552:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2175:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2694:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2217:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2647:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2367:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2591:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.3225:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.3389:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.1957:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2832:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2285:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2437:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2401:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2886:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2685:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2583:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2247:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2578:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2403:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2783:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2796:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2237:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2781:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.3693:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2488:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2329:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2992:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2359:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2631:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2114:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2526:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2166:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2529:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.3337:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2764:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2362:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2459:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2560:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2176:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2542:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2710:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2246:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.3086:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2914:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2695:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2925:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2453:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2176:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.1900:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.1900:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2919:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2208:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2407:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2287:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2387:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2599:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2313:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2567:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2282:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2516:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2035:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2462:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2600:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2443:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2793:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2743:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2631:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2721:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2587:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2552:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.3278:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2810:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2328:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2604:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2373:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2195:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2600:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2763:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2703:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2850:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2160:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.3345:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2439:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2492:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2761:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.1995:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2544:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2406:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2698:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2032:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2510:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2395:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.3188:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2537:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2585:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2664:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2029:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2423:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2772:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2601:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2832:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2701:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2730:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2417:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.3001:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.3096:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2462:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2684:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2695:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2625:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2359:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2934:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2383:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2590:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2615:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2453:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.3012:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2857:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2868:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2526:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2680:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.3034:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2919:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2489:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2494:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2497:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2936:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2487:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2255:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2255:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2691:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2168:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2984:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2327:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3046:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2806:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2309:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2658:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2730:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3001:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2434:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2248:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2483:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2973:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2163:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2629:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2271:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3175:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2420:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2601:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2778:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3390:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2494:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2711:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2329:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2033:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2520:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2402:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3051:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2614:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2235:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2804:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2408:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2571:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2481:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2315:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2105:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2359:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2352:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2173:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2791:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2825:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3265:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2200:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3196:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2245:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2507:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3092:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2613:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2199:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2234:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.1990:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2233:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2704:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2106:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3042:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2350:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2680:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2839:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2950:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3344:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2740:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2045:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2229:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2617:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2875:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2567:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2163:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2475:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2223:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2326:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2531:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2288:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2906:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2460:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2097:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2259:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2348:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2640:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2640:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2174:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2306:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2736:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2285:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.1916:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2886:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2669:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2885:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2137:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2768:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2081:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2604:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2781:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2179:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2486:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2597:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2477:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2599:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2494:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2826:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2183:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2600:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.3367:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.1969:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2120:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2637:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2393:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.1995:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2206:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2280:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2004:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2165:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2377:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2375:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2334:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2218:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2945:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2625:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2572:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.3042:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2631:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.3131:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2490:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2396:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2428:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2613:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.3008:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2351:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2532:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2659:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.1922:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2639:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.3256:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2766:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2166:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2452:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2433:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2590:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2570:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2423:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2484:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2743:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2184:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2472:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.1735:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2025:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2828:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2447:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2103:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2668:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2614:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2232:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2119:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2576:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2756:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2377:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2377:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2670:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.3100:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.3100:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2229:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.1912:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2026:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2577:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2401:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2433:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2591:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.1707:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2230:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.3031:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2785:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2896:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.3215:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2662:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2973:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2331:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2308:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2178:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2585:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2765:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2345:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.3026:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2783:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2458:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2298:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2491:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2258:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2280:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2416:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2486:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2066:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2221:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2602:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.1756:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2111:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2083:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2390:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2417:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.3173:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2357:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2553:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2687:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2042:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2755:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.1723:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2459:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.1724:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2584:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.3134:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2146:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2482:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2864:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2763:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2464:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2354:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2348:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2337:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2740:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2715:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2374:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2830:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2169:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2269:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.1979:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2175:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2616:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2695:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2494:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2518:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2167:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2197:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2814:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2295:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2594:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.3195:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2466:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2365:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2344:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.1182:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.1182:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2776:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2055:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2571:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2652:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2554:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2669:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2853:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2580:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2124:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2997:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2401:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2440:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2838:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2207:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2571:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2478:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2695:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2617:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2299:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2029:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2942:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2251:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.3250:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.3154:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2997:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2143:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2533:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2440:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2117:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2467:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2334:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2670:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2772:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2500:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2460:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2344:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2449:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2314:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2302:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2225:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2585:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2351:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2775:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2174:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2336:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2847:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2809:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2590:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.1975:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2592:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2477:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.1995:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2503:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2103:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.3237:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2350:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.3002:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2377:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2504:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.3100:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2302:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2484:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.3091:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2906:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2732:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2471:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2837:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.3117:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2658:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2864:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2496:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2050:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2618:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2367:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2169:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2766:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2386:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2166:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2711:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2711:  39%|███▊      | 155/401 [01:38<02:32,  1.61it/s]training loss: 0.2499:  39%|███▊      | 155/401 [01:38<02:32,  1.61it/s]training loss: 0.2170:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2031:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.3133:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.3004:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2775:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2704:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2875:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2699:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2518:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2218:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2387:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2610:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2106:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2461:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.3010:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2683:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2588:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2224:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.1806:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2634:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2387:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2046:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2711:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2782:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2135:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2010:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2744:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2495:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2611:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2391:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2163:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2733:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2447:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2143:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2576:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2285:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.1876:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2063:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2822:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2155:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2605:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2792:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2629:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2415:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2978:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2071:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.1756:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2475:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2355:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2291:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2424:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2087:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2499:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2579:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2240:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2889:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2385:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2353:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2427:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2247:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2368:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2168:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2321:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.1993:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2373:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2367:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.1967:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2187:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2452:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2234:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.1883:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2924:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.1961:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.1990:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2293:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2875:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2170:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2812:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2812:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2168:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2784:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2448:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2020:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2545:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2683:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2729:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2268:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2893:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2636:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2945:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2110:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2581:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2564:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2654:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2056:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2779:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2231:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2734:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2290:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2793:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.1900:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2047:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2044:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2349:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2190:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2537:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2532:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2979:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2940:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2700:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2329:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2512:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2557:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2666:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.3140:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2554:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2847:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2699:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2509:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2916:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2481:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2819:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2614:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.1866:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2706:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2334:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.3016:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2304:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2578:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2525:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2090:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2918:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2597:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2411:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2401:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.3217:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2190:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2648:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2280:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2373:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2670:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2684:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2547:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2553:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2465:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2379:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2407:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2831:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2895:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2322:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2439:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2680:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2580:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.1816:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.3034:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2196:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2970:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2934:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2934:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.3010:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2223:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2927:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2420:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2397:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2458:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2326:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2159:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.1911:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2234:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2396:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2277:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2639:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2429:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2367:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2325:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2930:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2735:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2781:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2407:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2530:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2410:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2173:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.3021:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2376:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2228:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2000:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2282:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2542:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2768:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2050:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2501:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2981:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2292:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2946:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2441:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2214:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2161:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2412:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2490:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2456:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2062:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2316:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2760:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2867:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2251:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2559:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2624:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.3153:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2497:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2690:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.3666:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2317:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2389:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2600:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2843:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2441:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2311:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2843:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2330:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2397:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2300:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2694:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2070:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2173:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2160:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2252:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2855:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2519:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2082:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.1912:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2771:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2379:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2140:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2081:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2289:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2111:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2630:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.1235:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.1235:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2264:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2710:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2248:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2655:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2085:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2047:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2055:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2411:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2862:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2235:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2336:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.1957:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2792:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2602:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2341:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2778:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.3051:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2748:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2585:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2646:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2128:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2167:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2411:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2418:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2986:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2768:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2459:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.1741:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2165:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2842:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2754:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2870:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2141:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2887:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2126:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2304:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2764:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2182:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2466:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2402:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2173:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2264:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.1891:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2864:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2132:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2726:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2191:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2550:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.3148:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2237:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2794:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2444:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2525:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2320:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2364:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2188:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2088:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2320:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2788:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.1967:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.3063:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2562:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2391:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2652:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.1996:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2819:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2410:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2577:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2098:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2162:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2020:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2380:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.1993:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2434:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2172:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2477:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2327:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2638:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.1707:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.1707:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2256:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2139:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2163:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2809:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2725:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2569:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2208:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2283:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2741:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2654:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2691:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2749:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2830:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2243:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2242:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2815:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2087:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2679:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2594:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.1967:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2719:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2487:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2357:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.1887:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2581:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2392:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2670:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2833:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2816:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2215:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2495:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2656:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2300:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2529:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2456:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2241:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2716:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2859:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2085:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2396:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2217:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2174:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2578:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2648:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2409:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.3259:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2036:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2211:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2394:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2154:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2463:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2644:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2253:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2709:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.3130:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2813:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2383:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2513:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2167:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2653:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.1768:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2425:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2674:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2207:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2655:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2240:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2439:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2677:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2088:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2088:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2049:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2623:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2893:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2481:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2773:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2397:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2457:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2897:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.1329:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.1329:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2457:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.1887:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2719:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.3192:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2389:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2255:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2676:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2325:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2379:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2289:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2270:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2433:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2405:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2119:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2781:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2465:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2134:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.1760:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2824:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2272:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2214:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2077:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2970:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2661:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2189:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2117:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.1852:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2397:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2086:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.3158:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2251:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2240:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2798:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2352:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2101:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2282:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.1929:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2447:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2321:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2127:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2595:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2719:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2055:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2879:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2081:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.1974:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2813:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.1837:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2389:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2338:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2110:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2547:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2318:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2127:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2642:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2719:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2495:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.1854:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2459:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2741:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2605:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2120:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2178:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2281:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2813:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2461:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2690:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2706:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.3254:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2919:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2357:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2286:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2343:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2533:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2187:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2924:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2305:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2638:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.3089:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.3089:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2032:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2781:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2262:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.3084:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2380:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.1897:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2071:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2450:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2431:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2199:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.3272:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2669:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2554:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2731:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2226:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2546:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2576:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2911:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2672:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2589:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2196:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2622:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.1962:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2251:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2025:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2862:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2038:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2742:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2129:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2451:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2691:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2336:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.3302:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2625:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2435:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2244:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2232:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2043:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2076:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2672:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2345:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.1981:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2944:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2336:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2721:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.3011:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.3174:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2075:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2422:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2591:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2504:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2190:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2606:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2529:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.1741:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.3146:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2354:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2550:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2704:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.1993:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2373:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2209:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2584:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2773:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2429:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2136:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.1934:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2352:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2153:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2471:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2484:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2858:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2055:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2424:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2408:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2431:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2825:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2268:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2324:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2324:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2422:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2991:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2693:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2530:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2907:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2382:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2264:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2415:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2507:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2486:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2160:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2782:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2501:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2617:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2440:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2428:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2365:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2367:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2169:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2471:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2227:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2852:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2703:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2572:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2540:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2701:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2483:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2058:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2557:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2322:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2267:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2154:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2697:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.1896:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2585:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.1901:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2137:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2404:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2060:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2240:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2677:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2693:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2482:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2347:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2550:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2652:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2173:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2883:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2424:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2283:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.1940:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2616:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2175:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2448:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2371:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2433:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2458:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.3037:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2553:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2245:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2508:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2569:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2519:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.3159:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2485:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2453:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.3200:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2856:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2682:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2428:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2499:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2501:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2991:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.1963:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.3054:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2614:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2219:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2472:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2288:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2288:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2414:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2230:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2814:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2155:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2567:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2503:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2599:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2644:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2738:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2533:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2370:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2151:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2514:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.3000:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2400:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2434:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2736:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2406:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2501:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2710:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2823:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2409:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2630:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2145:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2189:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2750:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2831:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2561:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2491:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2784:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2747:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2211:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2497:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2579:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2183:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2296:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2733:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2508:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2561:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2786:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2513:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.1971:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2316:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2497:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2339:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2937:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2430:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2314:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.3089:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2280:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2787:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.3000:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2769:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2322:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2064:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2103:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2181:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2644:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2888:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2339:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2443:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2395:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2145:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2436:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2746:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2598:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2269:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2458:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2386:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2039:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.3503:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2776:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2334:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2451:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2425:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2358:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.1923:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2583:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.3941:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.3941:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2454:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2109:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2835:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2639:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2480:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2325:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2237:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.3051:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2500:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2346:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2605:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2169:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2115:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2591:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2474:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2427:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2040:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2550:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2462:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2316:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2244:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2368:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2478:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2362:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2249:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.1869:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2087:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2122:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2293:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2452:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2654:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2171:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2272:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2358:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2281:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2372:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2275:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2530:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.1767:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2023:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2211:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2877:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2138:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2622:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2303:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2318:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2542:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2144:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2992:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2025:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2793:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2774:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.3046:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2051:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2066:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2757:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2332:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2449:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2237:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2059:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2616:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2568:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2927:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2417:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2419:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2850:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2360:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.3001:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2287:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.1921:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2905:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2661:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2465:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2988:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.1847:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2455:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2264:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2231:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2792:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2792:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2177:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2316:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2510:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2118:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2238:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2196:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2307:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2430:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2594:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2372:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2586:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2858:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2147:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2359:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2328:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2512:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2806:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.1776:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2517:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2491:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2406:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2073:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2395:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2503:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2789:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2930:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2440:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2017:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2476:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2705:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2694:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2632:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2403:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2284:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2977:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2753:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.3163:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2802:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2037:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2300:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2507:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2657:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2330:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2413:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2112:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.1791:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2464:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.1829:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.3235:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2211:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2962:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2560:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2688:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2460:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2872:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2120:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2476:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.1953:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2506:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2681:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2279:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2168:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2493:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2317:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2058:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2354:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2507:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2561:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2892:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2558:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2413:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2214:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2243:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2071:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2520:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2200:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2203:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2681:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2717:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2717:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2622:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2368:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2496:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2285:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2734:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2397:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2706:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2025:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2114:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2488:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2696:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2092:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2597:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.3055:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2537:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2633:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2293:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2481:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2157:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2208:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2180:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.1901:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2348:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2321:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2327:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2828:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2103:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2684:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2584:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2110:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.3059:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2304:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2332:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2522:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2532:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2375:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2598:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2821:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2372:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2430:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.1751:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.1889:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2409:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2740:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2364:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.1756:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2242:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2359:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2617:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2702:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2812:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2337:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2783:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2426:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2547:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2318:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2537:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2450:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2486:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2401:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2765:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.1888:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2511:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.1744:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2628:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2810:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.1909:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2574:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2533:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2590:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2988:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.2503:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.2776:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.2157:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.2502:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.2449:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.3132:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.2550:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.2401:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.2401:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2148:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2508:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2261:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2365:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2688:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2510:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2463:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2695:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2331:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2097:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2255:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2994:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2781:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2687:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2223:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2574:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2470:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2703:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2984:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2429:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2474:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2623:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2127:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2538:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2980:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2336:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2534:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2318:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2415:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2891:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2722:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2548:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2139:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2153:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2096:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2029:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2446:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2491:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2621:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2045:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2714:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.1847:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2109:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2342:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.1981:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2412:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2592:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2499:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2732:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2347:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2125:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2594:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2784:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2232:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2612:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.1991:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2704:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2628:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2897:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2104:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2858:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2123:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2273:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2627:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2545:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.3081:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.1907:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2471:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2308:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2513:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2900:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2115:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2172:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2809:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2201:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2257:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2964:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.3044:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.3548:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.3548:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2316:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2396:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2040:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2288:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2480:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2217:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2173:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2360:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2266:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2564:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2684:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2426:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2748:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2206:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2810:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2331:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2476:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.1900:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2208:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2345:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2270:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2002:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2433:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2089:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.1900:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2928:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2495:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2173:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.1896:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2235:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2719:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2501:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2532:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2670:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2201:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2606:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2777:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2692:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2627:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2794:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2297:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2856:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2680:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2526:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2668:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2476:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2138:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2631:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2114:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2797:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2561:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2041:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.3184:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2468:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2294:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2613:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2224:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2412:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2328:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.1985:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2197:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2431:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2327:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2662:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2761:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2287:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2290:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2585:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2756:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2149:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2210:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2613:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2604:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2220:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2417:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2334:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2548:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.3016:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2618:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2618:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2430:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2260:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2465:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2541:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2287:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2478:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2274:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2888:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2068:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2024:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2388:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2018:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2652:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2182:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2899:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.1963:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2694:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2563:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2795:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2368:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2206:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2209:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2637:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2758:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2847:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2931:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2251:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2026:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2227:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2372:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2098:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2203:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2260:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2273:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2153:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2011:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2530:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2912:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2048:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2158:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2812:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2136:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2577:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.1895:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2513:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2425:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2358:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2386:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2329:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2690:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2845:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2380:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2249:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2741:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2197:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2541:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2681:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2286:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2556:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.1948:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2612:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2119:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.3393:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2363:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2468:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2360:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2109:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2091:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2117:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2297:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2111:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2211:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2597:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2467:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2657:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2218:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.1949:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2274:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.1706:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.1706:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2678:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.1715:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2227:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2655:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2455:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2632:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2501:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2441:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2468:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2219:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2380:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2235:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.1902:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2095:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2225:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2273:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2439:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2606:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2530:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.3107:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2583:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2145:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2468:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2531:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2526:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2656:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2142:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2676:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2282:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.1835:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.1935:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2465:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2580:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2304:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2488:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2277:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2396:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2258:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2677:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2299:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.3147:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2081:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2778:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2077:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2601:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2517:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2077:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.3455:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2436:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2732:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2098:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2106:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2135:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2183:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2606:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2659:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2407:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2550:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.3039:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2365:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2388:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2030:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2722:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2674:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2518:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2599:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2481:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2881:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2624:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2726:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.1983:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2714:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2331:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.1691:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2749:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2291:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2430:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2695:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.3115:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.3115:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2289:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2602:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2903:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2356:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2414:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2019:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2187:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2246:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2470:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2509:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2122:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2103:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2216:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2729:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2199:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2395:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2512:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2249:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2455:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2094:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2265:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2080:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2329:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2046:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2309:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2827:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2542:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2166:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2268:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2328:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2487:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2607:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2405:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2656:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2214:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2635:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.1959:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2043:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2136:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2625:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2372:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2577:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2583:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2069:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2071:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.1956:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.3343:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.1812:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2129:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2875:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2201:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2346:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2563:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2746:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2274:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2433:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2401:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.3273:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2293:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2349:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2855:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2078:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2501:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2581:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2245:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2686:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2853:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2624:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2258:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.3046:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2715:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2566:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2050:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.3039:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2612:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2111:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2777:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2582:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.1426:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.1426:  43%|████▎     | 172/401 [01:50<03:51,  1.01s/it]training loss: 0.2349:  43%|████▎     | 172/401 [01:50<03:51,  1.01s/it]training loss: 0.2571:  43%|████▎     | 172/401 [01:50<03:51,  1.01s/it]training loss: 0.2746:  43%|████▎     | 172/401 [01:50<03:51,  1.01s/it]training loss: 0.3223:  43%|████▎     | 172/401 [01:50<03:51,  1.01s/it]training loss: 0.2473:  43%|████▎     | 172/401 [01:50<03:51,  1.01s/it]training loss: 0.2052:  43%|████▎     | 172/401 [01:50<03:51,  1.01s/it]training loss: 0.2729:  43%|████▎     | 172/401 [01:50<03:51,  1.01s/it]training loss: 0.2043:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2413:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2326:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.1926:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2240:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.1974:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2746:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.3036:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2491:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2396:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2499:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2598:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2275:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2538:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2549:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2665:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2222:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2390:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2414:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2760:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2720:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2105:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2058:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2206:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2612:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2079:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2227:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2757:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.1988:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2703:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2843:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2885:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2006:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2055:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2505:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2374:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2423:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2315:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2261:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2441:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2500:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2401:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2766:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.3126:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2193:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2254:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2468:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2068:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.1857:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2387:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2413:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.1726:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2706:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2349:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2163:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2492:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2465:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2450:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2851:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2438:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2141:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2279:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2477:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2389:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2581:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2723:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2224:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2982:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.1862:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2124:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.3070:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.3412:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.3412:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2432:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2299:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.1918:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2481:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2534:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2399:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.1903:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2551:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2774:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2243:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2287:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2821:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2788:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2750:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2197:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2708:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2216:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2443:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2147:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2290:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2274:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2507:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2860:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2757:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.1796:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2027:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.1957:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2652:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2353:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2158:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2776:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2062:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2270:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2527:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2569:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2883:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2323:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2541:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2840:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2429:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.3199:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2125:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2668:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2544:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2730:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2834:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2067:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2831:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2315:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2849:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2883:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2516:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.1972:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2471:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2998:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2176:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2112:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2674:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2366:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2029:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2291:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2501:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2712:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.1907:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.3194:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2460:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2409:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2561:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.3568:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2885:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2452:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2559:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2560:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2615:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2703:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2763:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2291:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2005:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.3259:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.3259:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.1828:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2904:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2337:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2181:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2954:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2767:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2637:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2390:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2013:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2330:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2841:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.1848:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2170:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2296:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.1882:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2064:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2365:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2518:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2716:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2188:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2213:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2568:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2546:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2748:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2559:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2270:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2120:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2681:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2337:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2411:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2626:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.1782:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2790:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2877:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2503:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2309:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.1914:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2496:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2593:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2559:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2400:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2301:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2028:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2714:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2042:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2161:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2464:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2131:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2521:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2673:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2178:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.1964:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2489:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2886:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2704:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2610:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2489:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2426:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2446:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2821:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2465:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2181:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2619:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2484:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2494:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2181:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2645:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2115:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2102:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2263:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.1844:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2582:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2574:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2353:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2192:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2288:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2571:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2020:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.3871:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.3871:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2226:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2302:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2641:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.3040:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2746:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2163:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2802:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2280:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2393:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2441:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2443:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2275:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2529:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2299:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2378:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2022:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2312:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2384:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2410:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.1912:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2179:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2564:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2037:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2481:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2539:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2298:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2434:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2398:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2310:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2631:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2401:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2320:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2167:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2331:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2114:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2980:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2081:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2450:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2012:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2604:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.1893:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.3044:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2362:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2124:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2299:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.1760:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.1697:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2527:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2587:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2470:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2729:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.1877:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2424:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2709:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2174:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2506:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2336:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2059:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2951:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.1913:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2478:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2469:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2523:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2306:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2988:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.1743:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2161:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2685:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2779:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2716:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.3111:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2654:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.1695:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2214:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2349:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.3225:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2599:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2420:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2039:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2039:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2751:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.1836:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2218:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.3105:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2175:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2523:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2293:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2161:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2129:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2623:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2646:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2770:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2081:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2064:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2571:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2417:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2859:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.3042:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2627:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.1974:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2784:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2381:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2895:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2731:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2684:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2908:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2434:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2029:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2266:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2244:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2611:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2569:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2167:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2155:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2708:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2207:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2399:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.1996:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2704:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2602:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2761:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.1910:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2137:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2203:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2732:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2835:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2464:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2603:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2094:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2359:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2371:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2613:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2230:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2167:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2918:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2604:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2405:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2336:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2365:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2384:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2784:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2424:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2146:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2539:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2092:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2128:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2208:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2950:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2140:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.1972:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2262:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2732:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.1733:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2388:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2348:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.1910:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.3098:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2834:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2250:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2250:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2830:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2122:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2678:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2280:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2495:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2709:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2474:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2547:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2281:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2578:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2302:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2355:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2738:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.3010:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2826:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2639:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2797:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2020:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2904:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2658:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2199:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2543:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2156:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.3056:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2308:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.3150:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2413:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.1962:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2217:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2381:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2173:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2373:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2200:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2567:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.1976:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2441:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2264:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2211:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.3009:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2702:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2524:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2306:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2190:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2662:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2548:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2517:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2468:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.1929:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2568:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2731:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2611:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2527:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2620:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2502:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2245:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2688:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2072:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2030:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2916:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2140:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2049:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2440:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2132:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2250:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2734:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2749:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2659:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2391:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2150:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2588:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2422:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2090:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.3192:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2611:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2461:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2083:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2917:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.1956:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.1631:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.1631:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2109:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1897:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2213:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2388:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2165:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2304:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1852:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2931:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2588:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2811:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2477:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1804:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2276:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2354:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2094:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2525:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2645:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1809:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2062:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2547:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2031:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2437:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2276:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2193:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.3031:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2432:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2560:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1887:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2396:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2336:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2463:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2485:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2048:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2968:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2209:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2607:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2561:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2532:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2765:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1788:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2795:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2638:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2344:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2459:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2364:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2191:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2527:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2789:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2590:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2557:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1877:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2505:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2129:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2982:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2499:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2310:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2157:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1910:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2177:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2480:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2089:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2358:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2121:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2267:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2050:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2369:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2167:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2205:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1787:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1956:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2208:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2345:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2212:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2131:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2759:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1931:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2398:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2631:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2113:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2113:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1905:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2233:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2417:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2326:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2205:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2766:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2844:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2377:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2500:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2245:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2514:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2940:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2239:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2387:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2185:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2230:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2601:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2465:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2256:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2787:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1974:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2010:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2331:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2618:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2910:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2197:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2317:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2148:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2246:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1973:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2264:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2067:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2769:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2390:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2206:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2350:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2156:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2458:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2360:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2566:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2345:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2707:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1919:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2358:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2154:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2448:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2709:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2797:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2608:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1996:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2603:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2179:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2525:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1840:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2093:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2152:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2364:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2491:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1952:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2605:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2463:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2400:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2577:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2055:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2187:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2543:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2112:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2346:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1964:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2322:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2186:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2249:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2314:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2613:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1844:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2085:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2534:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2499:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1478:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1478:  45%|████▍     | 180/401 [01:53<01:30,  2.44it/s]training loss: 0.2648:  45%|████▍     | 180/401 [01:53<01:30,  2.44it/s]training loss: 0.1885:  45%|████▍     | 180/401 [01:53<01:30,  2.44it/s]training loss: 0.3014:  45%|████▍     | 180/401 [01:53<01:30,  2.44it/s]training loss: 0.1970:  45%|████▍     | 180/401 [01:53<01:30,  2.44it/s]training loss: 0.2524:  45%|████▍     | 180/401 [01:53<01:30,  2.44it/s]training loss: 0.2602:  45%|████▍     | 180/401 [01:53<01:30,  2.44it/s]training loss: 0.2845:  45%|████▍     | 180/401 [01:53<01:30,  2.44it/s]training loss: 0.2184:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2836:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2406:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2392:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1990:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2406:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2326:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2048:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2542:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2374:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2719:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1823:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.3004:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2621:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2427:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2390:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2631:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2231:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.3019:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1986:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2376:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1976:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2484:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2688:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2386:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2652:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2039:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2473:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2635:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2953:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2209:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2578:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2644:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2412:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2340:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.3254:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2706:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2146:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2767:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2212:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2238:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2944:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2117:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2361:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2241:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2663:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2928:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2383:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2389:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2159:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2875:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1902:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2119:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2427:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2033:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2436:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2059:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1987:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2668:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2949:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2602:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2390:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2471:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1822:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.3133:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2749:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2140:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1814:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2086:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2166:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2825:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1412:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1412:  45%|████▌     | 181/401 [01:56<04:14,  1.16s/it]training loss: 0.2301:  45%|████▌     | 181/401 [01:56<04:14,  1.16s/it]training loss: 0.2211:  45%|████▌     | 181/401 [01:56<04:14,  1.16s/it]training loss: 0.2447:  45%|████▌     | 181/401 [01:56<04:14,  1.16s/it]training loss: 0.1939:  45%|████▌     | 181/401 [01:56<04:14,  1.16s/it]training loss: 0.2201:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2560:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.3074:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.1942:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.1978:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2198:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2138:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2408:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2027:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2562:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.1905:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2612:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2119:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2352:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2406:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2165:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2084:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2450:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.1937:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2303:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2030:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2252:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2503:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.1967:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2537:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2007:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2670:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2408:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2866:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2172:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2350:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2028:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2951:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2526:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.1972:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2347:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2484:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2380:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2189:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2501:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2932:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2371:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2240:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2009:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2137:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2097:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2860:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2304:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2144:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2444:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2348:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2030:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2362:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2605:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2028:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2947:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2177:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2587:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2474:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.1884:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2383:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2807:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.3036:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2050:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2618:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2570:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2705:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2468:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2296:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.1771:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2746:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2259:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2431:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2195:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.3631:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.3631:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2300:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2299:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2566:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2392:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2179:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2152:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.1623:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2662:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2284:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.1925:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2368:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2420:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2352:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.1951:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2762:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2077:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2241:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2812:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2238:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2622:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2410:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.1972:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2170:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2924:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2302:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2487:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2223:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2990:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2626:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2244:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2056:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2606:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2413:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.3006:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2060:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2614:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2389:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2798:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2551:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2257:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2596:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.1989:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2131:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2563:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2177:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.1923:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2586:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2061:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2003:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2521:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2118:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2240:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2200:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2497:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2317:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2443:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2391:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2766:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2114:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.1997:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2853:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2263:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2507:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2352:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2183:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2070:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2917:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2428:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2327:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2357:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2535:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.1760:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.1987:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2568:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2074:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2510:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2534:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2183:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.1611:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.1611:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2110:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2156:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2039:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2634:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2051:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2323:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2503:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1886:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2246:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1996:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2632:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1997:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2054:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2652:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2291:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2642:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2350:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2263:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2654:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2245:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2560:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2077:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2194:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1768:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2140:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2631:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2304:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2281:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2395:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2332:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2338:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2293:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2376:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2323:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2234:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2318:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2446:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2182:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.3031:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2530:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1928:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2592:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2535:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2354:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1972:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1853:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2063:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2451:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2059:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2629:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1884:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2030:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.3442:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2469:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2678:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1964:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2553:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2333:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2397:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1998:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2263:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2688:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2729:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2477:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1493:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2575:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2231:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1955:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2548:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2020:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2398:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2654:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2456:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2557:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2015:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1878:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2196:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2260:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1945:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1945:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2065:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2007:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2354:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2309:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2136:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2376:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2018:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2244:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2608:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2538:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2209:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2108:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2616:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.1888:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2371:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2548:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2090:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2545:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2776:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2621:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2583:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2349:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2695:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2129:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2075:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2547:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.1902:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.3061:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2238:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.1936:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2454:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.1999:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2204:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2187:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2773:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2245:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2090:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2014:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2874:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2435:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2271:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.1998:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2680:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2333:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2816:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2724:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2198:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2110:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2128:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2375:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2570:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2192:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2254:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2059:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2177:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2433:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2046:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2378:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.1905:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2434:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2283:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.1707:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2402:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2179:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2531:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.1735:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2765:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2433:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2320:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2126:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2033:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2247:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2749:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2248:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2455:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2915:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2478:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2378:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2029:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2029:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2525:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2556:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.1994:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2317:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2521:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2245:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2207:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2379:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.1890:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.1787:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.3069:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2452:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2118:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2521:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2810:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2434:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2286:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.3016:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2189:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2480:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2564:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2000:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2348:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2595:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2890:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.1635:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2100:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2449:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2589:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2650:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2159:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.1799:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2072:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2150:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2537:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2538:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2400:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2182:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2006:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2526:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2480:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2105:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.1750:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.3053:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2441:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2490:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2817:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2178:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2142:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2934:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2146:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.1857:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2251:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2023:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2522:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2490:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2127:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2479:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2407:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2786:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2584:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2069:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2545:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2206:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2554:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2905:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2138:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2721:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2720:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2476:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2420:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2171:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2024:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2088:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2076:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2061:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2443:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2194:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2470:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2470:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1926:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2013:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2615:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2238:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2257:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2680:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2632:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1982:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2144:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2726:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2927:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1990:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2306:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2571:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2186:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2201:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2375:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1785:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2058:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2270:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2021:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2042:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2618:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2284:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2063:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2464:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2600:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2023:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2498:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2546:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2583:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2372:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1912:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2657:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2193:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2502:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2640:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1810:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2276:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2533:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1530:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2431:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1969:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1956:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1997:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2096:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2445:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1920:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.3052:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1807:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2484:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2651:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2387:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.3372:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2508:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2597:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2794:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2212:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1987:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2478:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2452:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2293:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2063:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2335:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2134:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2340:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2025:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2394:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2474:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2095:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1939:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1930:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2139:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2287:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2575:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2129:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2469:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2070:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1312:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1312:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2216:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.1827:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2636:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2714:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2118:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2539:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2602:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2660:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2306:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2106:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2250:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2847:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2546:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2131:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.1732:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.1909:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2380:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2907:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2309:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.1969:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2174:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.1933:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2299:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.1865:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2725:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2377:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2051:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2471:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2112:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2401:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2200:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.1725:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2641:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2321:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.1800:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2665:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2460:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2014:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2624:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2573:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.1845:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.1731:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2822:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2072:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2720:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.3005:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2137:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.4400:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2402:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2354:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2129:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2187:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2278:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2181:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2237:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.1965:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2232:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2369:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2634:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2311:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2967:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2593:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2337:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2247:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2739:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2249:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2136:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2847:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2247:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2180:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2628:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2247:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2542:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2190:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2138:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2417:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2036:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2510:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.1853:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.1853:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2098:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2760:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2536:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2803:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2360:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2841:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2705:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2620:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2148:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2594:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1896:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2976:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1732:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2556:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2100:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2697:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2260:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1580:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1797:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2348:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1711:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1870:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2295:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1923:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1861:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2634:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2314:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2168:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2839:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2662:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2294:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2408:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2054:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2008:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2688:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2053:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2414:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2725:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2207:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2093:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2378:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2112:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2272:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2420:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2415:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2044:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2040:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2207:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2265:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2227:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.3056:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2342:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2619:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2325:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2180:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2284:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2352:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2426:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2324:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2662:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2167:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2408:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1989:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1807:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.3074:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1730:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2722:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2534:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2168:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2143:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1792:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2417:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2784:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2383:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2039:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2351:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2523:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2726:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2403:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2403:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2443:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.1816:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2394:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2222:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2825:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2552:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2315:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2056:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.1743:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2217:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2673:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2692:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2545:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2187:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2407:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2340:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2332:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2774:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2366:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.1872:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.1946:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2303:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2408:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.1931:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2462:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2541:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2948:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.1855:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2365:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.1997:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2258:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2745:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2410:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2294:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2296:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2332:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2452:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2481:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2485:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2175:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2309:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.3026:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.1914:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2812:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2175:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2296:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2200:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2709:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2520:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2338:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2205:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2510:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2800:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2920:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.1916:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2213:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2054:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.1880:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2551:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2102:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2411:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2065:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2514:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2820:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2554:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2088:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2271:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2257:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2070:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2214:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2080:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2604:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2165:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2204:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.1950:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2358:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2326:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2380:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.1396:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.1396:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2240:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2411:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2148:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2107:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1655:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2448:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1967:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2422:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2411:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2454:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1933:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2253:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2894:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2850:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2162:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2547:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2697:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2262:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2386:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2443:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1632:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2452:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1831:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2001:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2129:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2730:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2435:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2064:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2158:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1877:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2953:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2330:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1575:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2531:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2394:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2615:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2082:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2630:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2365:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2360:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2118:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2023:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2390:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2024:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1962:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2533:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2242:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2279:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2760:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2123:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.3055:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2150:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1986:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2264:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2006:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2484:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2845:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2358:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1953:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2553:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2458:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2110:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2235:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2416:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2750:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2529:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2056:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2505:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2109:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2189:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2027:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2371:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1602:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2070:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2280:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2077:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2143:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1978:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.3991:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.3991:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2365:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2512:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2122:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2501:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2739:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2522:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2429:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1873:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2160:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1980:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2308:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1969:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2136:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2724:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2038:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2725:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2249:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2225:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2303:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2846:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2207:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2956:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2218:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2654:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2694:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2150:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2268:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2646:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1932:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2474:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2047:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2049:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1811:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2080:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1958:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2151:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1866:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1920:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2197:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2632:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2712:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1811:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2446:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2096:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2637:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2364:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2374:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.3057:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2301:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2615:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2324:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2286:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2064:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2308:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2280:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2284:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2108:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2376:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2355:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2842:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2718:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2066:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2341:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2436:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2329:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2245:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2313:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1986:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1998:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2459:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2006:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2429:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1916:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2632:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2455:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2702:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2340:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2545:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1431:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1431:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2232:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2542:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2560:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2019:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2370:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2212:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2650:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2781:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2007:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2202:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.1587:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2311:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2171:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.1886:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2268:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2273:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.1984:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2108:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.1713:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.1854:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2287:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2398:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2566:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.1951:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2347:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2019:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2128:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2513:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.1658:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2339:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2598:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2096:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2750:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2165:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2450:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2786:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2645:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2213:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2203:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2044:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2121:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2478:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.1867:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2707:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.1999:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2174:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2146:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2494:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2317:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.3165:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.1944:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2156:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2732:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2244:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2478:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2720:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2347:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2215:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2490:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2000:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2366:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2801:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2594:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2579:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2851:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2448:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2691:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.1648:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2328:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2261:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2113:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2314:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2440:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2062:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2034:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2295:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2461:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2326:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.3331:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.3331:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2671:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2241:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2512:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.3095:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2646:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2399:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2531:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2417:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2294:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2474:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2236:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1966:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2526:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1916:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2624:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1780:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2806:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2400:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2490:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2026:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2831:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2264:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2724:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2072:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2456:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2412:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2689:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2751:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1811:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2262:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2246:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2359:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2708:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1721:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2490:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2143:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1998:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2047:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2905:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2761:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2185:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2201:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2420:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2248:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1846:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2824:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2574:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2288:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1806:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1805:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2300:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2105:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1840:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1849:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2244:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2078:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2449:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.3132:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2216:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2615:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2484:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2278:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2194:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2273:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1810:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2230:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2298:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2140:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2378:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.2995:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.1945:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.2461:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.1855:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.2277:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.2242:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.2929:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.2621:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.2517:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.1888:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.1888:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2099:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1813:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2220:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2250:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2500:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2097:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.3126:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1878:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1822:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2880:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2556:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2744:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2500:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2030:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2424:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2435:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2911:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2104:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.3002:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2319:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2632:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2055:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1919:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2075:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1788:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2298:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1877:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2646:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2433:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2314:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2400:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2236:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1856:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2440:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2558:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2326:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2129:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2206:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2646:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1973:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2305:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2519:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2414:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2244:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2227:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1670:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.3031:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2160:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1952:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2674:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2288:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2232:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2314:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2319:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1971:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2045:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1879:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2925:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2492:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2141:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2157:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2603:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2393:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2086:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2444:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2436:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2228:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2042:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2185:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1964:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1618:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2339:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2078:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1855:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1955:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2493:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2479:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2277:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2469:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2469:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2287:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2437:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1917:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2573:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2526:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2155:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2606:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2313:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1774:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2402:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2144:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1866:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2327:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2285:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2267:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.3257:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2075:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2159:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2442:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2601:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2214:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2132:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2393:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2381:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2529:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2613:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1609:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2679:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2487:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2645:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2398:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2548:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2024:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2113:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2039:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2596:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2126:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2418:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2011:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2329:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2412:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2096:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2285:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2474:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2126:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2616:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2218:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2570:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2330:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2224:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1923:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1486:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2595:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2583:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1821:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2080:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2993:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2290:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2558:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2533:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2160:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2492:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1655:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1800:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.3219:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2158:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2951:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1745:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2351:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2433:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2236:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2463:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2364:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2415:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1909:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2353:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2380:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2550:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1740:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1740:  49%|████▉     | 196/401 [02:06<02:13,  1.54it/s]training loss: 0.2417:  49%|████▉     | 196/401 [02:06<02:13,  1.54it/s]training loss: 0.2189:  49%|████▉     | 196/401 [02:06<02:13,  1.54it/s]training loss: 0.1831:  49%|████▉     | 196/401 [02:06<02:13,  1.54it/s]training loss: 0.2350:  49%|████▉     | 196/401 [02:06<02:13,  1.54it/s]training loss: 0.2359:  49%|████▉     | 196/401 [02:06<02:13,  1.54it/s]training loss: 0.2685:  49%|████▉     | 196/401 [02:06<02:13,  1.54it/s]training loss: 0.2565:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2401:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2606:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2412:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2474:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1983:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1871:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2808:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1688:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2246:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2538:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2101:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2438:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1897:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2489:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2359:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2229:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2293:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2648:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2581:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2172:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2379:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2265:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.3087:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2766:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2387:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2028:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1851:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2514:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1887:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2710:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.3038:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2777:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1840:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2254:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2406:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2826:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2192:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2052:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2998:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2328:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2352:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2331:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2399:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2750:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2316:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1780:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1729:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2500:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2405:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2377:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2388:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2455:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2813:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.3112:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2499:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2638:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2345:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2695:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2572:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2281:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1994:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2154:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2605:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2020:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2918:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1722:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2415:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2449:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2231:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2338:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2391:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1948:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1948:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2629:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2178:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2074:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2278:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1870:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2576:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2073:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2559:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.3003:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2046:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2648:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2701:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1817:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2187:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2429:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2103:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2293:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2235:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1687:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2250:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2141:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2246:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2025:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.3060:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2563:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2529:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2176:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2562:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2087:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2278:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2242:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1965:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2429:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2643:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2248:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1969:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2396:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2483:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2514:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2097:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2759:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2113:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1990:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1971:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2140:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2389:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2315:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1928:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2381:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2128:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2264:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1888:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1849:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2303:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2527:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2533:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1996:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1691:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2747:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.3261:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2970:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2400:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2713:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2343:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.1915:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.3117:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2356:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2080:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2782:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2492:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.1862:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2441:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2116:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2556:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2091:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.1690:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2470:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2914:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2473:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2473:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2348:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2636:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2068:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2062:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2179:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2374:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2669:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2006:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2272:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2192:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2006:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2433:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2475:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2253:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2049:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2809:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1951:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1887:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2275:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1721:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2016:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1963:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2130:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2059:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2213:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2552:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1901:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2491:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2010:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1973:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2456:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2346:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2002:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2162:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2192:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2525:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1751:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1880:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2919:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2782:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2402:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2494:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2403:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2343:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2228:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2401:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2277:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2389:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2563:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2206:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2109:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1783:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2612:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1911:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2056:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2083:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2380:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2195:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1727:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2028:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1944:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2116:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1993:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2614:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2819:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2287:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2601:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2145:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2245:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2530:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2111:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2301:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1889:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2084:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1639:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1797:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2301:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2553:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2120:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2120:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2546:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2130:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2123:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2232:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2471:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1774:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2225:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2601:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2535:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2436:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1908:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2491:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1640:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2433:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2018:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2586:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2117:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2552:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2375:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2485:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2615:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2399:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1997:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2124:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2000:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2123:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2160:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2167:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2012:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2217:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2294:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2679:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2422:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2764:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2276:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2676:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2232:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2304:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2156:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1920:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1868:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2160:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2313:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2604:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2688:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2405:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2090:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2226:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2524:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2616:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2773:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2424:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2401:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2185:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2422:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2914:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2018:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1958:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2269:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1893:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2647:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1981:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2275:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2520:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2408:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2146:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2689:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2389:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1950:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1872:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2326:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2294:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2272:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2482:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.3018:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1885:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2235:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2579:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.0972:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.0972:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2237:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2070:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2253:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2427:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2141:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2868:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2345:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2685:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2171:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2877:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2766:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2563:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2183:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.1946:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.1882:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.3010:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2104:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2351:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2324:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.1917:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2494:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2293:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2091:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2017:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2430:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2359:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.1929:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2924:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2258:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.1880:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.1781:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.1903:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2339:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2207:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2168:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2145:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2476:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2152:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2625:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2901:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2961:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1965:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2159:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1886:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2567:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2042:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2722:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2444:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2546:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2498:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2380:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2961:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2069:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1809:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1927:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2741:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2573:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2265:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2491:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2226:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2623:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2196:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2174:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2240:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2257:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2799:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2292:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2051:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2804:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2295:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1978:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1764:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2091:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2522:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2529:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1953:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2307:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2025:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1433:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1433:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.1999:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.2150:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.2092:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.2474:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.2031:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.2111:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.2099:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.3103:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.2101:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.1895:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.2126:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1827:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2398:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2082:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2163:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2143:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2218:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2458:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2404:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2445:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2433:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2370:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1998:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2631:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2150:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2841:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2374:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2219:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2569:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2522:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2615:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1836:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2004:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2126:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2268:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1900:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2915:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2067:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2427:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2683:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2186:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1869:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2775:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2027:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2360:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2117:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1613:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2214:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2043:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1862:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2377:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2061:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2041:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2178:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2622:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2524:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2345:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2405:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2369:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2077:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1785:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1965:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2381:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2358:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2672:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2669:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2721:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2213:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1492:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2707:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2019:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1984:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1967:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1924:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2159:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2245:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2380:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2273:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1745:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1745:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1990:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2300:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2674:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2651:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2110:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2331:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2398:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2120:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2244:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1796:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2069:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1898:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2867:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2218:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2374:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1889:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2331:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2320:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2282:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2274:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2521:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2372:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2664:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2470:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2471:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2127:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2618:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2293:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2093:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1652:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2287:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2346:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2505:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2478:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2928:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2331:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2414:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1950:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2192:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2149:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2682:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2035:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2191:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1826:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2185:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2297:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1980:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2128:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1963:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1829:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1997:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2848:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.3344:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2001:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2569:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2216:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2027:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2194:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2613:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1827:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2334:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2395:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2308:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2405:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2004:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2162:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2156:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2168:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2645:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2604:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2294:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2272:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2812:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2266:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2379:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2216:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1887:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2386:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1604:  50%|█████     | 202/401 [02:13<03:34,  1.08s/it]training loss: 0.1604:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2043:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2024:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1823:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2871:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1771:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2597:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2167:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2591:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2826:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2856:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2269:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2025:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1799:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2526:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1908:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1778:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1666:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2220:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2439:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1856:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2572:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1869:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2084:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2257:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2270:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2361:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2267:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2234:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2090:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2190:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1825:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1977:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2283:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2041:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2428:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2380:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1948:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2334:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2338:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2184:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2464:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2304:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2754:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2971:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2352:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2442:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1997:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2410:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1737:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1596:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2190:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1796:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2334:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2078:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2846:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2199:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2393:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2190:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2558:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2538:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1981:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2575:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1979:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1997:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1982:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2061:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2541:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2306:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2071:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2051:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2152:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2316:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2091:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2407:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1898:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2234:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1890:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2015:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1377:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1377:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.1892:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2362:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2587:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2117:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2016:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.1797:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2539:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2214:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2249:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.1900:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.1891:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2905:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2179:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.1486:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2118:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.1933:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2708:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2110:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2099:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2169:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2141:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2969:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2212:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2702:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2191:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2481:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2377:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2593:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2290:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.3178:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1920:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1981:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2079:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2264:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1967:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2934:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2683:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2329:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2006:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2365:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2182:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1980:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2157:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2342:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1996:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1850:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1908:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2043:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2451:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2120:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2467:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2217:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2088:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2297:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2282:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2383:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2363:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2481:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2200:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1699:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1733:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2840:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2168:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2100:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1836:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2096:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2371:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2063:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1840:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2766:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1906:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2600:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1749:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2991:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2618:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1739:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1889:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1992:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2390:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2390:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.1944:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2450:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2153:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2060:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2099:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2491:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2243:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2376:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2043:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2219:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2560:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2027:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.1866:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.1926:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2453:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.1784:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2124:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2053:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2270:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2565:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1887:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2664:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2324:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2361:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1771:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2210:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2056:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2170:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2689:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2258:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1808:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2445:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2522:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2519:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1900:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1790:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2783:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2380:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2702:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1925:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1699:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2020:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2188:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2006:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2510:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2389:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2434:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2114:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2678:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2347:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2208:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2455:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2574:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2022:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2263:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1529:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2441:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1898:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1880:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2140:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2612:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2528:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2266:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2394:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2926:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1503:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1908:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2046:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2147:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2181:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1998:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2547:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1807:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2675:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2039:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1767:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2339:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2737:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.0837:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.0837:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1874:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2094:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2365:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2028:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2183:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1957:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2174:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1535:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2277:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.3062:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2431:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2265:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.3026:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2289:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2016:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2211:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2270:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2413:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1666:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2923:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2473:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1635:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.3112:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2762:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2059:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1981:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1763:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.3105:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2312:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2065:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1829:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2277:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2750:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1979:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1911:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2004:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1996:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2655:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2611:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1802:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2781:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2948:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2250:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2337:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1983:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2426:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2455:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2332:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2050:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2302:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2545:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2538:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2006:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2048:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1858:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2362:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2502:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1929:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2325:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2058:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1845:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2556:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.3079:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2077:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2560:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1939:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1890:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2404:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1715:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1917:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2432:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2409:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2339:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2158:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2213:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1849:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2156:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2056:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1086:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1086:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1952:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2348:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2119:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2274:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2894:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2323:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1855:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2286:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1854:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2313:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2823:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2210:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2198:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2036:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1945:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2121:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2434:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2111:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2306:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1991:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2517:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2080:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2160:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1572:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2180:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2126:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2474:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1833:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2001:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2483:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2150:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2382:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2849:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2525:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2075:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1803:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2429:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1910:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1891:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2047:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2442:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2953:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.3021:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1873:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2563:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1957:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2397:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2227:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2445:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2195:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2079:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1950:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2201:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2237:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2301:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2629:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2191:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1821:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2455:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1880:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2382:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2254:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2239:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.3115:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1731:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2262:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2498:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2593:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2569:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2263:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2471:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.3203:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1901:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1677:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2160:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2260:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2443:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2449:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.3648:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.3648:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2119:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2017:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1899:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1973:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1998:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2355:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1657:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2676:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1799:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2038:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1963:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2655:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1970:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2010:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2478:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2372:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2018:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2928:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2369:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1996:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2190:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.3329:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1680:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1856:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2540:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2668:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1745:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1658:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2830:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2037:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2256:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2193:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2127:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2253:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2724:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2050:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2833:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1929:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2087:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1733:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2187:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1973:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2057:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2940:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2838:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2149:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2589:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1940:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2371:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2258:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2065:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2751:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2554:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2345:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1806:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1736:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2469:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2807:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1836:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1973:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1844:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2383:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2433:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.3038:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2139:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2549:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2479:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2350:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2180:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1904:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2057:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1962:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1822:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2472:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2212:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2249:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2540:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2145:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2125:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2125:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1945:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2444:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2723:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2575:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2443:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2497:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1645:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2233:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1954:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2860:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2073:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2215:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1994:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2248:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1710:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1816:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2217:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2387:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1720:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2031:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2289:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2316:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2592:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1982:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2096:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2098:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2691:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1862:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2384:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2254:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2197:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1644:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2599:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2226:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2210:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2355:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2766:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1615:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2220:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2270:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2066:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2359:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2382:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2390:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1985:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1923:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2257:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2942:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1926:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2329:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2058:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2233:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2561:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2555:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2295:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2431:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2256:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2240:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2669:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2099:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1781:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2004:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2263:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2218:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2458:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2272:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2040:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2069:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1916:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1737:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2332:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2207:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1991:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2715:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2401:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1715:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1700:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2236:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.4719:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.4719:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.1775:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2748:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.1939:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2178:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.1886:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2002:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2299:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.3013:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2351:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2048:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2253:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.1970:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2490:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2133:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2100:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2388:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2250:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2792:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2567:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2243:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2565:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2475:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.1895:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.1766:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.3060:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2162:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2121:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2368:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2094:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2028:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2503:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2398:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2004:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2720:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2474:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2023:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2833:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.1925:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2307:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2567:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2340:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.1899:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2269:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.1799:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2268:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2266:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2085:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2501:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.1941:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2656:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2052:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2472:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.1776:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2209:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2791:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2851:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2094:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2177:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2083:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.1605:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2377:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2323:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2063:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2306:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2364:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2118:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2602:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2025:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2484:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.1883:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.1841:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2367:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.1796:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2524:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.1815:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.1911:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2045:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2195:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.1941:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.1941:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2537:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2534:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2408:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1965:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2007:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2587:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1917:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1895:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2120:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1828:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2272:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2141:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2400:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2563:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2136:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2469:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1832:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2019:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2212:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1576:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2492:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2168:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2477:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2275:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2718:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2593:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2479:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2211:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2446:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2654:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1950:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2026:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2212:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2145:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1966:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2559:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1548:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2206:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2091:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2062:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2379:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2746:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2584:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2240:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2109:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1942:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2504:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2263:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2307:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2186:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2258:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2314:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2059:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1811:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2557:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2740:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2459:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2064:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2313:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2919:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2319:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2074:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2066:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2773:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2283:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2494:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2631:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2868:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1987:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2734:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2356:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2137:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2430:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2554:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2101:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2140:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2394:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2365:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1603:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1603:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2295:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2179:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2110:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2160:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.1968:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2304:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2111:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.1619:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2129:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2215:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2441:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.1808:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2368:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.3254:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2404:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2323:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2163:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2853:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.1990:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.1872:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2041:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.1896:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2258:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.1878:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.1986:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2274:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2012:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2655:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2377:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2506:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2214:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1812:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1929:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2654:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1953:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2060:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2103:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2605:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2475:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2666:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2238:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2190:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2811:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2254:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2250:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2007:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2156:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2180:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2322:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2315:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2109:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2413:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2636:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2203:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1631:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2523:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2606:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2255:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1852:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2226:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1703:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2466:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2099:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2136:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2195:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2657:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2251:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2122:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2031:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2244:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2372:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2539:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1996:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2186:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2196:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1884:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1991:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2989:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1187:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1187:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.3002:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1917:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.3026:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2011:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2587:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2597:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1992:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1992:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2116:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2108:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1791:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2099:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1715:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1891:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2683:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2013:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2512:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2678:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2017:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2392:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2273:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2059:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2572:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2019:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2508:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2685:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1731:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2713:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2084:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1888:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2333:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1863:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1980:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2514:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1798:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1826:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1773:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1880:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2104:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2299:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.3072:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1841:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2261:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2563:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2057:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2001:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1721:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1745:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2260:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2238:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1907:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1522:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2290:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2660:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2134:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2860:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1514:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1861:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2052:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2008:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1752:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2421:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2099:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2563:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1653:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2247:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1667:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2158:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1584:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2148:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2696:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2483:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1909:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2211:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2610:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1883:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2273:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2179:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2289:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2289:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2059:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2168:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2580:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2414:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1821:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2540:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2380:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1808:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2351:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2333:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2347:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2297:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2193:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2335:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1847:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2042:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2450:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2254:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2198:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2667:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2393:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2487:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2183:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2551:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2040:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2132:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1873:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.3051:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1976:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1811:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2983:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2599:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2262:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2210:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2732:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2335:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1905:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2336:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1790:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1671:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2218:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.3225:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2022:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2423:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1751:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2141:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2146:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2030:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2253:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2129:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2310:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2417:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2809:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2170:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2357:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1907:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1759:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2421:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2010:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2552:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2857:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2162:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2400:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2456:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2385:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1931:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2422:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2819:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1751:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2894:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2169:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2104:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1991:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1820:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2467:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2044:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2715:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1872:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1775:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1775:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2308:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2031:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2036:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2128:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2325:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2424:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2217:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2081:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.1881:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2656:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2658:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2038:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.1976:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.1695:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2175:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2342:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2549:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2858:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2290:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2269:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2289:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2225:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2237:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2457:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2085:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2487:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2573:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.1791:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2305:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.1913:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2064:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2770:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2346:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2527:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2235:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2386:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.1969:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2612:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.1877:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2800:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2438:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1837:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1913:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2207:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2191:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2076:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1849:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2442:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2267:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2103:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2931:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2668:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1882:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1731:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2197:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2174:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2440:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2492:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1862:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1966:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1995:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1930:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1826:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1992:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2408:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2180:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2286:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2481:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1720:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2071:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2463:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2249:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.3228:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1535:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2207:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1803:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1955:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2329:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1427:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1427:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1863:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1869:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2078:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2362:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1838:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2112:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1828:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1478:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1957:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2399:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1945:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2457:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2766:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2281:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2744:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2278:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2350:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2542:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1951:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2628:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2286:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2253:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1807:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1723:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2453:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2779:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2356:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2183:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2059:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.3065:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2079:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1983:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2097:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2191:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2215:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2141:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1974:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2407:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2685:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2254:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2635:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1608:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2557:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2383:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1811:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2323:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2398:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2702:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2437:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2377:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2267:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1915:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.1997:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2447:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2039:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2632:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2319:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2202:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.1887:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2028:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2072:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2241:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2190:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.1420:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2493:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2124:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2210:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2676:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2873:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2409:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2095:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2038:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2551:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2741:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2443:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.1589:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.1845:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2097:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2317:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2317:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2214:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2203:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2541:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1751:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2294:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1719:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2275:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2491:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1909:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2378:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2096:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2142:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2546:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2161:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2649:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2522:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1931:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1883:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1925:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2495:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2085:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1974:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1632:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2146:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2011:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2008:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1982:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1574:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2233:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1577:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2138:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2315:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2511:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2516:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1804:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2457:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2440:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1919:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2578:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.3297:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2603:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2097:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2449:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1741:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2187:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2315:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2328:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1795:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1885:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2371:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1729:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2426:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2554:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2210:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2426:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1982:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2504:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2252:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2407:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1413:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2366:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1930:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2044:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1488:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1795:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2764:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.1987:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2011:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2441:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.1561:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2121:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.1951:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2321:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2945:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.1930:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2865:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2013:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.1962:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2383:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2383:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2121:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1749:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1962:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1541:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1767:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2139:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2481:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2416:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2051:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2261:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2157:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2473:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1580:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1985:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1923:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2426:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2600:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1678:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2087:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2196:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1960:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2606:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2403:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2206:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2061:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2282:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1823:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2172:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2303:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2493:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2113:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2513:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2179:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2120:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1999:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2042:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2891:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2448:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2394:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2464:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2191:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2350:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2159:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2437:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1716:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1779:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2285:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2088:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2213:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1892:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2661:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2136:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2119:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2805:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1657:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2231:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1512:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1564:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2242:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1975:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1646:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2868:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2194:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2090:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2591:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2444:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2182:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2403:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1540:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2433:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2270:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2422:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2979:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2305:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2179:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2976:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2189:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1748:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2585:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2585:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2488:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2180:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1748:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2123:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2126:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1754:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2236:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2764:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2969:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2415:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2366:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1866:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1757:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2403:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2396:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2625:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2724:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2726:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1937:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2108:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2616:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2699:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2154:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2753:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2580:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2352:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1925:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2359:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2114:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1972:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2466:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2023:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2068:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1670:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1851:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1815:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2369:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1946:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1783:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2810:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2283:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2568:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1718:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1997:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2208:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1467:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1884:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2607:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2132:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1948:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2323:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2281:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2471:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2126:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1889:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1641:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2365:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2125:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1906:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2852:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2257:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2336:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2137:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2193:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.1979:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2058:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2384:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2128:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2354:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.1811:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.1886:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2120:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2671:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2543:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2261:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2000:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2286:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2236:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.1614:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.1614:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2083:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2383:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2362:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2509:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1829:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2429:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2721:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1940:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2508:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2836:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.3064:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2312:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1842:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2039:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2385:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2232:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1717:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2859:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2451:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1920:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2631:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2148:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2180:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2270:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2130:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2310:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2215:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2099:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2144:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1761:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2054:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2327:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1523:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2414:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2026:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2019:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2384:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2027:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1669:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2245:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2291:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2056:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2381:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2468:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2661:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2397:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2070:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1834:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2575:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2585:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2504:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2083:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2142:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1931:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1727:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2071:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1914:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2142:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2558:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2347:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2392:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2413:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1970:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2608:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2129:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1929:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2618:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1699:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2376:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2309:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2515:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1973:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2492:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2030:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2031:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2107:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2481:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2021:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1857:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1857:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1851:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1799:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1961:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2175:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2457:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2124:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1814:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1643:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2445:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2360:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1923:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2348:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2871:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2009:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2054:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2907:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2424:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2046:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2013:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2507:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2998:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1973:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2773:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1782:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2210:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2083:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2570:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2050:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2176:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2206:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1708:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2318:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1944:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1885:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2424:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2301:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2210:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1709:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1997:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2161:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2172:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1927:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2245:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2197:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2422:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2226:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1980:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1896:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1878:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1969:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2213:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2186:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2369:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2154:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1771:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1986:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2351:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2463:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1732:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2528:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2282:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2393:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2230:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1551:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2394:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1809:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1716:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1814:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1873:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2124:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2033:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2307:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2368:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2167:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1781:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2528:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2158:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2453:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2390:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2390:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2375:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2020:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2134:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2412:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2307:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2306:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1862:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2228:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2221:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2026:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2526:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2962:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2271:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2728:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2735:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2185:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1500:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2900:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2354:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2069:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2576:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2669:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1958:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2810:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1704:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1261:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1971:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2438:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2262:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2464:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2550:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2185:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2088:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1784:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2427:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2252:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2178:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2105:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1976:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1774:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2735:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2460:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2723:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1813:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2541:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2080:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2611:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1977:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2317:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.1989:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2159:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2398:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.1601:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2317:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2151:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2536:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2075:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.1855:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2157:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.1851:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.1712:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2464:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2614:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2062:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2427:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2301:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2786:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2376:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2643:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2262:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2311:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2188:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2782:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2352:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2030:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.1969:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2512:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2320:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2945:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2945:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2435:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2268:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1791:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2085:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2174:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2249:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2051:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1714:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2424:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1976:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2360:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2766:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2310:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2258:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2675:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2083:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2342:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2678:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2211:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2681:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1923:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2460:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2110:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1812:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1734:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1920:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2628:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2549:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2737:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2155:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1943:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1860:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2029:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2469:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2324:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2104:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2147:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2117:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2638:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1973:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2294:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2085:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2336:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2002:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2140:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2441:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2375:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2194:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2488:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.3076:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2045:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2108:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1845:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1758:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2198:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2216:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2005:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2097:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2418:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1861:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2364:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1764:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1930:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2258:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.3115:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1990:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2097:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2032:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2264:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1876:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2332:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1963:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1762:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2743:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2416:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1921:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1993:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2247:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.3690:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.3690:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2183:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1751:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2297:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2119:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2176:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2740:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1708:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1802:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2158:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2218:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1909:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2054:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1679:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2430:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2411:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2194:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2532:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2312:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2118:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2341:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2461:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1926:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2408:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2237:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2567:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1654:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1794:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1965:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1996:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1982:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1863:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2454:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2640:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2069:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2070:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1815:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.3112:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2400:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2017:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2680:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2571:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2406:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2291:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2193:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2212:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2734:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1961:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1497:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2598:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1999:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2150:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1728:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2162:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2083:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2586:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1609:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2258:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1541:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1561:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2414:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2063:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1719:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2305:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2494:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2860:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2229:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1587:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2697:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2695:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2097:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2342:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2261:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2263:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1718:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2220:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2068:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2388:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1857:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.3429:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.3429:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1872:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2303:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2671:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2080:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2064:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2134:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1925:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2357:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2324:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2228:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2351:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2357:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1782:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2304:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2335:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2567:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1955:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.3286:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2121:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2458:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2207:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1735:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2424:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2319:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1852:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1779:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1920:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2605:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2221:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2934:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2131:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.3023:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2529:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2359:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2360:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1947:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2163:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1857:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2528:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2056:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2125:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2113:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2443:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1731:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1711:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1963:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2081:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1867:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2485:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1912:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2023:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2533:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2433:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2413:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2911:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2273:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2281:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2420:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2289:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2698:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2218:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2217:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2161:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1912:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2232:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2107:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2538:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1558:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2038:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2125:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1702:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2207:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2118:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2220:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2605:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2472:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2649:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2148:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1701:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1701:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.1626:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.1619:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2574:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2013:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2721:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2482:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2334:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2510:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2051:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2768:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2098:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2100:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.1588:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2363:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2356:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2487:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2365:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2114:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2042:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2643:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.1945:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2333:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2408:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.1928:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2541:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1860:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2252:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1978:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2149:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2660:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2064:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2334:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2200:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1643:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2210:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2367:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2398:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1964:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1672:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1793:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2304:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2225:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2406:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2336:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2770:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1737:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2509:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1606:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2000:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2313:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2630:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2499:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2051:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2519:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1967:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2173:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2373:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2030:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2553:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2146:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1883:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1927:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1756:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1576:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1950:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2083:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2343:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2402:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2313:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2067:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2688:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2199:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1651:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2153:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2082:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2470:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2354:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1809:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1610:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1610:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2163:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1872:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2446:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2040:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2176:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2855:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2248:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1962:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2377:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2105:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2658:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2326:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2235:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2167:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2152:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1656:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2313:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2455:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2153:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1762:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1949:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2153:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2303:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2127:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2503:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1820:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2173:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1845:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1838:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1573:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2321:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2178:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1869:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2663:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1589:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2633:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2109:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2174:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2218:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2347:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2874:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2328:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2429:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2424:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2073:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1676:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1830:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2192:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2131:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1972:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2270:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2216:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2638:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1812:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2351:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2477:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2768:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1920:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1633:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2135:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2162:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.3062:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1896:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2495:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2094:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1959:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2531:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2154:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2242:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1673:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2066:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2190:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1472:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2020:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1909:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2169:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2858:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2088:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.3752:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.3752:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2225:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2590:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1982:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1767:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2110:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2039:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1644:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2360:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2112:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2032:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2124:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2607:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1829:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2140:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2254:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1581:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1956:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2220:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2207:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1901:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1927:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2423:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2097:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1956:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1599:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2406:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1865:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1770:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2164:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1753:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2165:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1776:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2543:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2368:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1797:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2032:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2289:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2651:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2790:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2502:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.3172:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2293:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1879:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2628:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1846:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2528:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2498:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1969:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2630:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2175:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1724:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2013:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2842:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2704:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1796:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2245:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2038:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2422:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2566:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2739:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2002:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2925:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2290:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2270:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2212:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.1996:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.1974:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.1554:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2303:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2638:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.1869:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2291:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.1910:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2849:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.1902:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.1838:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2326:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2235:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2552:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2552:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1764:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2171:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1806:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2173:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2137:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2098:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1855:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2368:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1871:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2507:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2455:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2723:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2133:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1841:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2444:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2162:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2331:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2289:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2145:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2382:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2474:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2529:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2112:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2465:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1524:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2338:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2277:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2231:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2102:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2152:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2129:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2046:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2411:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1923:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2432:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1896:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2424:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1969:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1956:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1449:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1820:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1938:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2176:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1870:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1785:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2465:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1716:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1859:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2095:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2045:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1519:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2312:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2279:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2294:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2233:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1759:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2857:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1878:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2467:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2217:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2351:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2528:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2509:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2027:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2449:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2069:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2232:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2124:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2000:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.3142:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2041:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1660:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2115:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1807:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2344:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1728:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1818:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2057:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2539:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2539:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1531:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1710:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2054:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2351:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2451:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2246:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1658:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2878:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1697:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2208:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2281:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2100:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2173:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2460:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2490:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2218:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1936:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2138:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2156:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2384:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1982:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2421:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1914:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1616:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2613:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2261:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2200:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2037:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2433:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1922:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2087:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1950:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1761:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2488:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2330:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2009:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2578:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2113:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2113:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2598:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2191:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2316:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2460:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2009:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2677:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2645:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1912:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2037:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1811:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1810:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2370:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1753:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1758:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1604:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1839:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2025:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2572:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2248:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1837:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2118:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1962:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1835:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2498:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2129:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1554:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1768:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2622:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2154:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2134:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2421:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2733:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2047:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2071:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2806:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2051:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1407:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2507:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2320:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1941:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1941:  58%|█████▊    | 231/401 [02:38<03:24,  1.20s/it]training loss: 0.2297:  58%|█████▊    | 231/401 [02:38<03:24,  1.20s/it]training loss: 0.2210:  58%|█████▊    | 231/401 [02:38<03:24,  1.20s/it]training loss: 0.2495:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1879:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1897:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2424:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2021:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2266:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2278:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2377:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2502:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2281:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2391:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1835:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1729:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1746:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1774:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2617:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2482:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2211:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2291:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2532:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2585:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2125:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2325:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2714:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2317:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2717:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1969:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2061:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2350:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2269:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2414:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2601:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1726:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2911:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2397:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1886:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2284:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2103:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2022:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1852:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2303:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2322:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2278:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2483:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1961:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2458:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1880:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1692:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1916:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2307:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1980:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2206:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1954:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2052:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2260:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2252:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1970:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1429:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2377:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2447:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2410:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1915:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2154:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2974:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2281:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2484:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2029:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1971:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1794:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.2319:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.2524:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.2875:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.2129:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.1931:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.1881:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.2106:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.1011:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.1011:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2629:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2089:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2268:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2459:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2140:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.1743:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.1966:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2916:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.1972:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2180:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2815:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2308:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2162:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2655:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2560:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.1702:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2117:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2116:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2265:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2772:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.1912:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2262:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2287:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2174:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2407:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2789:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2017:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2000:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2342:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2526:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2331:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2301:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.1932:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2302:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2194:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1909:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1994:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2465:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2830:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2254:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2137:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2206:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2673:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2406:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1690:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2304:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1241:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2208:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2133:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1729:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2053:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2219:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1908:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2578:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2444:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2093:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1741:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2279:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2216:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1581:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2825:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1772:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2547:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2252:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1515:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2114:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2388:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2180:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2141:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.2434:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.2266:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.1940:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.2436:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.2259:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.1790:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.1944:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.1673:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.2568:  58%|█████▊    | 232/401 [02:44<04:53,  1.73s/it]training loss: 0.1842:  58%|█████▊    | 232/401 [02:44<04:53,  1.73s/it]training loss: 0.1842:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2455:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2198:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2104:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2444:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2087:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.1715:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.1792:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2334:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2470:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.1851:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2236:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.1951:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.1152:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2301:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2437:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.1912:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2169:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.1945:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2662:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2494:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2422:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2302:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1966:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2059:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1889:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1850:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1726:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2145:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2171:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1678:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2159:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2264:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2920:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2588:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1912:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2120:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2491:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2813:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2033:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2188:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2154:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2056:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2422:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1649:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1923:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2217:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2170:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2371:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2591:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2774:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1925:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2431:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1970:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1780:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1784:  58%|█████▊    | 233/401 [02:46<05:46,  2.06s/it]training loss: 0.2323:  58%|█████▊    | 233/401 [02:46<05:46,  2.06s/it]training loss: 0.2124:  58%|█████▊    | 233/401 [02:46<05:46,  2.06s/it]training loss: 0.2812:  58%|█████▊    | 233/401 [02:46<05:46,  2.06s/it]training loss: 0.2034:  58%|█████▊    | 233/401 [02:46<05:46,  2.06s/it]training loss: 0.2081:  58%|█████▊    | 233/401 [02:46<05:46,  2.06s/it]training loss: 0.2189:  58%|█████▊    | 233/401 [02:46<05:46,  2.06s/it]training loss: 0.1966:  58%|█████▊    | 233/401 [02:46<05:46,  2.06s/it]training loss: 0.2198:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.2337:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.2302:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.2614:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.2266:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.2339:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.1962:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.2452:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.1671:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.2792:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.1857:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.2286:  58%|█████▊    | 233/401 [02:48<05:46,  2.06s/it]training loss: 0.1732:  58%|█████▊    | 233/401 [02:48<05:46,  2.06s/it]training loss: 0.2251:  58%|█████▊    | 233/401 [02:48<05:46,  2.06s/it]training loss: 0.2029:  58%|█████▊    | 233/401 [02:48<05:46,  2.06s/it]training loss: 0.1527:  58%|█████▊    | 233/401 [02:48<05:46,  2.06s/it]training loss: 0.1114:  58%|█████▊    | 233/401 [02:48<05:46,  2.06s/it]training loss: 0.1114:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.1992:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.2071:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.1894:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.2443:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.2625:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.2461:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.3130:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.2232:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.1926:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.1864:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.1750:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.1625:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2089:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2332:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2444:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2434:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2255:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2083:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2252:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.1545:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2369:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2127:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2040:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.1637:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2076:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1794:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1643:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2302:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2139:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1503:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2632:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2641:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2340:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2643:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2148:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.3112:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2598:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2154:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1970:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1820:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2031:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2730:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2080:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2690:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2096:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2217:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1833:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2529:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1892:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2402:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2593:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2081:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2186:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2104:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1747:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2452:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2397:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2733:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2016:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2124:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2071:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2377:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2457:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2613:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2345:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1854:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1772:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2537:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1922:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1970:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2004:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1797:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2157:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2341:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2285:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2281:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2395:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2201:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.3495:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.3495:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.1953:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2334:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.1720:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2212:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2503:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2446:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2493:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2166:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2314:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2225:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2137:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2168:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2814:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2489:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2038:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2091:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2891:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.1870:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2178:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.1896:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2194:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2508:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2597:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.1774:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2286:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.1815:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2772:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2102:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1887:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2678:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2507:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2355:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2378:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2499:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2346:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2372:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2301:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1904:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2431:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2117:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2758:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1343:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2019:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2298:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1910:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1941:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2317:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1836:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2320:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1982:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2332:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2290:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1768:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1828:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2354:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1895:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2361:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2136:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2221:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2140:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2001:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2155:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1528:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1768:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2221:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2424:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2249:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1967:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2022:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1940:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2053:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1939:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2705:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2841:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2510:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2503:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2324:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2052:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2425:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2425:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2078:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2356:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.1538:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2429:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2286:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2472:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2373:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2951:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2206:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.3345:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2203:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2717:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.1963:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2335:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2253:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.1743:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2060:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.1993:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2130:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2884:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2342:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2065:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2163:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2481:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2116:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2164:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2025:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2252:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.1897:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2492:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.1954:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2215:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2967:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.1605:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2735:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2765:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1536:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2099:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2152:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.3078:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2687:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2200:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2310:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1763:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2564:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2594:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2261:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2033:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2424:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2144:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2026:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1795:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1952:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2164:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2105:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2250:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1875:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2007:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2257:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.3255:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2240:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2177:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1901:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2408:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2215:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2073:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2345:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2871:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1879:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2481:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2073:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2558:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1409:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1867:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1903:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2066:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2286:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2143:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1913:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1913:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2334:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.1732:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2753:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.1835:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2711:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2175:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2089:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2310:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.3774:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2298:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2012:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2614:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2637:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2058:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2268:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1771:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2112:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2168:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2335:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2807:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2354:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2107:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2539:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2459:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2438:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2730:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2184:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2289:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2077:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1912:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1937:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1708:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2675:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1949:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1952:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1916:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1513:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2806:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2145:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1832:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1733:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2290:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2030:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2217:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2151:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2622:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1489:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1974:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1699:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2540:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1780:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1706:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1575:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2139:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2079:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.3056:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1860:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2947:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1829:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2831:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2251:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2056:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2023:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1991:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2177:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2169:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1929:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1791:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2571:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1871:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1908:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1852:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2319:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2474:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1924:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2708:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2182:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2300:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.0802:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.0802:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2370:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2086:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1762:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1912:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1332:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2297:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2066:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2020:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2062:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1755:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1717:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2471:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2251:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2205:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2477:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2171:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2655:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2210:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2861:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1691:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1758:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2297:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2232:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2497:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2626:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1976:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2306:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2218:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1667:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2190:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2407:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2233:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2145:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2625:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2124:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2485:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2488:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2066:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2450:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2064:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2250:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2243:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2021:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2589:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1583:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1583:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1948:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2145:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2166:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1392:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2638:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2463:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2544:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2353:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1994:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2539:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2644:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2930:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2361:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2118:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2140:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2499:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2572:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1462:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2313:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.2183:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.1994:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.1871:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.2077:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.2440:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.1820:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.1990:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.1797:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.1882:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.2262:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.2594:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.3037:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.2077:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.3627:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.3627:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1951:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1895:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2008:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2819:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2014:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.3038:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2468:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1871:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2391:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2013:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1767:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2276:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1521:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2571:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2211:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1716:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2024:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2101:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1989:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2445:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2190:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2258:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1995:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2218:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2307:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2370:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2469:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2281:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1661:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2815:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1824:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1972:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2028:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2319:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1985:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2446:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2261:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2252:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2692:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1678:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2157:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2260:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2547:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2092:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1881:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2293:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2557:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2258:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2394:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1771:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2066:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2638:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2368:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1463:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2249:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2179:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1679:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2235:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2022:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2516:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.3084:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1991:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2170:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2061:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1689:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.3088:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2360:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.3058:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1414:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2223:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2264:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2147:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1656:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1697:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2279:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1785:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2094:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2278:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1051:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1051:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2492:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2197:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2607:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2072:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2198:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2249:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2149:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2097:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2031:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2297:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2775:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2531:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2409:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2110:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2507:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.1813:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2263:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2377:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2354:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2510:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2716:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2220:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2393:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2156:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2012:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2526:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2269:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2063:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.1606:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2374:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.1735:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2263:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2368:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.1965:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2235:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2090:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2413:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.1698:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.1789:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.1772:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2467:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2621:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.1312:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2162:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2128:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2544:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2253:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2618:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2067:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2041:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2209:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2489:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.1886:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2399:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2215:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2689:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2080:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.1941:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2113:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2071:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2691:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2057:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.1862:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2384:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2425:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2129:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2173:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.1365:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2024:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2066:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.1927:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2343:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.1860:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2037:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2350:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2517:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2306:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2289:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2701:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2701:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2273:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1999:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2452:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1652:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2039:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2586:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1917:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2032:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1819:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2436:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2281:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1757:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1981:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2912:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2704:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2582:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2240:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1922:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2305:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2078:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2347:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1890:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2431:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2480:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2052:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2359:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2857:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2659:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2017:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2195:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2335:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2692:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2207:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2352:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1931:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1521:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2446:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2074:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1663:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2074:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1956:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2199:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2562:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2665:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2224:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1828:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1642:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2118:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2443:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2044:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2529:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1699:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2414:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2137:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2590:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2385:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1807:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1912:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2056:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2232:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2170:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2639:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1657:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2176:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1696:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2415:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2091:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2037:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.3185:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2280:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2098:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1856:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2600:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1968:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2045:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1683:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2877:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1945:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1306:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1306:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2104:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2435:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1969:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2258:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1998:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1991:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2616:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2378:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2443:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1964:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2140:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2260:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2231:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1853:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2274:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1705:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1766:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1594:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1833:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2346:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2598:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2946:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2180:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1741:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1876:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2003:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1765:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1900:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2243:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.3047:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1986:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2299:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2879:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2709:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2175:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2655:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2367:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2458:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1931:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2940:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2005:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1904:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1983:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2788:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1967:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2545:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2704:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2142:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2299:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1672:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2032:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2203:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1862:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2221:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2507:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2515:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2589:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1961:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2274:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1929:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2592:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1970:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2226:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2571:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2226:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2400:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2401:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.1786:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2384:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2089:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2322:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2313:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2088:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.1871:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2055:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2348:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2346:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2024:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.1953:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.1953:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2286:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2311:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1815:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1731:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2178:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2628:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2311:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2483:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.3051:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2521:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.3368:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2029:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1518:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2209:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2938:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2165:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1990:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2362:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2602:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2598:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.3312:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2048:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2085:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1838:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2431:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1874:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2075:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2192:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.3063:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2220:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1446:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1769:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2586:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1900:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1720:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1833:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1875:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2834:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1603:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2445:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2730:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1969:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1659:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2386:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2592:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1462:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2619:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1826:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1758:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2319:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2201:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2344:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1901:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2574:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1886:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1822:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2370:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2623:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1940:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2226:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2800:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2122:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1799:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1823:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2122:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2288:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2246:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2411:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2308:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2289:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1886:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2154:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2131:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1403:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2715:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1999:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1683:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1832:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.4276:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.4276:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2302:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2453:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2131:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.3028:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1891:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2361:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2042:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2745:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2079:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2302:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1874:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2132:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2448:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1602:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2065:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2251:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2074:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2846:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2446:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1990:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1815:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1463:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2026:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1874:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2601:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1658:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2136:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1648:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1889:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2294:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2276:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2134:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1583:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2687:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2460:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2195:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2415:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2336:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2292:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1647:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2386:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2639:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1859:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1721:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2748:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2370:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1969:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1519:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2330:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2205:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1992:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2260:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2432:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2161:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2146:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2175:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2350:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2071:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1886:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1884:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2304:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2065:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2034:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1855:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2496:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2877:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2399:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2489:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2447:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2398:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2062:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1746:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2216:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1895:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2064:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2487:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1842:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2538:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1085:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1085:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2093:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2598:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2510:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2870:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2330:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2911:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.1952:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.1919:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2381:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.1820:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2518:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2068:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.1748:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2483:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.1508:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2335:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2272:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2287:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2513:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.1926:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.1980:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.1945:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2525:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2013:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2173:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2235:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1924:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2086:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1860:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2146:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1947:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2257:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1643:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2934:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2166:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2318:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1687:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2005:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2656:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2259:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2025:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2712:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1728:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1907:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2384:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2167:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1683:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2248:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2421:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1893:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2163:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2723:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2248:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2218:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1959:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1835:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1976:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1914:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2541:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.3049:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2176:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1855:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1851:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2745:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1774:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1796:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2316:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2293:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2362:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2049:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2397:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2192:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2240:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2425:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2129:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2194:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2213:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2439:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1505:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1505:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2258:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1724:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2389:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2744:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2192:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2253:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1864:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1695:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1640:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1878:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1882:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1693:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2493:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1349:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2169:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2295:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2237:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1598:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2063:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2353:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1905:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1930:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2803:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1779:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1894:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2446:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1871:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1931:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1769:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2465:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1731:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1440:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1699:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1821:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2266:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2449:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1828:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2182:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2971:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2196:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1725:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2093:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2056:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1925:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1860:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2658:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2135:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1532:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1819:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1991:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1439:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1836:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2106:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2390:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2169:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2264:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2849:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1712:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2029:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2296:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1681:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2196:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2197:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2072:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2023:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1714:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1532:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2110:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2233:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1770:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2352:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2684:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1735:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1447:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1920:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2028:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1791:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1865:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.3429:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.3429:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1900:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1647:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1793:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2282:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2283:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1844:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1788:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1899:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2180:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2715:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2541:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1886:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1551:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1679:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2761:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2088:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1810:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2341:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2615:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2553:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1936:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1857:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2410:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2135:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2341:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2882:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.3100:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2103:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2152:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2444:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.3082:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1887:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2356:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1842:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1856:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2180:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1636:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1840:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2404:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1960:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2405:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2237:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2366:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2224:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2296:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2065:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2285:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2399:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2477:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2308:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2530:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1713:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2340:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1632:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2518:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1882:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2045:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2144:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1979:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1960:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2067:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2813:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2388:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2451:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.3025:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2149:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2335:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2339:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2807:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.3057:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1758:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1810:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2346:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1673:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1415:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2011:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1641:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2924:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1463:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1463:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1967:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2440:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2020:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2543:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2540:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2023:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2287:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1906:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2476:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2206:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1693:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2702:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2568:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2829:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2116:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1975:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1956:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1871:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1520:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2028:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2625:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2517:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1602:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2108:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1835:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1858:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1979:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2045:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2208:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2978:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2157:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2603:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2284:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1954:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2302:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1949:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1843:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1973:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1848:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2475:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1750:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1966:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2123:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2102:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1827:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2322:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1890:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2030:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2034:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2372:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2024:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2418:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.1588:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.1895:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2026:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2369:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2295:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.1893:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.1964:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2611:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2243:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2315:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.1902:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.1693:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2213:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2553:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.1750:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.1776:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2081:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2351:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2571:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2055:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2930:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.3171:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2301:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2223:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2290:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2090:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2219:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2219:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1882:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2274:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1732:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2072:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2088:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2266:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2316:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1678:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2720:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1916:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2106:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2311:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1805:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1824:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1996:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2513:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1771:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2334:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2073:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2376:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2497:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2507:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1678:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2147:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2547:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2666:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1781:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2719:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1882:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2126:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1894:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2817:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2219:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1990:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1553:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2265:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1848:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1948:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1797:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2109:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2184:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2444:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2340:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1917:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.3051:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1534:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1681:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1991:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2634:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1915:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2346:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2168:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2357:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1830:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2078:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2399:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2056:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1912:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2684:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2439:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1741:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2093:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1766:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1823:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2177:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2129:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2947:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1960:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1935:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2276:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2255:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.3098:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2092:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2085:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2241:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2753:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2363:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2924:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1919:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1919:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1967:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1875:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2060:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1864:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2198:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1721:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2713:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2147:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2233:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1949:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1993:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2305:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2196:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1783:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1988:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2029:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1951:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2072:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2095:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1514:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2100:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2004:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2024:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2218:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2132:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2525:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2127:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1867:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2310:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2727:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2051:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2600:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2100:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2085:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2759:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1984:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1904:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2279:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2156:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1974:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1769:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2371:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1846:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1969:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1893:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1584:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2797:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2233:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2150:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2059:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2345:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1859:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2320:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2548:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1897:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1912:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.3119:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1750:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2505:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2887:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2022:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2332:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1954:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2620:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2021:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2026:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2596:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1930:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1651:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2411:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2535:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1740:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2628:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1819:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1804:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2080:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2249:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2161:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2561:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2561:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2464:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2040:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1988:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2329:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2547:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1839:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1928:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2710:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2345:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2244:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2692:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2723:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2333:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2073:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1693:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2286:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2303:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2011:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1913:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1860:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2570:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1749:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2046:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2313:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2332:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2191:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2934:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2418:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1568:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2189:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1833:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2336:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1559:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2039:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1980:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2128:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1936:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2646:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2171:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2013:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2134:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2603:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1891:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2188:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2097:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1875:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1806:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2833:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1958:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1494:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2402:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1705:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2215:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2414:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1775:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2001:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2773:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2355:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2244:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2028:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2537:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1967:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2229:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1929:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1893:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2742:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2168:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1845:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1776:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2254:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1952:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2053:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1757:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2485:  63%|██████▎   | 251/401 [03:07<03:44,  1.50s/it]training loss: 0.2148:  63%|██████▎   | 251/401 [03:07<03:44,  1.50s/it]training loss: 0.2233:  63%|██████▎   | 251/401 [03:07<03:44,  1.50s/it]training loss: 0.2208:  63%|██████▎   | 251/401 [03:07<03:44,  1.50s/it]training loss: 0.1681:  63%|██████▎   | 251/401 [03:07<03:44,  1.50s/it]training loss: 0.1682:  63%|██████▎   | 251/401 [03:07<03:44,  1.50s/it]training loss: 0.1682:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1649:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1939:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2005:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1963:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2428:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2070:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2222:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2467:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2031:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2462:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2429:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1902:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2082:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1787:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2213:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2177:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2233:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1775:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2026:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2332:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2418:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2217:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2520:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2310:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2086:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1967:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1860:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1983:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1761:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1846:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2108:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2203:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2524:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1863:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2321:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2124:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1693:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2521:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2672:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1644:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1904:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2078:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2315:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2432:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2401:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1884:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2327:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2034:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2135:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2198:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2295:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1514:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2528:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1994:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1654:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1838:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1740:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2619:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2099:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2149:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2791:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2472:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2049:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2048:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2163:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2169:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2298:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2417:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1888:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2406:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2387:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2199:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2258:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2231:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2270:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2523:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1915:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2003:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1565:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1565:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2448:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2983:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2038:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1624:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1702:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2281:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2095:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2992:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2369:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1594:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2197:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1944:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1851:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1788:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2942:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2084:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2472:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2009:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2182:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1991:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1668:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2220:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1960:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2212:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2038:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2455:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2291:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1873:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1386:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2039:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2203:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1646:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2927:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2018:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2207:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1795:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2133:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2548:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2194:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1952:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2097:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1875:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1697:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2258:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2556:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1710:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2191:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1709:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2821:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1939:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2267:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2422:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2617:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2179:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2414:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2205:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2164:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.1836:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2003:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2865:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2051:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.1774:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2033:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2089:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2169:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2097:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2427:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2455:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2591:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2179:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2655:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.1953:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2022:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2098:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.3100:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.1975:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2400:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2877:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.1863:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.1863:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2570:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2088:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2283:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1833:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2861:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1689:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1835:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2435:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2083:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2342:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1982:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2354:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2175:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2085:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2301:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2063:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1916:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1997:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2495:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2106:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2524:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2045:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2077:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2142:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2107:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2022:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2096:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2074:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1488:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1978:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1654:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2497:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1866:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1755:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1936:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2080:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1962:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1970:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2282:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1850:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2556:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1902:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1821:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1495:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2452:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1360:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1805:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2487:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2281:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2337:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2278:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1996:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2057:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2387:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1987:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2337:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2088:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2775:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1994:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1799:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1988:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2409:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2108:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1588:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2133:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2182:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2058:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2086:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2043:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2233:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2180:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1693:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2273:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2180:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2318:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1838:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2000:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2096:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1131:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1131:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1856:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1612:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2336:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.3484:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1809:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1963:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2299:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1914:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2132:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1541:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2253:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2035:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1877:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2406:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2049:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2302:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2797:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1829:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2128:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2191:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1897:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2689:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2192:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2281:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2182:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2329:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1789:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2103:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2167:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2123:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1691:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2070:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2006:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2138:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.3107:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1801:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2124:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2241:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1981:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2130:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2763:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1831:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1993:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1945:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2658:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2345:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1987:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1697:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1965:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1741:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2856:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2081:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2404:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2030:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2244:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1938:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1904:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2065:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1897:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1751:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1942:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2409:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2732:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1947:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2172:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2032:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2097:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2283:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2011:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1523:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1740:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1760:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2480:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2820:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2056:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2078:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2605:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2606:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2671:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2671:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1949:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2360:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1826:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2151:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2510:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1697:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2065:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1809:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2058:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2545:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1838:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2096:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1800:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2038:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2180:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1681:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1913:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1976:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1990:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1872:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2078:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2756:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2105:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2482:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2371:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2079:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1561:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1950:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1872:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2772:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2211:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2143:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2021:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1989:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2501:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2445:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2111:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2751:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1702:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1760:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2812:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2394:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2381:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1955:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1745:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2120:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1928:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2175:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1803:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1967:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2454:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2042:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1592:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1962:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2352:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2719:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2406:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2331:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.1803:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2119:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2707:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.1761:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.1828:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2385:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2615:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.1908:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2625:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.1810:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.1943:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.1985:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2203:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.1687:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2023:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2528:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2568:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2035:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2072:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2425:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.0942:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.0942:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1967:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2119:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2295:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2244:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1895:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2155:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2160:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2072:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1572:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2094:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1571:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2331:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2330:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2010:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2161:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1792:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2896:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1665:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.3054:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2197:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2043:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1866:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1674:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1812:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2842:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2049:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2314:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1956:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2140:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1524:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2712:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2087:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2936:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2828:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1887:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2377:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1843:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2871:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2000:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2086:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2686:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2026:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2109:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1746:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2063:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2059:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1704:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2082:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1969:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1995:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1732:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1719:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2243:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2545:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2178:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2133:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1816:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2227:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1890:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2377:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2142:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1944:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2261:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2093:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2066:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1945:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1871:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1433:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1383:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1866:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2068:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2724:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2251:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1751:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1805:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1660:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2077:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1881:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.3546:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.3546:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.1972:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2052:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2595:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2677:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.1498:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.1660:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2558:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2355:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2682:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2571:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.1727:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.1522:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2511:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2056:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.1669:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2571:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2170:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2083:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2127:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2155:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1640:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2626:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2087:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2134:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1847:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2962:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2429:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1791:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2245:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2260:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2617:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2113:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2053:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2256:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2489:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1806:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2162:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1972:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1950:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2769:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2271:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2500:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2203:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2114:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2029:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2267:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2251:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2160:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2515:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1838:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2571:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2402:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2429:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2587:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2052:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2167:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2055:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1856:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2596:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1902:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2196:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1917:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2593:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2007:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2205:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2163:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1738:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1997:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1571:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1859:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1742:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1679:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1990:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2835:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2074:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2175:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1759:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1966:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.3256:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.3256:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2480:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2048:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.1860:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2992:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2124:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.1196:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2228:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2380:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2155:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2412:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2569:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.1667:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2226:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.1957:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.1863:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2431:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2201:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2207:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2360:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2050:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2454:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2174:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2332:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2265:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.1882:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2091:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2341:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.1919:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2703:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2086:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2550:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2388:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2485:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2273:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1817:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1850:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2088:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1927:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1887:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2414:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2296:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1904:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2015:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2400:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1914:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2118:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2361:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1624:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2514:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2692:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1962:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2584:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1989:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2206:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2019:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2375:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2121:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2228:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2100:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2052:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2093:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2552:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1450:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1817:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2001:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2133:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1906:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2450:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2401:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1965:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1762:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2025:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2477:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2296:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2534:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1870:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2062:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2277:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.3010:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.3010:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2174:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1617:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2552:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2195:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1791:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2121:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2159:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1913:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2870:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2053:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2639:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2194:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1721:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2610:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1928:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1909:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2096:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1895:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2620:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2126:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1887:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2141:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2190:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2637:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2582:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2682:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2450:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2449:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2145:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2246:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2063:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2422:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2625:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2106:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1868:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1706:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1780:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2241:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2080:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2621:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2294:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2157:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1688:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2277:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2295:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2137:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2053:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1874:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1691:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1773:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2299:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2415:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2517:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1807:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1671:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2107:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2567:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2139:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1434:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1682:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1926:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2939:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2053:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1951:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1900:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2160:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1700:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1908:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2571:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2061:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2717:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1874:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2138:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2145:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2800:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1631:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1995:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2110:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.4279:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.4279:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.3068:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1795:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2427:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2155:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2016:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1423:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2492:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1726:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2380:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2070:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2263:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1764:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.3111:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1699:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1368:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1713:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2320:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2042:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1773:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2276:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2190:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1978:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2115:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2827:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2709:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1994:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1728:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2186:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1663:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1983:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2048:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2413:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2101:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2087:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2236:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1776:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2216:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2078:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2698:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2095:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2193:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2383:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2528:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2070:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2238:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1766:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1942:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.3169:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2261:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2337:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2358:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2507:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2622:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2128:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2335:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2660:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2102:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2919:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2455:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.1695:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.1775:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2140:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2151:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2250:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2263:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2367:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2053:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.1883:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.1486:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2209:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.1701:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.1817:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2260:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2068:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.1969:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2504:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2076:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.1667:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2544:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2544:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1847:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2613:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1895:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2395:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2043:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1916:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1963:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2298:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1774:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2476:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1742:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2593:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2011:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2652:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1779:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2354:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2068:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2083:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1848:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2422:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1714:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2115:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2108:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2476:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1834:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2147:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1880:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2694:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2192:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2464:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2230:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2271:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2411:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2097:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1957:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2535:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2009:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2517:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1765:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2216:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1708:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1684:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2517:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1683:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1904:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1707:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1970:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1968:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1899:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2273:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2132:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1859:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1690:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2139:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2055:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1964:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1587:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1797:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2142:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1769:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2231:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2107:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2452:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2377:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2326:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2131:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1594:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2137:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1885:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2339:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2252:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2438:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2394:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2040:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2171:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2144:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2655:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2037:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1858:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1858:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2480:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2639:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2090:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1780:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1902:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2456:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2342:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2204:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1858:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1927:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2252:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2396:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2502:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2436:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1877:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1734:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1874:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2225:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2192:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1455:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2044:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2743:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1993:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1988:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2137:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2497:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1722:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2099:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2338:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1948:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2471:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1836:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2574:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1591:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1629:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2652:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2311:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1894:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1592:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1855:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2105:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1982:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2311:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1640:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1825:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2071:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1840:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1744:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2813:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2184:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.1911:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.1632:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2844:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2237:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.1714:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.1733:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2247:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2399:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2102:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2020:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2075:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2098:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.1969:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.1863:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2352:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.3057:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.1984:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.1925:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2515:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2286:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2608:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2073:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2735:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2207:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2441:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2256:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2435:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2358:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2440:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2440:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1629:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2274:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1770:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2377:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1715:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1957:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1916:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2472:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2513:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2081:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2602:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2204:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2117:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2459:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1642:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1749:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2044:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1729:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2171:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1790:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2048:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1983:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1642:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2129:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2233:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2246:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1954:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2139:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2450:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1797:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2045:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2042:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2369:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1876:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2154:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2417:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2244:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1518:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.3318:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2225:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2233:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.3051:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2294:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2554:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1954:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2215:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2030:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2654:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1819:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2325:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2533:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1882:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2038:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1913:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1954:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2490:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1789:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2324:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2017:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2004:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2467:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2282:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2419:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2077:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2358:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2118:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1962:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1667:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1908:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.3080:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2367:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2446:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2381:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2229:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2401:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2250:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1739:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2020:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.3313:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.3313:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2212:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.3159:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2287:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2663:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1568:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1534:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2771:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1674:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1706:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2771:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2354:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1939:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1738:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2271:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1757:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2133:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1674:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1887:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2121:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2384:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1951:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2180:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2113:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1671:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2435:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2050:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2266:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2374:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2415:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1875:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1974:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2114:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2083:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2220:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1626:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2180:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2494:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2567:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2009:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2257:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1989:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2037:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2267:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2937:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1521:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2062:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1707:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2260:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2424:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2199:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2676:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2075:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2374:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1935:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2168:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2159:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2257:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2675:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2671:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2178:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1780:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1580:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1857:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2189:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2893:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1988:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2661:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2078:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2401:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1902:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1883:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2398:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1994:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1828:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2284:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1909:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1646:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2596:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2322:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2322:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2257:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2266:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2079:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2216:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2078:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1653:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2290:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1734:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2363:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2045:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1970:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2028:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1847:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2242:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1786:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1961:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2382:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1802:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1778:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2519:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2332:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1850:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2575:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2105:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1713:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2063:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1810:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1796:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2356:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2221:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2308:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2378:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2251:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2340:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1997:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2030:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2400:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1765:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2446:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1921:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2536:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2272:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1929:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2142:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2816:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2202:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1859:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2422:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2005:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1876:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2145:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1686:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2315:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1589:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1898:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1790:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1811:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1906:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2390:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1995:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2295:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2531:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1993:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1616:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2248:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1993:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2178:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2023:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1796:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2064:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1896:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2076:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2114:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2290:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2000:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1919:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1820:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2098:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1170:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1170:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2198:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1976:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2057:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2013:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1878:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2296:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2481:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1617:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2368:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2493:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1558:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2166:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2231:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1918:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.3253:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2426:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1608:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2042:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2005:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2031:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2123:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2812:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1889:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1775:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2264:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2138:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2210:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2102:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2871:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2595:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2241:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2138:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1706:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2001:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1860:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1488:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2650:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1985:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1815:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1863:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1737:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1395:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1365:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1502:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1797:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1857:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2053:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2084:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2679:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2351:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2183:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2216:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1780:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2144:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2302:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2139:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.1984:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2075:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2561:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2241:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2364:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2274:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2516:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.1677:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2162:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2704:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.1586:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2098:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2821:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2176:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2285:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2324:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2115:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2279:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2128:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2133:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.1894:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2331:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2855:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2855:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1791:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2197:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2392:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2470:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2574:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1954:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2169:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2057:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2171:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1775:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2242:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2106:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2563:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1776:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2144:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1845:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2734:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1793:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2105:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2411:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2450:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2226:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2087:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1813:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2380:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2233:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2022:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2373:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2494:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2394:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2743:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1836:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2182:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1747:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2989:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1941:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2550:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1893:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2093:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2184:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1418:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2525:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2452:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2521:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2396:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2315:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2390:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2268:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2136:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2530:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2043:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2221:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1685:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1793:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2034:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1937:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2324:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2100:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1882:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1626:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1959:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1952:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1994:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2006:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2219:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2377:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2102:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1846:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2691:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2673:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1602:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2638:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2210:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2359:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2243:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1966:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2610:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2317:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.3079:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.3079:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2312:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2253:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2438:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1903:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1979:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2437:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2110:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2287:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1701:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2012:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2307:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1309:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2354:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1947:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1627:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2193:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1861:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2012:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1770:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2095:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2622:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2108:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2051:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2323:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2471:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2193:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1909:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2004:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1632:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2058:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1939:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2327:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2225:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2232:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1764:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1715:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2211:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2161:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2816:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1863:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1986:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1967:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2360:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1823:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2513:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2372:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2090:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1937:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1883:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1804:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1943:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.3022:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2263:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2362:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1573:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2074:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2037:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1918:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2129:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2668:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2293:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1760:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2239:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2303:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2570:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2246:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2359:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1816:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1944:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1723:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2195:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2036:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2882:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2241:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2833:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2554:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2212:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1931:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1102:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1102:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1711:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2246:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.3184:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1665:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2419:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2421:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2169:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2381:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1914:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2326:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2337:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1733:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2108:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1871:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2384:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1908:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.3142:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2861:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1956:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2043:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2032:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2086:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2064:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2760:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2265:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2692:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1512:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1950:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1384:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2293:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2125:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2700:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2246:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2241:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2660:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1787:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2672:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2202:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1929:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1810:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2262:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2118:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2465:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1918:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2033:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2140:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1919:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2600:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2213:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2830:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2031:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1812:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1820:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2069:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2243:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2228:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2377:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1883:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2653:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2016:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2058:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2638:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1942:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1972:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1945:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2066:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2763:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1807:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1874:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2176:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1789:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2001:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2096:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1986:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2246:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1727:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2067:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2095:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.3484:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.3484:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2113:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2079:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2029:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2566:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2427:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1983:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1637:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2069:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2199:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2299:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2587:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2821:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2869:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2162:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2353:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1811:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2604:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2157:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2179:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2462:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2084:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1893:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1967:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2511:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2068:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1768:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1777:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1828:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2043:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2527:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1694:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1925:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2079:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1958:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1788:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2535:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2402:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1799:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2091:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2089:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1756:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2143:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2240:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1773:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2326:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2233:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2548:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2287:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2879:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2077:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2058:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2640:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2180:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2038:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2518:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2450:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1950:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2573:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2005:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1664:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1445:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.3009:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2418:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.2029:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1897:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1703:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1843:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1950:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.2055:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.3466:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.2104:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1569:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1795:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1671:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.2253:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.2414:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.2745:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1882:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1784:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1784:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1980:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2218:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1978:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2351:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1745:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.3055:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2616:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2433:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2448:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2075:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2799:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1925:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1797:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2315:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2072:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2376:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2039:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2251:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2443:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1801:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1852:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1790:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2501:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1754:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2533:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2171:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2234:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2335:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2064:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2070:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1986:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2466:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1727:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2467:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2176:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2072:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1814:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2347:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2191:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2321:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1679:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2117:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2187:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2422:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2300:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2261:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2280:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2104:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2511:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2187:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2044:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1744:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2089:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1831:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2848:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2210:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2074:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2187:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2104:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2175:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2062:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2394:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2190:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1956:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1843:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1881:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2039:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2600:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1862:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2173:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2253:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1388:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1987:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2606:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1531:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2249:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1672:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1733:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1436:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1436:  68%|██████▊   | 273/401 [03:27<02:18,  1.08s/it]training loss: 0.1824:  68%|██████▊   | 273/401 [03:27<02:18,  1.08s/it]training loss: 0.1970:  68%|██████▊   | 273/401 [03:27<02:18,  1.08s/it]training loss: 0.2659:  68%|██████▊   | 273/401 [03:27<02:18,  1.08s/it]training loss: 0.1684:  68%|██████▊   | 273/401 [03:27<02:18,  1.08s/it]training loss: 0.2727:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2248:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2502:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1600:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2539:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2347:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1788:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2163:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2331:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2305:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2506:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2440:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1922:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2495:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2538:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2609:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1703:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1787:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2353:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1807:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2360:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2004:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1788:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2249:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2512:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1937:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1929:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2098:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2214:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2321:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1956:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2959:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2771:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2610:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1946:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2337:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2482:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1501:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2360:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2381:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2246:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2030:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2163:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1962:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1577:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2446:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2125:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2224:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2285:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2111:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2326:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1760:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2226:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2546:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2197:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2731:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2029:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1706:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1821:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1567:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1907:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1707:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2348:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1914:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1871:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1959:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1966:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2190:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2054:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2450:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1584:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1905:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2179:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2439:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1393:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1393:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2190:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2278:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1798:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1865:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2543:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2529:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2427:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1531:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2386:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2219:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2182:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2192:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2335:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2117:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2785:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1896:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1666:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2051:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1949:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1666:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2780:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2060:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2318:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2364:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2703:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2006:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1986:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2163:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1931:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1937:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2296:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2105:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2028:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2400:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2053:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1650:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2998:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2497:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2646:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2884:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2352:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2124:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2071:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2380:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2396:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2654:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2375:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2576:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2631:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1920:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1934:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2244:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2440:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2296:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2642:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1995:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2135:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1778:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2540:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1806:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2083:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2619:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2136:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2142:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2022:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2104:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2726:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1716:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1787:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2634:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2272:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2337:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2067:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2902:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1795:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2212:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1615:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1983:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1753:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1753:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2101:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2226:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.1975:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2182:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.1364:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2163:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2462:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2015:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.1572:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2567:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2188:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.1750:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2070:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2628:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2182:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2439:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2259:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2080:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2377:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2011:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.1988:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2403:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.1618:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.1916:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2000:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2488:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2474:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2419:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1994:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2584:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2366:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1938:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2628:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2120:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1555:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2177:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2048:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1777:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2630:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1913:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.3251:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1988:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2122:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1967:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2294:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2254:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1592:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2234:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2308:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2289:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1662:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2344:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1966:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2211:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2637:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2212:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2139:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1809:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1747:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2079:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1525:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2202:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2225:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2201:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1995:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1852:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2569:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2170:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2444:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2061:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1911:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1889:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2281:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2437:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2468:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1798:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2505:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2053:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2040:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2040:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2015:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2094:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1869:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2263:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2458:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2165:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2634:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2299:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2026:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2506:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2078:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1966:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2278:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1760:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1821:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2659:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2392:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2721:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1667:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1707:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1717:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2686:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2026:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1658:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2223:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2475:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2112:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2378:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2331:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2167:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1969:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1716:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2284:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1877:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2510:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2194:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2796:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2381:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.3066:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2044:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1821:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2122:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2342:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1965:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1865:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2260:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2311:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1788:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2670:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2129:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2234:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1661:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2174:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2060:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2714:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1946:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2624:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2012:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2143:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2803:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2684:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1995:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2446:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2358:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1626:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2067:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2392:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1825:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2235:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2549:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1933:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1340:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2307:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1868:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1919:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1723:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2117:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2019:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2733:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2733:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2112:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2000:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2031:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2411:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2180:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2412:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2101:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1931:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1781:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2192:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2632:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2542:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2329:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1860:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1575:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1949:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2015:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1966:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1891:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1940:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2220:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1894:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2233:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2145:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2514:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2372:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2506:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1909:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1897:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2231:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2085:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2480:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2196:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2188:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1966:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2250:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2155:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2358:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2346:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2611:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2017:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2070:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2744:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2063:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1364:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2366:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2268:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1979:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1816:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1956:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1923:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2671:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1646:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1685:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2230:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2316:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1868:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2209:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1969:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1700:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2503:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2310:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2033:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1830:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2218:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2244:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2365:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2866:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1929:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1940:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2326:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2328:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1674:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2251:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1856:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1497:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2337:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2265:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1206:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1206:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2119:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1726:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2068:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2101:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1885:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2170:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2348:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2080:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2428:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1763:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1955:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1984:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1623:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2809:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1700:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2070:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1876:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2366:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2247:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2006:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2271:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2380:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2144:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2432:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1567:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2651:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1931:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2611:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1843:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2558:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2209:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1613:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2294:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2066:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2219:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1924:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1863:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1652:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1866:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2400:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2279:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1462:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1931:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1894:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2077:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2365:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2371:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2541:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2706:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1943:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2132:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1544:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1757:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1906:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1930:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2003:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2112:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2160:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1930:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1772:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2282:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1477:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1816:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2026:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2148:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2573:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2353:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2031:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1839:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.2174:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.2290:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.2214:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.3061:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.2426:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.1671:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.1629:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.2441:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.1919:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.1991:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.1991:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2711:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1785:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2645:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2052:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2131:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1927:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2550:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2027:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2785:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1610:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1381:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2267:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1850:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2392:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1348:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1922:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2080:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1820:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1791:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2647:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1937:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2104:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2136:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2097:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2104:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1866:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1836:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2220:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2372:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2449:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2163:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1902:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2270:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2268:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2373:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2296:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2379:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2099:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2429:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2037:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.3102:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2135:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1598:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2194:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2225:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1833:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2557:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2532:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2308:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1774:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1599:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2473:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2152:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2045:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2399:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2103:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2089:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2630:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1760:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1918:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1963:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1898:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2272:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2733:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2410:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2229:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2438:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1954:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2565:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2162:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2200:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1968:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2060:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1924:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2302:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2654:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2272:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2331:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2830:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2830:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1632:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2022:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2016:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2371:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2327:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2204:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2053:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2206:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2260:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2578:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1897:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1494:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2302:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2613:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2218:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2236:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2419:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2295:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2301:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1593:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2342:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2134:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.3087:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2187:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2133:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2976:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1976:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2621:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1672:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2073:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1862:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2026:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2419:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1946:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2772:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1810:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2448:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2318:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1950:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2103:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1750:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1976:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2614:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1724:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2750:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2350:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1832:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2193:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2275:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2054:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2586:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2542:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2047:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1847:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2539:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2372:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2409:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2713:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2032:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2356:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2135:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2307:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2265:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2456:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1566:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2171:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2356:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2101:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2286:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2602:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2277:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2298:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2120:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2017:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2172:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2298:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1396:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2791:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2209:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2209:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2398:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1775:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2426:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2552:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2264:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2911:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2936:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2036:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2013:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2488:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1628:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2228:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2047:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2598:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1896:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2368:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1872:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2373:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2023:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1975:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2071:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2225:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1979:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2567:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2247:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2560:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1993:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2303:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1898:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1890:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2149:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2216:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1914:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2206:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2235:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2319:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2075:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1923:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2412:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1865:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2166:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2052:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2162:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2363:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1946:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2654:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2321:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2461:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1802:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1960:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2250:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1626:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2141:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2344:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1962:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2445:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2543:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2402:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2393:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2206:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1926:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2056:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1973:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2144:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2656:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1961:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2602:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1860:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2075:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1815:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2552:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2397:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2100:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2514:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2143:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2356:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2139:  70%|███████   | 281/401 [03:35<02:39,  1.33s/it]training loss: 0.2248:  70%|███████   | 281/401 [03:35<02:39,  1.33s/it]training loss: 0.1965:  70%|███████   | 281/401 [03:35<02:39,  1.33s/it]training loss: 0.1965:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1852:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2288:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2034:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2035:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2285:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2187:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1709:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2276:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1508:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2840:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1845:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2161:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1767:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1783:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2273:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2176:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2705:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2867:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1902:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2141:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2080:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1914:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2342:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1858:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.3176:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1870:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1699:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2271:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1831:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2046:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1987:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2025:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1869:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2232:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2595:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1932:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2053:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1944:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2005:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1723:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1874:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2050:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2444:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1793:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2103:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2613:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2401:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2257:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2251:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2465:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1808:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1858:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2636:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2095:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2116:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2073:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2141:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2396:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2830:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2515:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2236:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1607:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2512:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1970:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1895:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2192:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2735:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1850:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2324:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2189:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2169:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2821:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1877:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1713:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2352:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2248:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2053:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2142:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.0926:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.0926:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1738:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1978:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2764:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2056:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1979:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1869:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2005:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1740:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2138:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2574:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1794:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2121:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2480:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2206:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1717:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2942:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1694:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1755:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2062:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2070:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2450:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1935:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2313:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2653:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2124:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1603:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2791:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1594:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2296:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1907:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1807:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2098:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2056:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1674:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2522:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1665:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1817:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2166:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2542:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2043:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2552:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1937:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1938:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2607:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1910:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2300:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2292:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1958:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1953:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2429:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1979:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1948:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2410:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2041:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1644:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2603:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1845:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2513:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1835:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2124:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2203:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2122:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2049:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1779:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2352:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2900:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2281:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2368:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2303:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2078:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2590:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2093:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1834:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2377:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2447:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1894:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2124:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2696:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1728:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1728:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2525:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1735:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2600:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1629:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1763:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2108:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2209:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2500:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2126:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2377:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2413:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1952:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2149:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2098:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2037:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2089:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1982:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2036:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2246:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2412:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2273:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1589:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2502:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1815:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1707:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2311:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2135:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2362:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1539:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2352:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1906:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.3093:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1959:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2506:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2006:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2240:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2076:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2372:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2006:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1415:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1896:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2158:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2334:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2017:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1828:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2247:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2203:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2043:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2243:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2148:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2420:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2421:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2256:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1951:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1883:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2172:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2415:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2272:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2456:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2780:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2255:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2277:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1563:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1955:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2258:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1754:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2501:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2517:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1844:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2166:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1627:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2211:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2111:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2027:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2081:  71%|███████   | 284/401 [03:36<01:19,  1.47it/s]training loss: 0.2286:  71%|███████   | 284/401 [03:36<01:19,  1.47it/s]training loss: 0.2178:  71%|███████   | 284/401 [03:36<01:19,  1.47it/s]training loss: 0.1794:  71%|███████   | 284/401 [03:36<01:19,  1.47it/s]training loss: 0.2719:  71%|███████   | 284/401 [03:36<01:19,  1.47it/s]training loss: 0.2719:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1598:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2185:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2354:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2109:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2066:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1860:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2069:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1986:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2183:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2627:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2373:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1762:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1771:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2441:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2106:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2094:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2235:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2749:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1572:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2513:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2335:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1900:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1889:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2671:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1597:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2583:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2266:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1913:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2789:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1912:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.3236:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2645:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2077:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2644:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2406:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1688:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2007:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2419:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2223:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2235:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1958:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1788:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1806:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2211:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2325:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2585:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1597:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2198:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2590:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1962:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1743:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1872:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2171:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2997:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2022:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1952:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2297:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2353:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2033:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1903:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2061:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2805:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1942:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2086:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2420:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1719:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1760:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2111:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2114:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2635:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2521:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1956:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2399:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2525:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1896:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2365:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2377:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2870:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1589:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1589:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2116:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2148:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1484:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1645:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1688:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1873:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1879:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2348:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2421:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2576:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1819:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2017:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2329:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2267:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2316:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2312:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2321:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1761:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2196:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2269:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2343:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2480:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2533:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2716:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2113:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2377:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2677:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2569:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2076:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2394:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2456:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2629:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1628:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2277:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2229:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2323:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1502:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2200:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2094:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2419:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1798:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2042:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1984:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2376:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2558:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2353:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1674:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1649:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1749:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2118:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2135:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1920:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1816:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2496:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2477:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2146:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1600:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2176:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2336:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1982:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1697:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2388:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1687:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1995:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2603:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2465:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2237:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2418:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2394:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2092:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2004:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1834:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2233:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2478:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2111:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1924:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1909:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2344:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2512:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2512:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1491:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1822:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2680:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1725:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1413:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2560:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2651:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2541:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1957:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1547:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1860:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2077:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1996:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2170:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2148:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2501:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2102:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2549:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2155:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1636:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2619:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2200:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1607:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1563:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2161:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2300:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1902:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2007:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1988:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1780:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1764:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1970:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1896:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2996:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1913:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1894:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1546:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1850:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2561:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2102:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1730:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2088:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1849:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1807:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2531:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2336:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1747:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2052:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1871:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2594:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2289:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1978:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2290:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2131:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1589:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2022:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1727:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1784:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1956:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1329:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2051:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1744:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2312:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2287:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2622:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1496:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.1968:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.3065:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.2502:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.1790:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.1584:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.2793:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.1957:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.2428:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.2461:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.2404:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.2012:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.1753:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.1137:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.1137:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1746:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2695:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2984:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2259:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1959:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2470:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1941:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2070:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2508:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2209:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1744:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2147:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2417:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2435:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1919:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2147:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1677:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2336:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1399:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2011:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2655:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2342:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2347:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.3151:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2032:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2268:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2612:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2701:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1925:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2008:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2659:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1840:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2168:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2472:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2180:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1812:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2113:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2556:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1691:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2489:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1958:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2257:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2070:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2038:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2081:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2389:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1815:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2006:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1783:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1826:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1620:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2399:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2213:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2648:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2129:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2599:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2180:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1865:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2508:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1994:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2000:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2136:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1879:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2881:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1878:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2212:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2394:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1983:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1912:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2367:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1960:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2561:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1729:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2384:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1988:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2277:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1901:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2121:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2336:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2336:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2430:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2102:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2246:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2471:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2266:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2074:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1841:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1934:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2098:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2279:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2141:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2236:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1848:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2452:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1814:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2727:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1752:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2655:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2245:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1638:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2466:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1990:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2449:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2406:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2781:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2443:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2327:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1851:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2278:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1928:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2106:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2568:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2305:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2618:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2393:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1295:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2159:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2476:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2070:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2381:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2124:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2557:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2261:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2570:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2539:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1594:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1759:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2009:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1977:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2236:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1945:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1938:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1844:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1814:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2370:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2063:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2460:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2113:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2243:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1696:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2378:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2145:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2190:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1881:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2055:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.1977:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.1813:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.1897:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.2098:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.1939:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.2138:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.2189:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.2088:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.2038:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.1762:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.2772:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.2327:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.2073:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.1727:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.1727:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2018:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2103:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2120:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2315:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2559:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2401:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2117:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1993:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2339:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1993:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2592:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2344:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2576:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2607:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2281:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1755:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2198:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2038:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1949:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1978:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2754:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1838:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2208:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2256:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1697:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1406:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2155:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2633:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2290:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2298:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1725:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2337:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2086:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2553:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2366:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2442:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2135:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1513:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1673:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1963:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2289:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2161:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2368:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2316:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2146:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.3007:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2058:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2004:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1663:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2373:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2225:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2204:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1808:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2370:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2097:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2193:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1923:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1733:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2148:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2556:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2174:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2388:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2650:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2026:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1865:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2562:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2022:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1453:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1683:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2331:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2732:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2695:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2025:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1441:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2394:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2133:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2097:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2100:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1455:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1455:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.2263:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.3167:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.1703:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.2660:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.1915:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.1988:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.2068:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.1997:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.1984:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.1266:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.1993:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.2078:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.2672:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.2136:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.1801:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2102:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1987:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2133:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2075:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2337:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2664:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2162:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2188:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2667:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2156:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2149:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1689:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2339:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1962:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2412:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1886:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2112:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2019:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1612:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1709:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2386:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2168:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2069:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2364:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1932:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2426:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2000:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1985:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2281:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1938:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1804:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2253:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2139:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2745:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2517:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2197:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2363:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2069:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2531:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1691:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1806:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2405:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2226:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1878:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2164:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2330:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1959:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2132:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2024:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2109:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2428:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1809:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2488:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2738:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2184:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1778:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1882:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1951:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1920:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2475:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2306:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1961:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2185:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2400:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2400:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1544:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1757:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2314:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1606:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2880:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1966:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1705:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1701:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2020:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1819:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1859:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1950:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2388:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2577:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1948:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2106:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2353:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1979:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2173:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2166:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1765:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2787:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2437:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2729:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2457:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1975:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1654:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2447:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2127:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1906:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1894:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2213:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2315:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2661:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2291:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1839:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1812:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2046:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2548:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2282:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1991:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2127:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1968:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2284:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1884:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2073:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2298:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2360:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2040:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2585:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1738:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2150:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1856:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2202:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2133:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1585:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2162:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2647:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2522:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2832:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2069:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2014:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1879:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1868:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2396:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2068:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1709:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1917:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2170:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1873:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1972:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2155:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1751:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2305:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1777:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2265:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2039:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1939:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2008:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2008:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2121:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2306:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1860:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1677:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2318:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2184:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2425:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2016:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2735:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2109:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2479:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2292:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2004:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2464:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2050:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1830:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2153:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2367:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2292:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.3066:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2027:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1737:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2092:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1885:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2701:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2015:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2876:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1756:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2547:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2135:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1315:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1852:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1407:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2473:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2574:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2174:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2266:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2794:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1802:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1810:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1767:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2509:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2670:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2408:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2041:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1843:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2178:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2525:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2663:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2273:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2514:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2825:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2537:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2186:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2150:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1883:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2370:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2444:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1933:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2022:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1729:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2317:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2453:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2315:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2357:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2416:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2420:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2131:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1917:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.3193:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2049:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2064:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1842:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1937:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1972:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2156:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2564:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2089:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1939:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1939:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.1851:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.1669:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.2285:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.2511:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.2127:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.1955:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.2177:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.1795:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.1922:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.2525:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.1938:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.1668:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.1660:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2750:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1736:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1762:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1551:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1711:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2499:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1839:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2959:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1823:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2174:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1833:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2073:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1840:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2015:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1717:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2522:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2285:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2743:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2335:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2381:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2504:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1678:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2355:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2849:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2322:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2434:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1593:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2814:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2033:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2532:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1884:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.3026:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1888:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2151:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1825:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1494:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2479:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1709:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2960:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2040:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1955:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1956:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1831:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2708:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2583:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2126:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2082:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2245:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1845:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2243:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2433:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2128:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2497:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1925:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2359:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2323:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2292:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2155:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2564:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1662:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2738:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2270:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1228:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1876:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1908:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1163:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1163:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2815:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2342:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2636:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2035:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2511:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2774:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1862:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2374:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2540:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1761:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1926:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2270:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1715:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2230:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1983:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1842:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1730:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2933:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2497:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2595:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1930:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2205:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2123:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2388:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2185:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2041:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2583:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2040:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2242:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1996:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2103:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2266:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1388:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1827:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2292:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2757:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2543:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1724:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2183:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2522:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2291:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1825:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1803:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2034:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1908:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2005:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1807:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1848:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2735:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2121:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1938:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2452:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2007:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1920:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1975:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2566:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2060:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2487:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2161:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2077:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1961:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1755:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1977:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2338:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2245:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2350:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2134:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2078:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1613:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2128:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2492:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1463:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2359:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2314:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1976:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2246:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2059:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1878:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.3390:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.3390:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1650:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2467:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1796:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2656:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1837:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1801:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1496:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1977:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1914:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2155:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1582:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2800:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1940:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2313:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2320:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2885:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2091:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1688:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1887:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2460:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2280:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2111:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.3050:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1988:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2246:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1226:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1584:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1872:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1870:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2176:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1985:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2277:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1763:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2222:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2059:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1853:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2041:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2336:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2309:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2486:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2192:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1433:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1700:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1940:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.3357:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2129:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1835:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1461:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2047:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2072:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2257:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2737:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2298:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2290:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1625:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2114:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2018:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2422:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1660:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2528:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2038:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1826:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2062:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2541:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1786:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1771:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1739:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.2008:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.2340:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.1922:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.2162:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.1957:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.1739:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.1788:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.2427:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.2121:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.2033:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.1963:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.3168:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.3168:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2639:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1818:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1641:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1756:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2543:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2007:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2509:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2704:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1520:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2006:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2212:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.3085:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1903:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2448:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2388:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1913:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1939:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2475:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2051:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1784:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2304:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1976:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1949:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2013:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2774:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1929:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2533:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2576:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2249:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1629:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2641:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2177:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2280:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2409:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1706:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2531:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2629:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2586:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1999:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1930:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1761:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2340:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1698:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1514:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1417:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2275:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1962:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2216:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2226:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2015:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2085:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1884:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2110:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1624:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1964:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2720:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2221:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1479:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2051:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2345:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2108:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2144:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2157:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1954:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2395:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2225:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2158:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2208:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2551:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2142:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1886:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2470:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2578:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1898:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2383:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2481:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1761:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2140:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2525:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2525:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2481:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1887:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2128:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2271:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2015:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2290:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1871:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1826:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1794:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2243:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1826:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2058:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2278:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2482:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1714:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2270:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2246:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2173:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1839:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2165:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2029:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1402:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1758:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2383:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2305:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2435:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2215:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2346:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2644:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2180:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2071:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2072:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1976:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2097:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2253:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2716:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2232:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2018:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2164:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2889:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2413:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1835:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2201:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2517:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2087:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1588:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2049:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2008:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1837:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2029:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2874:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1975:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2558:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2522:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2220:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2057:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1863:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1977:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1978:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1732:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2398:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2430:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2207:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1460:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1885:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2438:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1974:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1746:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2165:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1932:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1910:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.3032:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1918:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1923:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1689:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2084:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2162:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2122:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.4140:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.4140:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2139:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1813:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1710:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2149:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2373:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2089:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1909:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2059:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2148:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1700:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1848:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2485:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2075:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2079:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2359:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2472:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1996:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1984:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1756:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2024:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1987:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1709:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2020:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2197:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2102:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2317:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2518:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1792:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1798:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2416:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1973:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2147:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2866:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1464:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2854:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1858:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1712:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2017:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2714:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2322:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2313:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1987:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2715:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2184:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2017:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2776:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2400:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2086:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2138:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2093:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.1844:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2249:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.1638:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2358:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2377:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2084:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2479:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2103:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2092:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2153:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2421:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2010:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2084:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2128:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2170:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2536:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.1875:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.1903:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2584:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2218:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2193:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2116:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2155:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2186:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2347:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2327:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2627:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.1895:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.5002:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.5002:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1828:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2585:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1999:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2450:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1996:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2199:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2123:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2508:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2680:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2252:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2620:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1970:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2126:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1917:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1678:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1669:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1803:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2148:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2549:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1829:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2278:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2268:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1430:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2234:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.3005:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1841:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2200:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2740:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1432:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2253:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2084:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1421:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2003:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1633:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2621:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1736:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2363:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2366:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2142:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1802:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2030:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2175:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2050:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2023:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2055:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2274:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2032:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2220:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1665:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2145:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1977:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2492:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1774:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2092:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2056:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2130:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1795:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2221:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2864:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2297:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2086:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2297:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1884:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1644:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2402:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1798:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1628:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2383:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1779:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2033:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2276:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2168:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2074:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2371:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2249:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2042:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1784:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1882:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.0961:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.0961:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2238:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1801:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1784:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1858:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1788:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2966:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1565:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1985:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2084:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1695:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1760:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1846:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2858:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2364:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2474:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2114:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2616:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2910:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2749:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1743:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2539:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2223:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2224:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2121:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1908:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2086:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1681:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1906:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2499:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1671:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2117:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2757:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2161:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1606:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2170:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1904:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1937:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2310:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2101:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1741:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2515:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1791:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2218:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1973:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2551:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2319:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2273:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.3075:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2017:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2431:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2087:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1998:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2828:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2341:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2191:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1870:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1820:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2548:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.3177:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2218:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2088:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2018:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.3358:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1893:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1994:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2351:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1963:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2734:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1842:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1972:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2266:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2248:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2015:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1905:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2384:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2172:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2002:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2639:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1552:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1552:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2700:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2167:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2216:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1834:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2029:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1558:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2607:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1792:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2642:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2148:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2123:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2397:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2372:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1809:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1929:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2002:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2329:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2190:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1783:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2152:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2191:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2144:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2028:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.3212:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2023:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1930:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2223:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1949:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2100:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2638:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2010:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2296:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2609:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2328:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2282:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2350:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2417:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.3055:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1852:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1945:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2060:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2242:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1960:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2134:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1829:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1836:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2045:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1929:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2036:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2215:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2209:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1825:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2678:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1850:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1979:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2919:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2205:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2695:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1598:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2196:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2143:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2006:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2230:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2193:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1804:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2035:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1754:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1611:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2751:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2150:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2085:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2116:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2081:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2292:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2178:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2596:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2051:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2960:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.4590:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.4590:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1917:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2179:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1661:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1927:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.3029:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1885:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2044:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2272:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1675:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2144:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1651:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2168:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1893:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2283:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1712:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2084:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1748:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1879:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2134:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2545:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2348:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2145:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1678:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2065:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1731:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2217:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1836:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2418:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2249:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1837:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1807:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2032:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2485:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2120:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2088:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1870:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1806:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2322:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2595:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2781:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2203:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2742:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2558:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2366:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1897:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2063:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1828:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2275:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2197:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1978:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1903:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1955:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2294:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1963:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2135:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1940:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2285:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1416:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1807:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1732:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1909:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2876:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2764:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2076:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1646:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2041:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2353:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2407:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2361:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2153:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2036:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2422:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2530:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2160:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1969:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2482:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2529:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1817:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2991:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2991:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1971:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2780:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2007:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2235:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1902:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2014:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2048:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2201:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1883:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2180:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2382:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1553:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2015:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2340:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2341:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1965:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2280:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2484:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2308:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2198:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2332:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1767:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2779:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1835:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1986:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2039:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2214:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2732:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2143:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2771:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1746:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2298:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2194:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2293:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2041:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1876:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1983:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2450:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2627:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2163:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1896:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2284:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1866:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2523:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2169:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2668:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1983:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1984:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2120:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2021:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2458:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1638:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1745:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1965:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1929:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2315:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2291:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1998:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2011:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2322:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2785:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2198:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.3239:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2417:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1778:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1900:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2495:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2798:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1818:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2806:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1768:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2411:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2909:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2463:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2392:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1960:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2602:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2362:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2174:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2174:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.1927:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.1616:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2584:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.1480:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2454:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.1960:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.1704:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2113:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.1848:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2308:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2422:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.1784:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2451:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2486:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2137:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2684:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2177:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2586:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2211:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2798:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2026:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2740:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2825:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2395:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2635:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2008:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2098:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2064:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2453:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2564:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2083:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.3192:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2354:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2561:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2416:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2238:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.1995:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2411:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1942:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2396:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1764:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2077:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2338:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1974:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2008:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1932:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1736:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2411:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2097:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2653:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2312:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2085:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1893:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1772:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2233:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1748:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1910:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1871:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2274:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2270:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1737:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2324:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2472:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2519:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1886:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.3061:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1897:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1929:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2589:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1795:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1781:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2504:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2469:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2487:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2100:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1758:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2038:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1819:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1243:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1243:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2078:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2129:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2600:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2248:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1642:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2024:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1972:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2354:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1877:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1892:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2478:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2027:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2429:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2609:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1953:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1563:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1940:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2036:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2068:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1974:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1711:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2911:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2597:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1945:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2413:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2521:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2527:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2466:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2080:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2532:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2009:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2623:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2166:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2519:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2647:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2140:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1800:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2481:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1497:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2276:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2188:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1634:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2409:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1914:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2339:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2144:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1956:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2668:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2125:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2227:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2294:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1797:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2693:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1844:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1745:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2665:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1860:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2061:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1996:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2628:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2236:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2149:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2211:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2074:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1580:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1967:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1914:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1881:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2102:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1680:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1703:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2133:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2056:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1921:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1669:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1599:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2521:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1606:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2654:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2654:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2030:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1942:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2238:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1784:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2105:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1930:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2130:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2350:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1766:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2305:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1716:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1989:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1967:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1824:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2145:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2425:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1672:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1738:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2012:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2094:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2399:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2157:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2095:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2045:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2332:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2026:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2355:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2985:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2435:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2241:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2541:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2278:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2065:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2197:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1488:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2061:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2538:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2364:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2048:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1894:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2973:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1805:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2473:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1821:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2260:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1678:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2832:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2581:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1971:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2335:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2114:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2140:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2128:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2216:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1809:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2188:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2258:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2055:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2162:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2099:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2318:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2270:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2233:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2289:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1770:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2714:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1832:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2278:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2136:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2492:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2747:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1974:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1983:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2207:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1706:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1832:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2608:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2445:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2086:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2086:  77%|███████▋  | 308/401 [03:49<00:43,  2.15it/s]training loss: 0.2243:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2002:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2590:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2189:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2045:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2199:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1841:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1868:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2661:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2245:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2047:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2462:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2373:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1928:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1704:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2079:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2240:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2161:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2440:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1815:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.3156:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1977:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2219:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2018:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2364:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2125:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1615:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2785:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1955:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2533:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1971:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2287:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2023:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2200:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2160:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1497:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2649:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2167:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1944:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2367:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2450:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2684:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1733:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2038:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1844:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2103:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2061:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1648:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2056:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2131:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2175:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2376:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2143:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1943:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2002:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2447:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2786:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2513:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1944:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2162:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1644:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1890:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2032:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2717:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2185:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2072:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1873:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1443:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2089:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1998:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2237:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2246:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1877:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2023:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1631:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2403:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2121:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2372:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.3154:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.3154:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1719:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1986:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2004:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2237:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2250:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2038:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2162:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2258:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1781:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2094:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2670:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2172:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2241:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1820:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2045:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1958:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2062:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2856:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2438:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1764:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2009:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2293:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2170:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1839:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1955:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1639:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1938:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2116:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2444:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1642:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1896:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2613:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2480:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1471:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2851:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2496:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2067:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1729:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1935:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2260:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1600:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1879:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2255:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2274:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1807:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1951:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1793:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1672:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2044:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2278:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2130:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1926:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1660:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2209:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1922:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2391:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1645:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2097:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2244:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2577:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2172:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2028:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2239:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2025:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2124:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1852:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.3122:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1967:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1812:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2334:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.3099:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1991:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2525:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2921:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1925:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2428:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1681:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2506:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.3527:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.3527:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2119:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2006:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2125:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2303:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2185:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2063:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2511:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2281:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1762:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1733:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2036:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2141:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1944:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2819:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1655:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1656:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2950:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1937:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1571:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1624:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1727:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1835:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1928:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2135:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2402:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1977:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2273:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2186:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2017:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2349:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2348:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2658:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2072:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.3066:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2655:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1699:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2676:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2105:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2016:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1894:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1973:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2107:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2069:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2729:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1940:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2456:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2629:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2645:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2234:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2781:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2257:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1868:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2180:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1828:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2114:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1325:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2504:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2677:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2263:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1352:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1771:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2231:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2168:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2056:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1610:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1560:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2647:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2282:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2227:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2283:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1982:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2592:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2475:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1952:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1881:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2661:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2035:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2764:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1224:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1224:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2787:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2211:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1722:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1924:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2123:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2129:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2124:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2055:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2363:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1522:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2353:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1993:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2193:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2865:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2425:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1996:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2156:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2283:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1960:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1972:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1814:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2293:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2090:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2277:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2419:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2678:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1732:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1965:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1652:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1731:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2354:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2573:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1647:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2040:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2099:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2040:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2094:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1929:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1658:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2194:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1710:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1987:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2854:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1947:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1867:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2016:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2090:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2341:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2623:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1878:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2108:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2361:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1858:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2590:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1821:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1864:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2154:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2230:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1872:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1944:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1921:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1505:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2248:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1931:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1399:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1507:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1951:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1610:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2202:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1706:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1943:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2610:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2162:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2398:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1976:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1990:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2354:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1604:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1658:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1658:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1897:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1886:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1920:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2164:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2270:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2405:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1723:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2069:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2102:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1949:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2205:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2221:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1794:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2038:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2165:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2675:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2850:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1959:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1585:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2112:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2022:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2733:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2175:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2704:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2123:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2346:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1821:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2021:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1617:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2731:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2843:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1862:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2437:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1948:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2243:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2690:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2037:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1349:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1969:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2662:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2137:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1872:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2143:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2207:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2119:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2352:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1997:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2252:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2655:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2367:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1686:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1743:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1641:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1524:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2554:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1832:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1706:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2063:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2343:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2373:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2447:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1960:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2796:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1841:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.3022:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1668:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2627:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2558:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2880:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2394:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.3114:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2116:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2445:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2059:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2173:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2722:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2385:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2065:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1173:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1173:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.3042:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2512:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1911:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2508:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2784:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2471:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2765:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1997:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2376:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2426:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1944:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2012:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1638:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.3388:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2418:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1731:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2137:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2251:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2672:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1839:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2397:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2083:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1836:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2003:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2641:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1978:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2279:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1924:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2228:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2070:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1969:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2051:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2423:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2070:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1891:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2063:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2354:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2427:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2438:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2224:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2994:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2412:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2420:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1654:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2154:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2359:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2038:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1817:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2500:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2102:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2390:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1590:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2155:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.3215:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1684:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1410:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2079:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1937:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2037:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2863:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1788:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1700:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1799:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1969:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1971:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1910:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2344:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2275:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2097:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2430:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1904:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2276:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1883:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2206:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2847:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1916:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2266:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2366:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1822:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1822:  78%|███████▊  | 314/401 [03:54<00:58,  1.48it/s]training loss: 0.2864:  78%|███████▊  | 314/401 [03:54<00:58,  1.48it/s]training loss: 0.1697:  78%|███████▊  | 314/401 [03:54<00:58,  1.48it/s]training loss: 0.1568:  78%|███████▊  | 314/401 [03:54<00:58,  1.48it/s]training loss: 0.2470:  78%|███████▊  | 314/401 [03:54<00:58,  1.48it/s]training loss: 0.2036:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1881:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1892:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1999:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2049:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2092:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2334:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2050:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2380:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1911:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2609:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1830:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1768:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1836:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2487:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2666:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2486:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.3045:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2277:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2067:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2385:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2091:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2244:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2322:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2369:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2318:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2432:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2077:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2208:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2271:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1999:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2088:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2253:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1875:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2434:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2182:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2022:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1563:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2350:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1990:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2048:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2801:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1991:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1744:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2009:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2159:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2722:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1925:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2257:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1494:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1970:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2038:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1772:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2041:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1677:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1826:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1958:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2130:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1897:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2468:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1961:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1816:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1923:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1799:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1938:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2778:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2489:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2839:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2422:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2014:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1734:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2736:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1519:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1833:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.4862:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.4862:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2623:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1925:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2694:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2055:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1472:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2452:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2200:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2581:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1721:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1886:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1667:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1575:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1940:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1857:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2178:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2082:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1753:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2114:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2595:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2252:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1900:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2408:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2715:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2159:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1328:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2555:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2184:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1891:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2566:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1888:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1836:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2708:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2353:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2189:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2294:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1595:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1862:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2069:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2434:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2840:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1673:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2124:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2122:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2058:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2092:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1541:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2246:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2161:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2170:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1646:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2494:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1922:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2496:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2581:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2346:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2056:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2723:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.3017:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2798:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2889:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1999:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2037:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2957:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1785:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2194:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2487:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2303:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2326:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2219:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2361:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2686:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2189:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2192:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1725:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2196:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2074:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1780:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2552:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1525:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1525:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2306:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2732:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2122:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1568:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2571:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2107:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2595:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2394:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2103:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1759:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2447:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2093:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2562:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1954:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1853:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2319:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1799:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2311:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2163:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2204:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2010:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2153:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2336:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2275:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2282:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1875:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1959:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2262:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2271:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2060:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1583:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2257:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2494:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2300:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1852:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1987:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2208:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2596:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1813:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2613:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1780:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2269:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2050:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2169:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2129:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2027:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1896:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1912:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2379:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1878:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2265:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1668:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2114:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2095:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1838:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2179:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1941:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2076:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2137:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1911:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2039:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2238:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2287:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1922:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1763:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2597:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2220:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2311:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2291:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2012:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.3023:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2249:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2378:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2345:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2077:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2015:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2132:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1939:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1735:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1735:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1833:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2194:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1551:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2172:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2091:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1779:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2323:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2435:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2232:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1973:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2229:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2259:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1974:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2684:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2133:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1600:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2247:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1952:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1950:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2084:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1939:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1482:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2003:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2162:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2353:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1996:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2483:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2043:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2493:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1379:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2488:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1681:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1815:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2321:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2568:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2145:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2305:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2321:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2343:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2357:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1610:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1993:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1966:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1865:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1941:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2449:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2033:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1999:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2528:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1867:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2280:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2107:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2019:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2466:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1924:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2017:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2180:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1581:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2233:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1886:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2544:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1775:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2355:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2355:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1984:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2443:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2291:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2262:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2193:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1571:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1893:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2103:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1962:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1899:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2380:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2199:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2674:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1763:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1934:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1934:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1971:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1683:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2271:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1792:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1473:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1515:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1889:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1891:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1950:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1925:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2291:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2568:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2628:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2736:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2110:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2103:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2071:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2150:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2030:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2952:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2049:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2355:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2250:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2354:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1831:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2584:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2276:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1853:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2442:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1576:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2273:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2392:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1637:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1608:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2266:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1511:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2209:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1753:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2049:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1605:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1777:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2142:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2006:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2187:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2171:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2498:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1754:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2684:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2133:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2077:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2230:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2336:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2086:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2351:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2464:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1761:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2106:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1975:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2349:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2196:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1639:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1657:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1873:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2281:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2247:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2342:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2203:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2139:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2113:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2149:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2120:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1674:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2434:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1965:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2676:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2189:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1955:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1798:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1247:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1247:  80%|███████▉  | 319/401 [03:56<00:36,  2.22it/s]training loss: 0.2943:  80%|███████▉  | 319/401 [03:56<00:36,  2.22it/s]training loss: 0.1773:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2439:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2703:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1503:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1684:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2164:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1703:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2169:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2697:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2028:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2259:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2734:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2583:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2407:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2252:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1720:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1808:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1883:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2455:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2270:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2189:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2229:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2142:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1946:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1916:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2027:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2199:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2229:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2140:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1804:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2352:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1920:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2285:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1996:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2269:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2272:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1890:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2057:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2168:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2459:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2302:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1877:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2230:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2415:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1738:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1764:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1953:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2431:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2677:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2226:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2400:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1897:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2583:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2537:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2133:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1528:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1879:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1475:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1954:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2210:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2163:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2248:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2070:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1995:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1968:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2440:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2257:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1827:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2239:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2435:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2322:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1992:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2001:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2169:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2510:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2261:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2512:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.4221:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.4221:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2048:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1715:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1992:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2220:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1798:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2298:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1965:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2245:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1930:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2086:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2318:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2056:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1940:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1930:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2184:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1757:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1694:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1884:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2304:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1909:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2374:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1713:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1783:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2106:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2084:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2579:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2127:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1943:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2341:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1933:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2215:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2165:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2462:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1994:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2215:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1715:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2143:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2417:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2184:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1953:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1559:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2076:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2151:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2282:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2265:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2450:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2345:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1860:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2452:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2262:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1915:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2904:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2219:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2186:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1692:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1999:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2317:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2208:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2403:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1892:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1831:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2419:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2327:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2340:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2664:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1942:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2482:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1978:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2513:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2801:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2227:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1926:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2615:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1806:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2420:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1734:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1608:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1899:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2027:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2027:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2018:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2611:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2373:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1857:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1984:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2045:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2313:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2672:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2230:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2151:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2294:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2196:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1580:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2633:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2885:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2315:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2065:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2203:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1993:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2415:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2137:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1712:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2082:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.3014:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1748:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1912:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2840:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1888:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2893:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2417:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.3048:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1536:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2088:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1943:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1744:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1895:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2117:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2325:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1976:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1776:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1855:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2171:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2121:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1870:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2039:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1777:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.3052:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1836:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2291:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2094:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1797:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2071:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1878:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1934:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1792:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2845:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2057:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2875:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2651:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2424:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1819:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2339:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2152:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2467:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1777:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2128:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2290:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2264:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1908:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1966:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2625:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2419:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1956:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1946:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1992:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1645:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2163:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2220:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.3045:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.3045:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.1714:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.2052:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.2134:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.2587:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.1291:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.2101:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.1720:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.2675:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.1496:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.1947:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1839:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2327:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2674:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1836:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1670:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2346:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2305:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1695:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2369:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1929:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2113:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2417:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2168:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1847:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1947:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1893:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1691:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1842:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1736:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1625:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1848:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2049:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2593:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1807:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2571:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2010:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2007:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1522:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2039:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1538:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1861:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2368:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2147:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2042:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2070:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1486:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2168:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2302:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2250:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2013:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2112:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2019:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2263:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2227:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2384:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1955:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2152:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2100:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2607:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2445:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2598:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1814:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2409:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2437:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1687:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1969:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2537:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2465:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2183:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2016:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2485:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2076:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2272:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2194:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2335:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2372:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2294:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2000:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1811:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1811:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2603:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1623:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2205:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2461:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2720:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2105:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2375:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1926:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2248:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2287:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2076:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1462:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2272:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2094:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1996:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2151:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2068:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2744:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2679:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2024:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2535:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2006:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2104:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2613:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2388:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2059:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1899:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1858:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.3145:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2083:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1907:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1535:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1655:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1787:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2024:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2211:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2314:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1874:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2316:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1973:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1913:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2291:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2195:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2163:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2074:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2307:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2477:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1986:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2299:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1808:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2354:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2007:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2459:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1887:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2004:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2658:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1726:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1677:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1981:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2581:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2724:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2149:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1896:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1910:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1805:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1904:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2148:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1672:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1940:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2092:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2177:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2250:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1934:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2418:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2214:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2584:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2581:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2205:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1319:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1319:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1785:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2590:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1514:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1888:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1902:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2286:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2165:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2002:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2296:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2525:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1985:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1886:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2060:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2274:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1628:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2025:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1863:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2253:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1939:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2546:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1733:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2413:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2009:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1795:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2414:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1847:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1770:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2215:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2132:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1881:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1715:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1992:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2498:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2589:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2347:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1926:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2451:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1788:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1574:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1922:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2577:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2229:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2263:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2114:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1505:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2165:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2054:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1807:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2089:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2026:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2765:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1756:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2942:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1904:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1423:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2273:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2321:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1773:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2193:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1964:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1875:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2799:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2293:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.1748:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2491:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2239:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2256:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2117:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2139:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2161:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.1905:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2153:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.1987:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2137:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.1497:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2038:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2155:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2287:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2445:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2445:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2475:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1873:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1841:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1971:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1700:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2306:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2113:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2452:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1720:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2283:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2142:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2129:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2893:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2315:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2281:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2134:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1913:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1704:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2121:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2739:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2350:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1643:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2319:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1992:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1551:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1617:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2003:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2378:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1814:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2735:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2033:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2301:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2202:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2682:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1959:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2741:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1929:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2825:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2388:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1863:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1393:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2218:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1878:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2160:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1440:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1699:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2720:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1786:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2188:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2838:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2282:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1826:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2305:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1734:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1777:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2062:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1795:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2487:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2006:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2690:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1701:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2426:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1835:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2803:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2548:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1869:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1954:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2069:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2742:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1689:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2150:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2525:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2683:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2142:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1845:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2555:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1920:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2138:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2093:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2093:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1985:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2128:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2992:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1898:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2625:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2276:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1494:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2616:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2065:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2313:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1778:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2272:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1658:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1968:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2625:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1812:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2665:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2080:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2132:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2161:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1722:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2444:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2143:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2324:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2046:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2284:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2465:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2205:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1792:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1952:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2149:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1586:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2487:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1472:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2165:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2025:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2100:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1823:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2355:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2348:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2273:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2326:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2083:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1607:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1643:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2193:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2316:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1880:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2103:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2155:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2962:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2130:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2046:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1778:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1963:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1636:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1842:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1674:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2602:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1998:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2188:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2728:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2231:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2573:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2921:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1729:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1820:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2591:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2328:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1632:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2418:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2355:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2033:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2047:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2009:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1679:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2156:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2117:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1277:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1277:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2326:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2282:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2025:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2133:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1444:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2169:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1985:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2722:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1951:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1914:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2626:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2129:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1828:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1899:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2302:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1963:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1994:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2194:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2075:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2850:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1919:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.3232:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2069:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2563:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2195:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2430:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2306:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2056:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2386:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1501:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2200:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2439:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2553:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1824:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1950:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2452:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2216:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1995:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2273:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2098:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2307:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2066:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1885:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1583:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2964:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2660:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2042:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2066:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2247:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2621:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1390:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2475:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1874:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2082:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1954:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2528:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2212:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1987:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2092:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2752:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2320:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1967:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2105:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2297:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2329:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2134:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1929:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2425:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1936:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2456:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1758:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1997:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2117:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1908:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2032:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2271:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1866:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1644:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1722:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1722:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2564:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2079:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1748:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2076:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1770:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2589:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1682:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2988:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2098:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2466:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2116:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1604:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1989:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2196:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2139:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1795:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2175:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2325:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2419:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2210:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2308:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2112:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2299:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2031:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2370:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2226:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2697:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1677:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2039:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1997:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2033:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1824:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2745:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2434:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1977:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1869:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2162:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2348:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1815:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1944:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2521:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2357:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2762:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2256:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2165:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1814:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2291:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2340:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1630:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2652:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2225:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1877:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2043:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2433:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1791:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2572:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2853:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2006:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2283:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1425:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1858:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2552:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1735:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2123:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2396:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2756:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2039:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2816:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1894:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2202:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2945:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2092:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2375:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2848:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2835:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2602:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1534:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2293:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.0795:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.0795:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2215:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1977:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2004:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2528:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2105:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2579:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2171:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2190:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2121:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2390:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1771:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1958:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1568:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1889:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2648:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1985:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1891:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2296:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2577:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1895:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1996:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2019:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1939:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2033:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2266:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2488:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2935:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2380:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2364:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1830:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1798:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2548:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1760:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2089:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2167:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1715:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2139:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2177:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2598:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2359:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2272:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2104:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1741:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2297:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2739:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2014:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2322:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2487:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2141:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2398:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1870:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2138:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2189:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2739:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2309:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1907:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2139:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2375:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2594:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2074:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1948:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1778:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1960:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2185:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2322:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1875:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2150:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2492:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2257:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2673:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2570:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2024:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2805:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1983:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2441:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2001:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2637:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1645:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1392:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1392:  82%|████████▏ | 330/401 [04:03<00:29,  2.43it/s]training loss: 0.2305:  82%|████████▏ | 330/401 [04:03<00:29,  2.43it/s]training loss: 0.1882:  82%|████████▏ | 330/401 [04:03<00:29,  2.43it/s]training loss: 0.2091:  82%|████████▏ | 330/401 [04:03<00:29,  2.43it/s]training loss: 0.2072:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2199:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1982:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2643:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2119:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2109:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2345:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2364:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1760:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1816:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1717:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2012:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1832:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2640:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2214:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1748:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2060:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2366:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1588:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2095:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2125:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1627:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1917:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2024:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2429:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1573:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2176:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2457:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2028:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2167:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2932:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2291:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2801:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2178:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2496:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2257:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2060:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2062:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1854:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2107:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1754:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1961:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2284:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2319:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2842:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1929:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1895:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1651:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1667:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2320:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2214:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2486:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1906:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1829:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2785:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2139:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1681:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2027:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2283:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2103:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2247:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1772:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2319:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2509:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2169:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2085:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2066:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2098:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2920:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2154:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2485:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2549:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1708:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2033:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2478:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.3066:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.3066:  83%|████████▎ | 331/401 [04:06<01:21,  1.16s/it]training loss: 0.1782:  83%|████████▎ | 331/401 [04:06<01:21,  1.16s/it]training loss: 0.2575:  83%|████████▎ | 331/401 [04:06<01:21,  1.16s/it]training loss: 0.2258:  83%|████████▎ | 331/401 [04:06<01:21,  1.16s/it]training loss: 0.2002:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2601:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2023:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2319:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1738:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1919:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2133:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1642:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2887:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.3105:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2014:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2183:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2427:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1538:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2557:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2028:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1974:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2653:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1854:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1913:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2029:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2577:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1978:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2063:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2730:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2444:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2631:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2263:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2120:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2014:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2241:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2258:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1945:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2254:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2545:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2247:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1974:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2006:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2226:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1619:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1552:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2667:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2187:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2340:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2114:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2774:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1773:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1959:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2535:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2710:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1700:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1850:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1859:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1765:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2137:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1645:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1874:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2567:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1995:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2245:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2338:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2891:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1923:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2009:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2077:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2380:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2331:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2664:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2090:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2345:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1963:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1802:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2376:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2263:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2156:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1705:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1705:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2594:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2463:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2111:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2268:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2865:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2654:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1830:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2271:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2759:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2224:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2567:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1880:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2452:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2452:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1751:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1797:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2221:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1862:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2158:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2263:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2043:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2419:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1883:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2189:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2685:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1796:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2319:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2059:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2756:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2265:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1510:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2340:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1815:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2058:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2232:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2281:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1590:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2402:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1990:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1796:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2434:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2163:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2061:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2195:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1473:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1920:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2647:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2282:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2100:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2953:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2255:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2078:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2530:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2241:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1938:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2908:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2251:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2270:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1932:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1963:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2353:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2267:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2286:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2636:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2032:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1914:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2344:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1791:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2623:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1826:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1945:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1738:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2197:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1680:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1610:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2031:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2299:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2294:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1812:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1812:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2572:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2379:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2181:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2049:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2752:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2539:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.1854:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2284:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2550:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2166:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2234:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1766:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2347:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2514:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1698:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1900:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2082:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2853:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1870:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2001:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1925:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1657:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2458:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2090:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1995:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2080:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2066:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1944:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2107:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1980:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2225:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2354:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1754:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2444:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1893:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1886:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2237:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2197:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2120:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1964:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2096:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1578:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2913:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1978:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2140:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2134:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2861:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2572:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2431:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1932:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2119:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2420:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1789:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1855:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2356:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1832:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2088:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1695:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1587:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2203:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2170:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2165:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2324:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1889:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2223:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1458:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1949:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2785:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2264:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1663:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2108:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1795:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1708:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2104:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2678:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1758:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1862:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2164:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.3020:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.3020:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1967:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2137:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1608:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2378:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1740:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2883:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2427:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2654:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1742:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1871:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2500:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2177:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1479:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2071:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2602:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2243:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.3074:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2267:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2213:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1752:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1985:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2358:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1700:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2602:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2013:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2567:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2530:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2350:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1799:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1816:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2099:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1999:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1994:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2036:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2003:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2564:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2506:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2106:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1718:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2170:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1880:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1934:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2384:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2117:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2588:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1925:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2586:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1977:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2107:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2316:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2509:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2438:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2200:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1838:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2375:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2514:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1831:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2222:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2026:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1555:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1870:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2078:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1951:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2027:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1705:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2002:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2491:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2193:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2538:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1865:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2530:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2185:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2400:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1917:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1650:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2190:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2209:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1816:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2046:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2046:  84%|████████▎ | 335/401 [04:08<00:44,  1.47it/s]training loss: 0.1981:  84%|████████▎ | 335/401 [04:08<00:44,  1.47it/s]training loss: 0.2101:  84%|████████▎ | 335/401 [04:08<00:44,  1.47it/s]training loss: 0.2487:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2310:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2536:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1660:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.3181:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2174:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2019:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2043:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1924:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2460:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2318:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2406:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1900:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1873:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1879:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2560:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2079:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1545:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2462:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1647:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2063:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2603:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1750:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2659:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1712:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1744:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2407:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2463:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2008:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2231:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2880:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2003:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2499:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2000:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2172:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1928:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2081:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2266:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1542:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1830:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2296:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2282:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1638:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2123:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1848:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2236:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2293:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2012:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2723:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1809:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1933:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2111:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2528:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2095:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2138:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2524:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2152:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1979:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1977:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1984:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2297:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2610:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2128:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2714:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1645:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1885:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2781:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1930:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2295:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2580:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2036:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1949:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2022:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2664:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2043:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1900:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1542:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1542:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2208:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1851:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2061:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2475:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2216:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1979:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2297:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2939:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2648:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2522:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1986:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2205:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2450:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1957:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1321:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2607:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2096:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1862:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2471:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2616:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2001:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2423:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2015:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2164:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2002:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1659:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2194:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2990:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1960:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1807:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2234:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2289:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2266:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2133:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1752:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2515:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2286:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2356:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2041:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2079:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1772:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1654:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2465:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2637:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2339:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2085:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2328:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2214:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2651:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1786:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2044:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2196:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2623:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1947:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1645:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2164:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2639:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2307:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2136:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1810:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2615:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1679:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2674:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2114:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2022:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2766:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1778:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2261:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2237:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2137:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1874:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2425:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2996:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2271:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2271:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1801:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1724:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2294:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2203:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2203:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2190:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2087:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2467:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2395:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2075:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1828:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2055:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2469:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2287:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1988:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2173:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2031:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2291:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2129:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1703:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2592:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2275:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2253:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2312:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2544:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2376:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2377:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2609:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2705:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2034:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1792:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1565:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.3182:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2076:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2294:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1718:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2981:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1947:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1907:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1747:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2227:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2433:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1751:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1958:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2054:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2341:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2190:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2336:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1708:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1846:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2241:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1549:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1946:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1662:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2146:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2360:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1798:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2474:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2498:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1898:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1837:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1960:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2239:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2288:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2916:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2819:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1807:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2860:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2298:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2906:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1836:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2590:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1900:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2085:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1840:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2474:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.1777:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.2741:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.2314:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.2460:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.2400:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.2265:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.1345:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.1462:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.1462:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2726:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1752:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2259:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1780:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2298:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2276:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1785:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2362:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2499:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2445:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1971:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2515:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2261:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2055:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1902:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2525:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2036:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2566:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1966:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2213:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2385:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2557:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2852:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2045:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1811:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1877:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2066:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2377:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1777:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2657:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2346:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1585:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2070:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.3346:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2902:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2461:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2112:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1587:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2566:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2636:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2460:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2175:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2007:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1611:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1729:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2251:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2007:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1685:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2681:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2155:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2207:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1823:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2325:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2378:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1765:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2449:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2602:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2079:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2587:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2457:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2786:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1654:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2200:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2066:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2224:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2144:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2079:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2313:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1720:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2033:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1965:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2153:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2234:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1573:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2161:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1986:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2181:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2299:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1651:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1651:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2152:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2382:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2111:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2087:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2704:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2460:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2244:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2054:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1926:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2550:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2319:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2011:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2860:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2507:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1663:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2060:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1718:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2157:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2048:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2150:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1948:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1879:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2921:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1615:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1764:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2260:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2268:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1792:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2492:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2514:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2343:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2361:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1603:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1915:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2490:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1942:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2213:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1809:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1981:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2295:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2568:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1951:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2172:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1565:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1981:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2299:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1973:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1857:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1886:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2200:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2406:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2352:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1714:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2417:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2082:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1956:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2906:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2054:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2579:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2926:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1790:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2907:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1650:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2135:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1647:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1541:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1906:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.3259:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2073:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2221:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1807:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2775:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2769:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2377:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1981:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2422:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2139:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2690:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1909:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1909:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1944:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2055:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2417:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2140:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2132:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2148:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1841:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2519:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2901:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1567:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1958:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2144:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2172:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1699:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2359:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2093:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1926:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2022:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2013:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1738:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.3170:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2198:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1951:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2125:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2261:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1868:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2529:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2281:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2107:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2877:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1794:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1952:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1689:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2069:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2495:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2338:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2032:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2302:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2546:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2520:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2580:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1825:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1986:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2314:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2567:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2110:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2150:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2327:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2255:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2117:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1730:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2397:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1664:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2332:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2414:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2522:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1859:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2152:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2223:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2200:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2075:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.1978:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2583:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2263:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2061:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2431:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.1981:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2176:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2519:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2410:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2186:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2147:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2543:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2387:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2116:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2062:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2272:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.1584:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2417:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2417:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1919:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2284:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2323:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1980:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2002:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2561:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1587:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2331:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1689:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2248:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2274:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2077:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2629:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2286:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2115:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2258:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2169:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2305:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2020:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2330:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2164:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2250:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1842:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2552:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2329:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2126:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2039:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1607:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1978:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2250:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2539:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2154:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2105:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2444:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1997:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2156:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2513:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1822:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2363:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1735:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1768:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2109:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2922:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2219:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2304:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1874:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1851:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2169:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2044:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1942:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2371:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1843:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1989:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2279:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2039:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1617:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2231:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2158:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1958:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2356:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2620:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1911:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2717:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2263:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2226:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1821:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2715:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1396:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1658:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2346:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1768:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2611:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1841:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2408:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1633:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2188:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1642:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2406:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2917:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2917:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.1983:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2839:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2088:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2146:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2144:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.1745:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.1889:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2691:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2060:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.1953:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2564:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2456:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2256:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2159:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2597:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.1798:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.1964:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2666:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2119:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2229:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2387:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1786:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2917:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2321:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2351:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1660:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1955:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2031:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1920:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2211:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2408:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2643:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2150:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2320:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1703:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1994:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1874:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1925:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2420:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2343:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2101:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1835:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1948:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2110:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1877:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1808:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1998:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2075:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2162:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1779:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2237:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2145:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2304:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2631:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2097:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1783:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2452:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2430:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2223:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1952:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2485:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1653:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2050:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2044:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1710:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2264:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1505:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1709:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2055:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2198:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2643:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1869:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2142:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2618:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1766:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2674:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2978:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2387:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1509:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1509:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2553:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1865:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2300:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1926:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2100:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1898:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2149:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1942:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2755:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2327:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2250:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2029:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1585:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2332:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1600:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1864:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2652:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.3031:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2272:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2915:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2461:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2868:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2005:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1633:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1594:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2365:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2501:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2429:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2676:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2289:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1474:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1553:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2107:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2085:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2207:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2440:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2790:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2061:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2289:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1951:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2205:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2075:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2220:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2210:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1782:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2341:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1544:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1977:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2107:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2519:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2564:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2054:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2254:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2788:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2135:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2005:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2619:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2062:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2411:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2099:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2152:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2424:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2212:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2241:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2354:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1995:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1944:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2153:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2457:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2454:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1824:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2055:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2507:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1957:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1811:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2051:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2071:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2040:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2463:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2463:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2506:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2475:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1985:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1712:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1623:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2247:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1887:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.3122:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1773:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2039:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2117:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1762:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1823:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2077:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1706:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2211:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1927:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2818:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2230:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1951:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2659:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2139:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2676:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2165:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2320:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2349:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2332:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1388:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1829:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1632:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1963:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2456:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1990:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2038:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2116:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2015:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2017:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2324:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2518:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1754:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2560:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1699:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1954:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2708:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1745:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2028:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2455:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2717:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2513:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1939:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1789:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2386:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2755:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2299:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2070:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1877:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1722:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1510:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.3001:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2270:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2419:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2000:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1562:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1830:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1910:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2993:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1636:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1612:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2631:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2552:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1451:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1567:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2153:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2851:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1850:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1889:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2320:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2060:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.3114:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.3114:  86%|████████▌ | 345/401 [04:14<00:30,  1.83it/s]training loss: 0.2443:  86%|████████▌ | 345/401 [04:14<00:30,  1.83it/s]training loss: 0.1828:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2221:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2216:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2040:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1927:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2704:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2272:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1862:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2053:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2905:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2298:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2094:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1857:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2104:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2243:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1596:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2340:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2728:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2121:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2142:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2255:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2063:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1915:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2121:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1985:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1664:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2414:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2473:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2041:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2021:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1992:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2211:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2314:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1895:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2055:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2821:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2008:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2564:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2274:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2660:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1677:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2602:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2854:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2838:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1556:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1980:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2411:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.3120:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2429:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2014:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2223:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2158:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2157:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2297:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2244:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1864:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1812:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2616:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1943:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2244:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2522:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2139:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1720:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2263:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1372:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1881:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1854:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1850:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2028:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1799:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2104:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2446:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2425:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2556:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2052:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2169:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1894:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.3445:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.3445:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1977:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1740:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2208:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2196:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.3145:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2418:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.3125:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2202:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2335:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2017:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2236:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2169:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2311:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2320:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1924:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2324:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.3017:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2466:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2322:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1487:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1777:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1923:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2134:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2606:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2322:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2548:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2205:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1992:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2180:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2129:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2673:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2338:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1918:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2146:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2173:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1721:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1897:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1925:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2319:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2208:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2333:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1763:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2069:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2123:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2094:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1930:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2821:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2102:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1981:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2447:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2280:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2168:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2114:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2633:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2278:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1689:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2264:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1761:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1738:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2301:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2695:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1925:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2986:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2225:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2677:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1682:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2892:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2418:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2289:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2342:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1888:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1851:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2114:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2226:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2399:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1993:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1967:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2165:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.3119:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.3119:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2009:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2392:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2829:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1700:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2212:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2186:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1823:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2352:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2098:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2516:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2218:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1806:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2120:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2156:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1845:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2027:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2400:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2512:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1834:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2423:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.3274:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2104:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2182:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1992:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2344:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1746:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1795:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2172:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1877:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2565:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1933:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2058:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2298:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2012:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1679:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2348:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1909:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2459:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2341:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2205:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1943:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2128:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1106:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1682:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1574:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2194:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1993:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1916:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2326:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2085:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1810:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1837:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2190:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2332:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1561:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2946:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2561:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2160:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1733:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2286:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1940:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2084:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2283:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2228:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2080:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2256:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1820:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2470:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1551:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1585:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2260:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1789:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1625:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1945:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1898:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1573:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2284:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2031:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1145:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1145:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2249:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2405:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1998:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2067:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1739:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2016:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2252:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2093:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2154:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2333:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1656:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2417:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2143:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2426:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2112:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2110:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2232:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2194:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2383:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2702:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2037:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2268:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1674:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2244:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1989:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1816:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1950:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2153:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1963:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1868:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2020:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1874:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2571:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2376:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1993:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2218:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2073:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2673:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2275:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2110:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2208:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2080:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2214:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1748:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1594:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1976:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2577:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2559:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1996:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1730:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2071:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2055:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2232:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2205:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2131:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1890:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2016:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2203:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2547:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2296:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2158:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2001:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2589:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2316:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2192:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2008:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1980:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2191:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2147:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1996:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2001:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2019:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1949:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2921:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2210:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1643:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1952:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2196:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1683:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1683:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2450:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2092:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2454:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1948:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2615:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1993:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2560:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2201:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1598:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1566:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2381:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1840:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1940:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2383:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1742:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1510:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1705:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2001:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2043:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2700:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1916:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1983:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1610:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1542:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2135:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2168:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2203:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1630:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1977:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1684:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2024:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2242:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2160:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1703:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2015:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2432:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2041:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1989:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2640:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2231:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2557:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1787:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1894:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1770:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2144:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2005:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2008:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2513:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2437:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1934:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1997:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2768:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2302:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2021:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2587:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2002:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1985:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1999:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2320:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2084:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2433:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1306:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2617:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1912:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1600:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2211:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2186:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2434:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1999:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2243:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1538:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2210:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2209:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2117:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1720:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2465:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2582:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2078:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.3431:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.3431:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.2172:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.1876:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.2616:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.1883:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.1978:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.1571:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.2132:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.2261:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.2518:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.2493:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.1801:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.2228:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2311:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2643:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2155:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1996:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2261:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2302:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2567:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1906:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1639:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2144:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1675:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1715:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2711:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1734:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2265:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1980:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2259:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1488:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1836:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1713:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2219:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2493:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2345:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2366:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2430:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1822:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2535:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2886:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1742:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2134:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1788:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2357:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1928:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2401:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2151:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2537:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2393:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1933:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1843:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2561:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2390:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2197:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2423:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1614:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1759:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1604:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.3103:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2216:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2042:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2555:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2555:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1621:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2054:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2226:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.3195:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2197:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2754:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2291:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2246:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2236:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1692:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1905:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2579:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2376:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2924:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2209:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1723:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1723:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1989:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2066:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2032:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1781:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2072:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2260:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1635:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2268:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2300:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2193:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2172:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2109:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1605:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2371:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1820:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2444:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2122:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1878:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2277:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1969:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2458:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2015:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1779:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1781:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1950:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1720:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2134:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2056:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2308:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1617:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2425:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2074:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1980:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1947:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2607:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2112:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1890:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1992:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2070:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2046:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2369:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2163:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2329:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2328:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2817:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2631:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1973:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2055:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2071:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.3021:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1440:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1852:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2310:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2158:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2027:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1918:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2148:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1809:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2289:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2062:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2144:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2525:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2410:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2046:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1296:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1889:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2090:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2455:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1478:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1731:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2146:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1905:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1746:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2575:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2591:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2065:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1863:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2900:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.3909:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.3909:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2164:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1820:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2125:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2364:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2771:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1359:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1871:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2201:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2043:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2424:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2034:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1751:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2131:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2198:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1898:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2703:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2201:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2300:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1910:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2291:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2875:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1841:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2390:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1996:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1981:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2208:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1642:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2653:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2596:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2563:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1507:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2332:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1564:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2097:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2613:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1903:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1968:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2073:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1680:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2218:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2436:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2157:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2575:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2078:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2394:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1898:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2110:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2070:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1792:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2010:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2334:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2138:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1823:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1994:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1883:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2549:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2110:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2429:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2101:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2704:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2034:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2498:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1595:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1491:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1381:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1970:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1599:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1845:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2101:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2131:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1921:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2105:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2118:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2057:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2341:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1822:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2024:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1768:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2066:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2066:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2348:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1891:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1976:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2834:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1363:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2142:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2635:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1923:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1964:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2128:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2180:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2215:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2381:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1656:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1784:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1908:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2379:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2310:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1668:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2588:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2038:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1850:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2271:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1316:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2368:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1952:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1978:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2072:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2221:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2526:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1943:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2384:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2168:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2206:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2037:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2240:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2478:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2109:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1856:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2013:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2164:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2154:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1852:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2558:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2492:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1879:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2476:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2163:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2100:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2187:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1841:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1589:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2190:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1686:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2066:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1777:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2099:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1962:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2499:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2467:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2206:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2748:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2429:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1758:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2545:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2369:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2130:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1935:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1784:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2249:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2703:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2397:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1948:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1657:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2460:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2368:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2292:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1681:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1408:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1408:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.1825:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.1776:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2244:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2344:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2145:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2824:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2113:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2198:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2082:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.1973:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2261:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2415:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.1892:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2174:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2075:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2313:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2061:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2382:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2307:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2446:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2422:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2502:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2039:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2531:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2543:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.1952:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2270:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2320:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1719:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1789:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2257:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1811:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2481:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2287:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2708:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2693:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1434:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2027:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2079:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2024:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2304:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2383:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2403:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2497:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1820:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2145:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2027:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1957:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2288:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2141:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1674:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2072:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1894:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1902:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2587:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2223:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1703:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2147:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1945:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2368:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1732:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2027:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2347:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2055:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2542:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2281:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2175:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2721:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2316:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2162:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2151:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2009:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1356:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1954:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2642:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2168:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2163:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1807:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1052:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1052:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2329:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1862:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2176:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1529:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1985:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1758:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2389:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1833:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1484:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2310:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2503:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2678:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1784:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2115:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2297:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1847:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1900:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2492:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2352:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2610:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2007:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1974:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2063:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2554:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2479:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2432:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2135:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1839:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2364:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1822:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2147:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2126:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2156:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2402:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1902:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2003:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1820:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1790:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1654:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1882:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1207:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2235:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2346:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2148:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1833:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1930:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1857:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2018:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2052:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1748:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1303:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2067:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2569:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2601:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1781:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2070:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2224:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2134:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2961:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2114:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2441:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2143:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1891:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2028:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2001:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2242:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2298:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1811:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1594:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2503:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1895:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2105:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2123:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2424:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2105:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2454:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2004:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1732:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.3706:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.3706:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1981:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2111:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2210:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2194:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1762:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1952:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2305:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1830:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2037:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2641:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2331:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.3075:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2519:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1861:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2241:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2305:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1840:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2338:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1596:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1961:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1860:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2138:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2182:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1917:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1832:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1860:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2162:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2193:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2332:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2429:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2498:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2394:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1988:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2182:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2478:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2338:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1799:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1877:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1956:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2156:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1828:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1772:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2102:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.3287:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2242:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2263:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2746:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2126:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2295:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1416:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2482:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1840:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1332:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2025:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2799:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1966:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2391:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2886:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2291:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2417:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2279:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1831:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2289:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.3013:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2094:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1907:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2706:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2095:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1822:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2021:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2028:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2254:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1699:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2324:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1769:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2257:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2087:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2018:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2386:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2386:  89%|████████▉ | 357/401 [04:21<00:20,  2.14it/s]training loss: 0.2063:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1880:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2116:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1918:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1758:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1475:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1757:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2076:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2422:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1915:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2380:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2493:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2681:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1754:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1738:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2302:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1924:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1555:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2664:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1970:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2344:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2186:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1731:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2166:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2109:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2098:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1757:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2247:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2161:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1806:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1977:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2205:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2266:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2406:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2370:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2105:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1885:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2506:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2469:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1997:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2311:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1612:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2105:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1994:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2255:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2330:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1767:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2990:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1931:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2351:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2195:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1846:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2138:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1937:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2595:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2083:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2396:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2672:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2452:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2501:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2098:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2481:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2805:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1948:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1679:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1838:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1956:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2068:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2253:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2425:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2022:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2341:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1716:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1684:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1630:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1799:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2055:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2520:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1506:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1506:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2413:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1864:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1719:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1743:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2114:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2392:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1992:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2189:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1840:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1920:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2244:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2360:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1399:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2193:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2097:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2217:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2656:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2377:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1767:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1949:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1867:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1893:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1971:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1749:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2549:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2259:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1902:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1675:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2100:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2126:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2417:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1912:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1819:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1636:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2530:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1897:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2124:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1725:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1675:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2068:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2611:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1902:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2212:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1785:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1875:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2685:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1888:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2404:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2448:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1730:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2402:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2163:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1793:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2664:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2293:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2067:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1616:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2294:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2128:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2586:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1842:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1827:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2641:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2361:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2293:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2529:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2839:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1771:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2525:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1599:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2355:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1723:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2394:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1728:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2046:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2643:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2125:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2175:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2006:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2006:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1736:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1929:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2453:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2811:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1759:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2848:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1714:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1684:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1943:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1882:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2000:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2381:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1812:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2758:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2346:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2055:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2612:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1953:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2173:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2104:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2257:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1965:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1967:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2091:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2017:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2623:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2142:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2097:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2060:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.3283:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1510:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2405:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1932:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2270:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2499:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2067:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2072:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2416:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2832:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2362:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2394:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2106:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2191:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2044:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2307:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1864:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1992:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2153:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1504:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1932:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2178:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1781:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2376:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2043:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1549:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1693:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1695:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2182:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1724:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2737:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1970:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2021:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2112:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2069:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1706:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1474:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2099:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2023:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1850:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1878:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2341:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1601:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2193:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2420:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1858:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2122:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1227:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1584:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1528:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1528:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1958:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2214:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1781:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2423:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1807:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2469:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1823:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1977:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1955:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1660:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2118:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2414:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2422:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2050:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2218:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2621:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1943:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2662:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2194:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1869:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2672:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1933:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2129:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1810:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2600:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1716:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2427:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2935:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2123:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2002:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1870:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2183:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2633:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2436:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2232:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2828:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2031:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2254:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1782:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2204:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2329:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2014:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2375:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2194:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2218:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1785:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1873:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2796:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1655:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2036:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2265:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2424:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2205:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1957:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2380:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1713:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.3081:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2167:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2903:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2972:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2626:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1903:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1887:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2767:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2042:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1913:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2115:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1755:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1919:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2624:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1978:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1937:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2370:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2076:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2122:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2026:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1772:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2381:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1978:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1978:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1624:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2142:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2171:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1844:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1866:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2258:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2059:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2352:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1923:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2184:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1357:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1877:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1702:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1977:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2597:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2076:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2700:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2023:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2169:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2283:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1764:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2649:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1822:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2131:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1811:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1827:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2628:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1820:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2200:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1734:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1969:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2623:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2902:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2265:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2538:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1817:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2148:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2178:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1759:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1960:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2363:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2310:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1956:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2289:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2943:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2350:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2166:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2781:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1987:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2408:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2308:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2415:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2244:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1754:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2245:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1781:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1958:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2024:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2183:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2822:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2397:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2571:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1665:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1847:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1978:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2187:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1813:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2240:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2047:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2457:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2156:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2109:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2642:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2038:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2004:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1969:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2123:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1962:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1621:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1621:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2308:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2065:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2077:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2579:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2148:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2166:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2017:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2193:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2031:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2137:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1827:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2444:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2175:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2195:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2384:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2537:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2207:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1684:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2922:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2181:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2005:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1974:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1749:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1719:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2229:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2558:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2219:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1847:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2314:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2179:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2569:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1734:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2266:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2059:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1530:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2350:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2124:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2293:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2133:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2940:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1738:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1692:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2256:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1765:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2935:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1926:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2376:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2163:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2519:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2169:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1792:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2007:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2236:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2152:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2616:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1971:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2341:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2204:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2056:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2494:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1326:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1997:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2271:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2008:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2227:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2291:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2118:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1724:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1974:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2076:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2485:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2087:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2072:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1851:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1774:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2582:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2228:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2536:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2106:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2106:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1818:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1991:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2119:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1930:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2070:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1792:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2176:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2979:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2004:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1790:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2614:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2447:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2567:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2440:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2065:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1614:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2477:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2236:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2432:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2328:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2745:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2462:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2375:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2180:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1855:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1524:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2056:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2421:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2526:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1984:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2221:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2896:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2309:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2075:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2504:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2601:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1837:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1614:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1949:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2405:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1740:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1976:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1918:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2024:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2531:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2712:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2316:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1661:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1847:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2014:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2235:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1913:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1962:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1951:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1642:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2121:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2361:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2185:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2227:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2846:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1733:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1951:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.3046:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2069:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2134:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1820:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2672:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2419:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2529:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.1465:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2168:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2300:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.1972:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2143:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2121:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2038:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2649:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.1737:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.1098:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.1098:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2201:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2118:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2068:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2221:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2322:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2113:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2167:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2537:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2603:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1882:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1730:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2130:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2345:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2310:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2447:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2115:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2572:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1774:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2094:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1820:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1771:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2908:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1818:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1906:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2426:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2147:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1955:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2506:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2196:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.3033:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2505:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2285:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2618:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2007:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2046:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1992:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2296:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2832:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2426:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2737:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2099:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2206:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2199:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2104:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2462:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2701:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2202:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2025:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1818:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1694:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2184:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1999:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1413:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1703:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1781:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1934:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2075:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2236:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2225:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2491:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2308:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2169:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1983:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2222:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2257:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2076:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2747:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1900:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2133:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2070:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2381:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2580:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2356:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1969:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2185:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2010:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1830:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1829:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1542:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1542:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2122:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2393:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1968:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1591:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1666:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2392:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1897:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1647:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1700:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2235:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1907:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2278:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2708:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1997:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2226:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1763:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1766:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2865:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1681:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1959:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2153:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2350:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2134:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1833:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1771:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1921:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2255:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1999:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1787:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2117:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2537:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1793:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1891:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1740:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1945:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1794:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2506:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2219:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1950:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2074:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2161:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1967:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2401:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2077:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2267:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1846:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2522:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2637:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1934:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1941:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2177:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1909:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2139:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2911:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2024:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2111:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2609:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2199:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2426:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1688:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1993:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2535:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2701:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2478:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1697:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1661:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2162:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1836:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1844:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1974:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2009:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2325:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1326:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2050:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1584:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2706:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2007:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2668:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.0899:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.0899:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.1933:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2071:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2364:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2262:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.1961:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2104:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2557:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.1804:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2410:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2494:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2117:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.1754:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.1547:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.1774:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2113:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2526:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2548:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2272:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2224:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2038:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2033:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2106:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2203:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1514:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2018:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2575:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2110:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1950:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2242:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2395:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1617:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2180:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2268:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1874:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2378:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2167:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1623:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2692:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2190:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2291:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1771:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2257:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2183:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2088:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1698:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2159:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1694:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2278:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2123:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1528:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1847:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2607:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1520:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2005:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2269:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2180:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.3069:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2466:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2762:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2232:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.3047:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2320:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2111:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2593:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1947:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2840:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2456:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2483:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2160:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2038:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1931:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2748:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1704:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2098:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2068:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2318:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2125:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2352:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1999:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1999:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2244:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2517:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1817:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2672:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2268:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2211:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1732:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2714:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2087:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1709:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2535:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2815:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1720:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1911:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2534:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1750:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1968:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1950:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1948:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2814:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1975:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1525:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1995:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2847:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1955:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1907:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2477:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2039:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2717:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2479:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2493:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2150:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1951:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2372:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2016:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2259:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1923:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2512:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2221:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1887:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2295:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2090:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2640:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1932:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2334:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2333:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2124:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1913:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1944:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1889:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2066:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2065:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2230:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1679:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1701:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1814:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1870:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2517:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1745:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2260:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1908:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2140:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1801:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2332:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1839:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1865:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2522:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2140:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1832:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2000:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2619:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2472:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2052:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1761:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2216:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2175:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2360:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1849:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2467:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2467:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2127:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2726:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2435:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2142:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2324:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2620:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1932:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2013:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2087:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2127:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2105:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1594:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2248:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2459:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1776:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2379:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2009:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1914:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2030:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1757:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1551:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2597:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2115:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2193:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.3319:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2517:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2706:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2236:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.3921:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2144:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2628:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1542:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1750:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2621:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1976:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1943:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2003:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2150:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2196:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2302:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2392:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2403:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2764:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2492:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1959:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1934:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2473:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2467:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2112:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1856:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2438:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1822:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1891:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1489:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1579:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2328:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1853:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2177:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2418:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1750:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1442:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1867:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2842:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2256:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2247:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1759:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2075:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1846:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1800:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1949:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1875:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2287:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2169:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1702:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2127:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1929:  92%|█████████▏| 368/401 [04:29<00:14,  2.32it/s]training loss: 0.1979:  92%|█████████▏| 368/401 [04:29<00:14,  2.32it/s]training loss: 0.1670:  92%|█████████▏| 368/401 [04:29<00:14,  2.32it/s]training loss: 0.1776:  92%|█████████▏| 368/401 [04:29<00:14,  2.32it/s]training loss: 0.1776:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2497:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1718:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2733:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2099:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2009:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2020:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2287:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2022:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2345:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2138:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2500:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1893:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1979:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1925:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1851:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1706:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2040:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2150:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2247:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2267:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2507:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1889:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2022:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1840:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2278:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2226:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1807:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1836:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2865:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2237:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2123:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1891:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2478:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1805:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2117:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2058:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2331:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1705:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1550:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1594:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2627:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2055:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2079:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2952:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2011:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1995:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1939:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2555:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1868:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2474:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2079:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1929:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2423:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1589:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1758:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2232:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2263:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2265:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1322:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1918:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2306:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1804:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1917:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2166:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2311:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2445:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2295:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2631:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2291:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1995:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1780:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2502:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1849:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1830:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1954:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2116:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2342:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1961:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2694:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2694:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2163:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2155:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2223:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1947:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2153:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2167:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1999:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1902:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1873:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2443:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2098:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2723:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2560:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1834:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1914:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1636:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2537:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2395:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2193:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2185:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2257:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2030:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1491:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1943:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2495:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2654:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1710:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2054:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2543:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2552:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2404:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2244:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2190:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1555:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2439:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2525:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2284:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2291:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2271:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2054:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1934:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2448:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1975:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2481:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2542:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1985:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2977:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2638:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1960:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2591:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2032:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2179:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1788:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2096:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1745:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1787:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1801:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1814:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1962:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1862:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2775:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2308:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1789:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2239:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2012:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1835:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2480:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1940:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2532:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2119:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1506:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1895:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2054:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2543:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1825:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2657:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2324:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2965:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2376:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2376:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1518:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2514:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1816:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2042:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2084:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2385:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2188:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2588:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1941:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1725:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2014:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.3107:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1940:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2064:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2345:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2382:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2647:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2599:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2288:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2370:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2180:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2213:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2426:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2586:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2029:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2424:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1995:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1662:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2378:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2517:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2324:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1926:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2597:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2166:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1634:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2434:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2243:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1910:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2583:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2697:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2559:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2512:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2332:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2080:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1322:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2417:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2242:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1687:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2023:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1735:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2922:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2413:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2155:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1760:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1876:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1773:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2297:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1795:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1865:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2074:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1960:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1600:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2040:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1930:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2150:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1738:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1847:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2174:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2504:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2442:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1994:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2557:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2433:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1898:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1710:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1978:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1972:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2203:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.6324:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.6324:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1661:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2832:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2671:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2264:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2602:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2102:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2167:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2156:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2213:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2118:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1533:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1688:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1785:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2395:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1684:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2412:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1897:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2021:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2267:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2359:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2497:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1849:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.3115:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1790:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1680:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2146:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2427:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2488:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2383:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1858:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2541:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2612:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2340:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1699:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2515:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2132:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2086:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.3002:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1899:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2157:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2008:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2690:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1969:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2366:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2858:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2196:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2652:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1936:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.3053:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1832:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1885:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1445:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1913:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2086:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2144:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2594:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2306:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2034:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1583:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2289:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2142:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2359:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2224:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2727:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2037:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1811:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2169:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2303:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1818:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1942:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2270:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2032:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2418:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2460:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2251:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.1970:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2205:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2013:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2790:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2790:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2308:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1947:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2610:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2979:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1784:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2635:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1695:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1473:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1441:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1975:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1954:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1670:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2525:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2389:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1689:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2205:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1915:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2508:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1665:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2196:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2120:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2063:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1983:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1954:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1951:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2571:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1433:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2209:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2375:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2251:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2430:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1910:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1903:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1863:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2003:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1592:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2303:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2112:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1987:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2077:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2489:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1923:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1888:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2825:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2359:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2559:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2424:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2163:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2070:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2527:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2551:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2616:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2086:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2403:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2285:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2231:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1967:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1904:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2405:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1828:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1853:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2366:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2051:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2074:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1999:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2173:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1964:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2175:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2168:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1845:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2396:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2313:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2032:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2136:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1871:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1974:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.3049:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2003:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.4360:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.4360:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2239:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1771:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2079:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1667:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2815:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.3386:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1898:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2172:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2959:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2220:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2309:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1561:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2026:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1868:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2107:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2270:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1473:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2369:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1871:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1976:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1899:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2825:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2285:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2246:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2025:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1911:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2698:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2955:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1650:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1624:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2168:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2031:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2086:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2766:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1957:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2504:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2455:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1913:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2180:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2179:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1797:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1997:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2449:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1773:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1869:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2256:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2213:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2397:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1947:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2141:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2394:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1787:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2135:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1898:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2666:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2180:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2029:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2236:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2010:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2597:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1747:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2062:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2374:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2417:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1903:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2153:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2263:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2334:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1599:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2393:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1607:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2741:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1873:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2548:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1899:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2177:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1941:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2954:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2155:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2155:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2567:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2140:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1802:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1996:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2342:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2512:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2011:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1822:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1559:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1911:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1811:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2136:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1885:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2013:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2518:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2117:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2670:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2432:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2055:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1985:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2453:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2665:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2431:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2208:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2662:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2224:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2721:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2103:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2169:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2598:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2440:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2086:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1523:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2480:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2647:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2777:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2378:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2274:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2890:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2126:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2179:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2283:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1949:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2247:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1697:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2609:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1821:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2374:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2443:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2123:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1893:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2170:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1802:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2304:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1571:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1815:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2238:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2227:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2261:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1623:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2173:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2705:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.1840:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.1629:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2961:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2012:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2230:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.1987:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.1862:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2285:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.1677:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2273:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.1941:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.1677:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.1929:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2196:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2047:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2760:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.6970:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.6970:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1856:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2348:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2014:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2043:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2457:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1609:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2231:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1856:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2353:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2878:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1866:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2190:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2799:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1953:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2096:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1630:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2830:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2085:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1879:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2241:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2055:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2665:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2283:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2277:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2516:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1868:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2697:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2001:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2081:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1844:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1923:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1790:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1985:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2434:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2457:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1772:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2628:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2338:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2394:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1845:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2260:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1793:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2001:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2412:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1865:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2102:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2542:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2959:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2151:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2285:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2258:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1983:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2279:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2006:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2021:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1877:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2180:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2301:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2063:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2129:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2482:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1813:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2003:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2006:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2211:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1810:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1960:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1387:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1953:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1705:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2236:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2173:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2422:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2031:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2127:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2284:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2052:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1780:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1542:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1542:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2205:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1922:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2632:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2370:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1724:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2272:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1951:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2265:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1663:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.3089:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2005:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2345:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1681:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2483:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2697:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2285:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2375:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2361:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2513:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1646:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2290:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1843:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2846:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2518:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2042:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1924:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2005:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1891:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1775:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2360:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2290:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1739:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2517:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1607:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2061:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2309:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1466:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2235:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2116:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1717:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1956:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2685:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1772:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2029:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1505:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2109:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1853:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1700:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2355:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1838:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2102:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1668:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1810:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2828:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2382:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2580:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1953:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1973:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1941:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1899:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2085:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1709:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1486:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2194:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2537:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1967:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2039:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1765:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2646:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2027:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.3080:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1686:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1562:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2143:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2165:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2023:  94%|█████████▍| 377/401 [04:35<00:11,  2.10it/s]training loss: 0.2458:  94%|█████████▍| 377/401 [04:35<00:11,  2.10it/s]training loss: 0.2063:  94%|█████████▍| 377/401 [04:35<00:11,  2.10it/s]training loss: 0.2467:  94%|█████████▍| 377/401 [04:35<00:11,  2.10it/s]training loss: 0.2467:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2169:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2542:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1666:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2274:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1848:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2374:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2344:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2284:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2089:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2060:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1532:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1972:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1908:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2052:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.3024:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2176:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2044:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2002:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2846:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2138:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2423:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2318:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1664:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1770:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2370:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2147:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2370:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1994:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2697:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2296:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1846:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1651:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1950:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2174:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1810:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1787:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2289:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2519:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2677:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2251:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1739:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2347:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2205:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2077:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1465:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2142:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2017:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2607:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1863:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1461:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2341:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2276:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2072:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1684:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1590:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2634:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2210:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2096:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2351:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2573:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2686:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1761:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2206:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2045:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1747:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2014:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2542:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2064:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1955:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1311:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1894:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2167:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2376:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1760:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2336:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1953:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1566:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.3009:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1858:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1858:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2156:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2099:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2703:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2468:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2399:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2096:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1947:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1574:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2122:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1698:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2490:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1846:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1855:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2140:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1687:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2313:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2106:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2331:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2166:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1694:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1912:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2433:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1917:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2492:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2062:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2553:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2140:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2029:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2832:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2306:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1966:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1471:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2137:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2814:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1949:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1745:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2298:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1983:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2119:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1813:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1615:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1706:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2469:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2369:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2671:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2209:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1725:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2274:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2329:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2412:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2030:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2534:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2219:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2377:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2235:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2325:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2164:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2088:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1886:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1860:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2709:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2366:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2597:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2742:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2112:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2958:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2212:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2134:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2071:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1952:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1429:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1990:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2520:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1754:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2648:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2320:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2198:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1781:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.3279:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.3279:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1843:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2435:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2251:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2440:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1928:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1646:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2466:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2412:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2498:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1995:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2078:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2298:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1697:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2722:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2255:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2252:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2275:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2026:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2298:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2512:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2026:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2333:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2173:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2335:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2336:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2008:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1872:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2321:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2424:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2323:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2277:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2436:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1846:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2279:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1696:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2359:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2167:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1293:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1860:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2544:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2243:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2605:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2359:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2131:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2350:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2059:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2347:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1674:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2286:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1917:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2233:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2040:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2975:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2232:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1774:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2435:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2084:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1696:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2020:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2136:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2324:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1568:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2509:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.3075:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1919:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2151:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.2133:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.2429:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.1750:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.1899:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.1883:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.2070:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.2977:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.2207:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.1978:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.2192:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.1855:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.1865:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.2895:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.2895:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2013:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1693:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2195:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2764:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2770:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2069:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2080:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2311:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2064:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2420:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2290:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1759:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2688:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2423:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1600:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2019:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2119:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1932:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2570:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2168:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2084:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2158:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2464:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2324:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.3077:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2521:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2342:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1689:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2296:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1906:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1874:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1921:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1959:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1748:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2981:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2566:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2823:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2063:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2097:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2700:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1987:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1360:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2119:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1423:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2640:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2128:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2478:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2408:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2214:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2259:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2403:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1886:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2365:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2285:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2170:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1960:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1924:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1845:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2018:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2095:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1734:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2305:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1985:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2865:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2420:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2209:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1619:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2209:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1869:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2070:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1857:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2466:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1816:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2334:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1833:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2387:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1776:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2376:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.3740:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.3740:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1962:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2010:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1814:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2399:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2647:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1980:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1814:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1903:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2474:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2354:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1761:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2641:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1818:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2038:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1827:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1647:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2126:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2024:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2833:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2544:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2137:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2119:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2481:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2094:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2388:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2055:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2170:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2194:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2068:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2082:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2376:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1950:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2620:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2889:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1800:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2045:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1919:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2116:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1887:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1945:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2850:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1893:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1857:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1997:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1622:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2520:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1590:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1957:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2106:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2544:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1405:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2690:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2455:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1805:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2443:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2662:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1773:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2585:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1566:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2840:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2478:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2081:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2353:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2137:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2743:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1541:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1882:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2114:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2682:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1692:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2413:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1665:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2077:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2008:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2180:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2296:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1831:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1823:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1824:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1824:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2168:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2160:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1560:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1939:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2035:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1856:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2654:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1984:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2088:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2349:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2150:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2333:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2590:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1927:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2547:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2309:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1966:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2135:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2327:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2262:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2903:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1941:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2112:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1774:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2181:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.3092:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2833:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2177:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2297:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1656:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2082:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1942:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1886:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1893:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2116:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2280:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2328:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2302:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1910:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2138:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2103:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2250:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1841:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2346:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1907:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2465:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2365:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1972:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1898:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1847:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1775:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2269:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2370:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1658:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2425:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2285:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2198:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2240:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2033:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1605:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2212:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2048:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1808:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2060:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2543:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2240:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2858:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2454:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1759:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2167:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2386:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1974:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2529:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2085:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2917:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1943:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1945:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1636:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2732:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2732:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.2305:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.1920:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.2030:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.2120:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.2125:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.1979:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.2546:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.2634:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.2742:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2209:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1897:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1969:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1876:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2022:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1911:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2594:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2218:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1964:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1859:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2209:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2641:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2044:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2079:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2027:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2230:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1462:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1978:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1964:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1706:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1670:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2429:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1747:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1867:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2331:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2599:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1886:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2163:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2255:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1988:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1799:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2121:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2541:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2019:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1780:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2406:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2559:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2086:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1957:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1822:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2411:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2053:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2397:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1582:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2163:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2160:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1793:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2489:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1687:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2019:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2187:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2165:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2269:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2178:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1957:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1496:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2130:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2128:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2381:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2259:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2831:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2155:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2686:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1989:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2786:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2517:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2231:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1714:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1773:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.0720:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.0720:  96%|█████████▌| 385/401 [04:40<00:11,  1.43it/s]training loss: 0.1654:  96%|█████████▌| 385/401 [04:40<00:11,  1.43it/s]training loss: 0.2774:  96%|█████████▌| 385/401 [04:40<00:11,  1.43it/s]training loss: 0.2056:  96%|█████████▌| 385/401 [04:40<00:11,  1.43it/s]training loss: 0.1796:  96%|█████████▌| 385/401 [04:40<00:11,  1.43it/s]training loss: 0.1803:  96%|█████████▌| 385/401 [04:40<00:11,  1.43it/s]training loss: 0.2213:  96%|█████████▌| 385/401 [04:40<00:11,  1.43it/s]training loss: 0.2237:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1743:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1737:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2237:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1653:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2066:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2182:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2302:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2139:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2193:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1952:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1689:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2021:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.3057:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1939:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2141:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1908:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2257:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2014:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2256:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1893:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2007:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1516:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1909:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2727:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1543:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1608:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2325:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2488:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1878:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2356:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2826:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2596:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1999:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2245:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1775:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2294:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1853:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1995:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2200:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1526:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2408:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2372:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2004:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2264:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2105:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2282:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2505:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2011:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.3230:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2473:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2135:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1807:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2529:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2320:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2253:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.3093:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.1964:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2544:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2370:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.1809:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2132:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.1804:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2188:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2315:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2784:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2526:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.1994:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2221:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2227:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2011:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2366:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.1863:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.1863:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1605:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2273:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1918:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2024:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2062:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1989:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1847:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2758:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1783:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2097:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2442:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2352:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1890:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1823:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2764:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2186:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2017:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2075:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2035:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2169:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1927:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2695:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2206:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2079:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1600:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2713:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1957:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2661:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2130:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1909:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2352:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2052:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1710:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2266:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2646:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1966:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2651:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2550:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2202:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1844:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2163:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1953:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2009:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1808:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2380:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2292:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2491:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2215:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2180:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2661:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1876:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1706:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1943:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2279:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2081:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1649:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2543:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2172:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1682:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2034:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1799:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2123:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2563:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2100:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2129:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1921:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2753:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2149:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2441:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1979:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2076:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2294:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2081:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1827:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2119:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2272:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2014:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2507:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.3579:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.3579:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1935:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1725:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1521:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1871:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2172:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1916:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1667:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1772:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1973:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2243:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2131:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2354:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2392:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1982:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2147:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2147:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2157:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2146:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1899:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2087:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2684:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2334:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1748:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2363:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1737:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1680:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1967:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2384:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2410:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1626:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1835:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2300:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1294:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2436:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1510:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1668:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2190:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2211:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2064:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.3104:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2507:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2054:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2299:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1716:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2267:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1806:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2679:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2007:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1767:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1986:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1738:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1594:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2129:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2300:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2551:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2339:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1904:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2205:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1984:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2191:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2547:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2139:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2070:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2113:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1953:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1656:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2235:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1714:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1677:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1993:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1657:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2344:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2004:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1666:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2162:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2043:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1981:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2075:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2065:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2065:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2617:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2143:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2173:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2531:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2612:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2780:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2852:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2138:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1655:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2296:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2407:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1974:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2276:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2264:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2268:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1873:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1939:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2130:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2193:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2278:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2105:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2765:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2390:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1944:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1709:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2015:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2153:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2093:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1748:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2519:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2049:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2258:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1809:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2201:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2455:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1846:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1990:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2006:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1826:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1909:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2399:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1801:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1963:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2021:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1631:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.3357:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2020:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2056:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2154:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2049:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2146:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2324:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2102:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1658:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1421:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1990:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1671:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2220:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1881:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1713:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2304:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2164:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2913:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2074:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2118:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2319:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2516:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2535:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1556:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1899:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1539:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2009:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1661:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2233:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1501:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1803:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1832:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1607:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.0655:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.0655:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2344:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2291:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2215:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1810:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1926:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2474:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1763:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2214:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1984:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2185:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2489:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2670:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2494:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1628:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2263:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2572:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1934:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1440:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1650:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1764:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2196:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1587:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2356:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2080:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1745:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2121:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2538:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2189:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2546:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2469:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2786:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2150:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2211:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1905:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2523:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1839:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2201:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2258:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2332:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2203:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1672:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2647:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1988:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1931:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2302:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2003:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1976:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2369:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2351:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2559:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2049:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2053:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2321:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1976:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2671:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1291:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1609:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2485:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1963:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1453:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1710:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1876:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2226:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1975:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2280:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1728:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2326:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2187:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1514:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2405:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2229:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2034:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1918:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2342:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2623:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2082:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2111:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2634:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1801:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1801:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1855:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2348:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2723:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2207:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1731:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1791:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2657:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1941:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1672:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1916:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2228:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1665:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2067:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2475:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2422:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1721:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1968:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2256:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2012:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1865:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2420:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2937:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2008:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2222:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2385:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1943:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2134:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1787:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2214:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2034:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1982:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1859:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1941:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2528:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2068:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1869:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1896:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1964:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2008:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1752:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2294:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2079:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2925:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2200:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1744:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1883:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2310:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2183:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2004:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2130:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1975:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2050:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2400:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1968:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1582:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2068:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2942:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2276:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2822:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1857:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2478:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1987:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1775:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1908:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1872:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2314:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2238:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1648:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1779:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1756:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1667:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2554:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1704:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2188:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2038:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1455:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1739:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2093:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2666:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2666:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2208:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1838:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2313:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2062:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1968:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2018:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1983:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2435:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2690:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1605:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1805:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2081:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2064:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2355:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1886:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1743:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2092:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2319:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1798:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2449:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2246:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1993:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2248:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2355:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2031:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2272:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2374:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1579:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2438:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1785:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2246:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2079:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2290:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2068:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2978:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1938:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2417:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2048:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1627:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2380:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2229:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1695:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2828:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2193:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2774:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2118:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2217:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2707:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2416:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2489:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1747:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2357:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1685:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2304:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2579:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2477:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1836:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2177:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2314:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2227:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2274:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2322:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2286:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2021:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2091:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2297:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2225:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2014:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2103:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2104:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1711:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1854:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2040:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1743:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2450:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1906:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1804:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2275:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1365:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1365:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2510:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2048:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2340:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2488:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2265:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2744:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1633:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2785:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1769:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2035:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1718:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1694:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2344:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2309:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1608:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2937:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1694:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1670:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1947:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1963:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2036:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2322:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1777:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2479:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2179:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2409:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2398:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1989:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2051:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2639:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1857:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2260:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2077:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1857:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2220:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2004:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2614:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1945:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1969:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2640:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1822:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2118:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2037:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2549:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1788:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2731:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2583:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2177:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2436:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2142:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2853:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2447:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2226:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2270:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2253:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1955:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1907:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2012:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2025:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2288:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1866:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2601:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2214:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1827:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1999:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2398:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1986:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2508:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1812:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2359:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2444:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1891:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1753:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1637:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2438:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2565:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1627:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1646:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.0931:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.0931:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2335:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1558:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1820:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2041:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2104:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2322:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2486:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2183:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2544:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2242:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2141:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1561:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1969:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1872:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2724:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1930:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1910:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2033:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2371:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1774:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2435:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1946:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2194:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1946:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1963:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1714:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2345:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2359:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1546:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2001:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2306:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1900:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1751:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2022:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1977:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2902:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2226:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2192:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2776:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2150:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2114:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1911:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2013:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2016:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2204:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2187:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2369:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2594:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2037:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2729:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1985:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2294:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1931:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1539:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2243:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2658:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1964:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2294:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1502:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2548:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1998:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2285:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2018:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2805:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1881:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1696:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2172:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1767:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1721:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2311:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1972:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2223:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1979:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1977:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1455:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.3338:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1944:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2434:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1118:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1118:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2785:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2335:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2485:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1920:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2276:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1900:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2076:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2807:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2026:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2284:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.3118:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2098:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1877:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2139:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1922:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2300:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2138:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2348:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2236:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2531:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2773:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1744:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2640:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2106:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1761:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2370:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1974:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2000:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1807:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2516:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2395:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2234:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2018:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2434:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2201:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1585:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2293:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2218:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2192:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1798:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1627:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1849:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2055:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2246:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2394:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1877:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2659:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2330:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2347:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1779:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1820:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1990:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1941:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2186:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2076:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2189:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1588:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2520:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2013:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2047:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2140:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2268:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2169:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2454:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1838:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2054:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2172:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2551:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2836:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2682:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2395:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2248:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.3487:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2081:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2069:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2107:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2093:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2140:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.4933:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.4933:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1812:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1693:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2180:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1968:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2182:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2191:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2682:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1655:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1990:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2578:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1831:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1724:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1658:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2203:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1612:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2035:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1412:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1910:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1828:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2490:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2449:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2547:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2132:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2962:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2461:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2683:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2012:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2245:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2195:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2135:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2261:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2470:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1804:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1914:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2657:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2545:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2411:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2163:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2093:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2349:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1644:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1855:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2367:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1805:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2437:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1476:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2032:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2266:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1883:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2509:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2828:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2430:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1919:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2050:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1997:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2248:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2449:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1936:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2178:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2258:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2426:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1708:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2443:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1657:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1887:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2579:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2359:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1982:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2203:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2280:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1731:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2213:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1961:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2009:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2234:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2576:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2021:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1924:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1015:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1015:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1612:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2396:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1772:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2115:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1878:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2517:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2215:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2836:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2562:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1425:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1795:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1668:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2342:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2389:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1611:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2011:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2366:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2006:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2645:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1589:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1595:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1901:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2391:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2211:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1802:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2347:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2061:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2158:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2450:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2290:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1927:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2025:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2040:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1933:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2156:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2280:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1564:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1758:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1942:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2511:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.3107:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1734:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1833:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2258:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2301:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1973:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2084:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2161:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2147:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2720:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2389:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2534:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.3075:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1696:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2214:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1653:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1965:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1506:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2482:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1792:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2351:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1377:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1768:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2036:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1930:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1896:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1856:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1542:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2443:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2000:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1893:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2209:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1906:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2330:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2076:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1909:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.3067:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1652:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1466:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1466:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1540:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1992:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2148:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2164:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2187:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1722:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2128:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2410:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2548:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2306:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1386:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2832:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1793:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2311:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2393:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1916:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2301:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2211:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1899:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2650:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2063:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1683:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2170:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1877:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2295:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1973:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2270:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2406:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1789:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2375:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1768:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2153:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1924:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2589:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2137:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1885:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1993:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2522:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2451:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1958:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2377:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2174:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1952:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2097:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1848:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2274:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1714:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1735:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1868:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2054:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1672:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1914:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2137:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2723:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2204:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2415:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1765:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2288:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2047:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1922:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2374:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2166:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2146:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2837:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1966:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2186:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2521:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1938:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2168:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2143:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2155:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2091:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1727:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1878:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2256:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1841:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1672:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2200:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.3397:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.3397:  99%|█████████▉| 398/401 [04:48<00:01,  2.22it/s]training loss: 0.1487:  99%|█████████▉| 398/401 [04:48<00:01,  2.22it/s]training loss: 0.2361:  99%|█████████▉| 398/401 [04:48<00:01,  2.22it/s]training loss: 0.2054:  99%|█████████▉| 398/401 [04:48<00:01,  2.22it/s]training loss: 0.1989:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2287:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2284:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1731:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2315:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2049:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2083:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1959:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1836:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2061:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2223:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2173:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2544:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2165:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1974:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2470:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2414:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1934:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2186:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2243:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1468:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2237:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2508:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2128:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2017:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1849:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1689:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2422:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2026:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2277:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1979:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1779:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2086:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2501:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2356:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.3045:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2123:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1476:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2272:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1691:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2300:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2141:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2235:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2001:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2373:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2916:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2053:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2741:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1856:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1714:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1914:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2358:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2140:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1671:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2431:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2046:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2201:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2527:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2384:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1837:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1707:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1832:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1490:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2078:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2418:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2040:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1939:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2505:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1925:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1906:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2220:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2284:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2658:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1871:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2279:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1124:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1124: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2326: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1651: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1949: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1639: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2059: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2373: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1917: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1631: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1950: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2068: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2241: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2687: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2516: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2098: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1963: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2571: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2322: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1617: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1896: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2009: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2063: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2216: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2070: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2115: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2122: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2372: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2851: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2238: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1857: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1731: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.3375: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1894: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2121: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2054: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2428: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1960: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1988: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2170: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2134: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2153: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1513: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2170: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1914: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1689: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2387: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2016: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1929: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2013: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1975: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1965: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1832: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1820: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2147: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2169: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1754: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1797: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1765: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2084: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2136: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2215: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2561: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1811: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2094: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2358: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1665: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2243: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1858: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2052: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1766: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1660: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2144: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2205: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2185: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2219: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1931: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2608: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1775: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1744: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1634: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1634: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1881: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2320: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2583: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2526: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1786: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2483: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2128: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1841: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2804: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1729: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1977: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2064: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1680: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1855: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2471: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2537: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1744: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2649: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1646: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2390: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1983: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2015: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1962: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2663: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1757: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2093: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2121: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1836: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2821: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1990: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2228: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2358: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1698: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2363: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.3665: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1682: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2665: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2232: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2063: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2295: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2132: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2114: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2084: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1917: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2344: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2456: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.3044: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2575: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2623: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2391: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2209: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2408: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2615: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1798: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1531: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2119: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1986: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2233: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2007: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.3145: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2444: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2632: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1955: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2428: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2190: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2077: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2272: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2573: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2230: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2491: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1906: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2143: 100%|█████████▉| 400/401 [04:50<00:00,  2.53it/s]training loss: 0.2257: 100%|█████████▉| 400/401 [04:50<00:00,  2.53it/s]training loss: 0.1993: 100%|█████████▉| 400/401 [04:50<00:00,  2.53it/s]training loss: 0.2151: 100%|█████████▉| 400/401 [04:50<00:00,  2.53it/s]training loss: 0.1991: 100%|█████████▉| 400/401 [04:50<00:00,  2.53it/s]training loss: 0.1735: 100%|█████████▉| 400/401 [04:50<00:00,  2.53it/s]training loss: 0.2299: 100%|█████████▉| 400/401 [04:50<00:00,  2.53it/s]training loss: 0.2009: 100%|█████████▉| 400/401 [04:50<00:00,  2.53it/s]training loss: 0.2009: 100%|██████████| 401/401 [04:52<00:00,  1.12s/it]training loss: 0.2009: 100%|██████████| 401/401 [04:52<00:00,  1.37it/s]
diff --git a/slurm/logs/pidm_toy_9912868.out b/slurm/logs/pidm_toy_9912868.out
new file mode 100644
index 0000000..a509d5a
--- /dev/null
+++ b/slurm/logs/pidm_toy_9912868.out
@@ -0,0 +1,21 @@
+Thu May 14 15:47:07 2026       
++-----------------------------------------------------------------------------------------+
+| NVIDIA-SMI 580.126.20             Driver Version: 580.126.20     CUDA Version: 13.0     |
++-----------------------------------------+------------------------+----------------------+
+| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
+| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
+|                                         |                        |               MIG M. |
+|=========================================+========================+======================|
+|   0  NVIDIA A100 80GB PCIe          On  |   00000000:AE:00.0 Off |                    0 |
+| N/A   38C    P0             44W /  300W |       0MiB /  81920MiB |      0%      Default |
+|                                         |                        |             Disabled |
++-----------------------------------------+------------------------+----------------------+
+
++-----------------------------------------------------------------------------------------+
+| Processes:                                                                              |
+|  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
+|        ID   ID                                                               Usage      |
+|=========================================================================================|
+|  No running processes found                                                             |
++-----------------------------------------------------------------------------------------+
+checkpoint saved to ./trained_models/toy/toy_9912868/model
diff --git a/slurm/mechanics_cocogen.slurm b/slurm/mechanics_cocogen.slurm
new file mode 100644
index 0000000..cac51b5
--- /dev/null
+++ b/slurm/mechanics_cocogen.slurm
@@ -0,0 +1,46 @@
+#!/bin/bash
+#SBATCH --job-name=pidm_mech_cocogen
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=8G
+#SBATCH --time=60:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+
+# WARNING: CoCoGen correction steps (M_correction > 0) are not implemented for
+# gov_eqs=mechanics in this codebase and will raise a ValueError at startup. This script
+# is provided for completeness. To run CoCoGen, use darcy_cocogen.slurm instead.
+
+set -euo pipefail
+
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+VARIANT="mechanics_cocogen"
+
+cd "$WORKDIR"
+mkdir -p slurm/logs
+
+module load cuda/12.1
+
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+
+cp "configs/${VARIANT}.yaml" model.yaml
+
+export PIDM_RUN_NAME="${VARIANT}_${SLURM_JOB_ID}"
+
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+
+TMPSCRIPT=$(mktemp --suffix=_main.py)
+sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
+python "$TMPSCRIPT"
+rm -f "$TMPSCRIPT"
diff --git a/slurm/mechanics_diffusion.slurm b/slurm/mechanics_diffusion.slurm
new file mode 100644
index 0000000..6effa0e
--- /dev/null
+++ b/slurm/mechanics_diffusion.slurm
@@ -0,0 +1,42 @@
+#!/bin/bash
+#SBATCH --job-name=pidm_mech_diffusion
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=8G
+#SBATCH --time=60:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+
+set -euo pipefail
+
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+VARIANT="mechanics_diffusion"
+
+cd "$WORKDIR"
+mkdir -p slurm/logs
+
+module load cuda/12.1
+
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+
+cp "configs/${VARIANT}.yaml" model.yaml
+
+export PIDM_RUN_NAME="${VARIANT}_${SLURM_JOB_ID}"
+
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+
+TMPSCRIPT=$(mktemp --suffix=_main.py)
+sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
+python "$TMPSCRIPT"
+rm -f "$TMPSCRIPT"
diff --git a/slurm/mechanics_pg.slurm b/slurm/mechanics_pg.slurm
new file mode 100644
index 0000000..e1a2ef8
--- /dev/null
+++ b/slurm/mechanics_pg.slurm
@@ -0,0 +1,46 @@
+#!/bin/bash
+#SBATCH --job-name=pidm_mech_pg
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=8G
+#SBATCH --time=60:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+
+# WARNING: residual_grad_guidance (PG-Diffusion) is not implemented for gov_eqs=mechanics
+# in this codebase and will raise a ValueError at startup. This script is provided for
+# completeness. To run PG-Diffusion, use darcy_pg.slurm for the Darcy flow experiment.
+
+set -euo pipefail
+
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+VARIANT="mechanics_pg"
+
+cd "$WORKDIR"
+mkdir -p slurm/logs
+
+module load cuda/12.1
+
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+
+cp "configs/${VARIANT}.yaml" model.yaml
+
+export PIDM_RUN_NAME="${VARIANT}_${SLURM_JOB_ID}"
+
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+
+TMPSCRIPT=$(mktemp --suffix=_main.py)
+sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
+python "$TMPSCRIPT"
+rm -f "$TMPSCRIPT"
diff --git a/slurm/mechanics_pidm_me.slurm b/slurm/mechanics_pidm_me.slurm
new file mode 100644
index 0000000..c1a2d6f
--- /dev/null
+++ b/slurm/mechanics_pidm_me.slurm
@@ -0,0 +1,42 @@
+#!/bin/bash
+#SBATCH --job-name=pidm_mech_pidm_me
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=8G
+#SBATCH --time=60:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+
+set -euo pipefail
+
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+VARIANT="mechanics_pidm_me"
+
+cd "$WORKDIR"
+mkdir -p slurm/logs
+
+module load cuda/12.1
+
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+
+cp "configs/${VARIANT}.yaml" model.yaml
+
+export PIDM_RUN_NAME="${VARIANT}_${SLURM_JOB_ID}"
+
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+
+TMPSCRIPT=$(mktemp --suffix=_main.py)
+sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
+python "$TMPSCRIPT"
+rm -f "$TMPSCRIPT"
diff --git a/slurm/mechanics_pidm_se.slurm b/slurm/mechanics_pidm_se.slurm
new file mode 100644
index 0000000..7bef3ed
--- /dev/null
+++ b/slurm/mechanics_pidm_se.slurm
@@ -0,0 +1,42 @@
+#!/bin/bash
+#SBATCH --job-name=pidm_mech_pidm_se
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=8G
+#SBATCH --time=60:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+
+set -euo pipefail
+
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+VARIANT="mechanics_pidm_se"
+
+cd "$WORKDIR"
+mkdir -p slurm/logs
+
+module load cuda/12.1
+
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+
+cp "configs/${VARIANT}.yaml" model.yaml
+
+export PIDM_RUN_NAME="${VARIANT}_${SLURM_JOB_ID}"
+
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+
+TMPSCRIPT=$(mktemp --suffix=_main.py)
+sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
+python "$TMPSCRIPT"
+rm -f "$TMPSCRIPT"
diff --git a/slurm/test_gpu.slurm b/slurm/test_gpu.slurm
new file mode 100644
index 0000000..798fccb
--- /dev/null
+++ b/slurm/test_gpu.slurm
@@ -0,0 +1,27 @@
+#!/bin/bash
+#SBATCH --job-name=test_gpu
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=4G
+#SBATCH --time=00:05:00
+#SBATCH --output=test_gpu.out
+
+set -euo pipefail
+
+module load cuda/12.1
+
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+
+python - <<'PYEOF'
+import torch
+print("Torch:", torch.__version__)
+print("Torch CUDA:", torch.version.cuda)
+print("CUDA available:", torch.cuda.is_available())
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
diff --git a/slurm/toy.slurm b/slurm/toy.slurm
new file mode 100644
index 0000000..e4ea3ec
--- /dev/null
+++ b/slurm/toy.slurm
@@ -0,0 +1,43 @@
+#!/bin/bash
+#SBATCH --job-name=pidm_toy
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=2G
+#SBATCH --time=00:30:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+
+set -euo pipefail
+
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+
+cd "$WORKDIR"
+mkdir -p slurm/logs
+
+module load cuda/12.1
+
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+
+nvidia-smi
+
+# Run toy sanity check (~12 min).
+# Patches wandb_track to False so no wandb account is needed.
+TMPSCRIPT=$(mktemp --suffix=_main_toy.py)
+sed -e "s/'wandb_track': True/'wandb_track': False/" \
+    -e "s/'name': 'run_1'/'name': 'toy_${SLURM_JOB_ID}'/" \
+    main_toy.py > "$TMPSCRIPT"
+python "$TMPSCRIPT"
+rm -f "$TMPSCRIPT"

From a282bbde5cbe0353f8d4f814d72e543105e5b62c Mon Sep 17 00:00:00 2001
From: dimanaStoyanova7 <stoyanovadimana557@gmail.com>
Date: Thu, 21 May 2026 09:23:39 +0200
Subject: [PATCH 02/12] fix in slurm scripts

---
 slurm/darcy_cocogen.slurm            | 2 +-
 slurm/darcy_diffusion.slurm          | 4 ++--
 slurm/darcy_pg.slurm                 | 2 +-
 slurm/darcy_pidm_me.slurm            | 2 +-
 slurm/darcy_pidm_se.slurm            | 2 +-
 slurm/logs/pidm_darcy_pg_9943187.err | 4 ++++
 slurm/logs/pidm_darcy_pg_9943187.out | 3 +++
 slurm/mechanics_cocogen.slurm        | 2 +-
 slurm/mechanics_diffusion.slurm      | 2 +-
 slurm/mechanics_pg.slurm             | 2 +-
 slurm/mechanics_pidm_me.slurm        | 2 +-
 slurm/mechanics_pidm_se.slurm        | 2 +-
 slurm/toy.slurm                      | 2 +-
 13 files changed, 19 insertions(+), 12 deletions(-)
 create mode 100644 slurm/logs/pidm_darcy_pg_9943187.err
 create mode 100644 slurm/logs/pidm_darcy_pg_9943187.out

diff --git a/slurm/darcy_cocogen.slurm b/slurm/darcy_cocogen.slurm
index 890d1f3..f2c5907 100644
--- a/slurm/darcy_cocogen.slurm
+++ b/slurm/darcy_cocogen.slurm
@@ -38,5 +38,5 @@ PYEOF
 
 TMPSCRIPT=$(mktemp --suffix=_main.py)
 sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
-python "$TMPSCRIPT"
+PYTHONPATH="$WORKDIR" python "$TMPSCRIPT"
 rm -f "$TMPSCRIPT"
diff --git a/slurm/darcy_diffusion.slurm b/slurm/darcy_diffusion.slurm
index 54c5a49..6025ca7 100644
--- a/slurm/darcy_diffusion.slurm
+++ b/slurm/darcy_diffusion.slurm
@@ -5,7 +5,7 @@
 #SBATCH --cpus-per-task=4
 #SBATCH --gpus-per-task=1
 #SBATCH --mem-per-cpu=7500M
-#SBATCH --time=20:00:00
+#SBATCH --time=1:00:00
 #SBATCH --output=slurm/logs/%x_%j.out
 #SBATCH --error=slurm/logs/%x_%j.err
 
@@ -38,5 +38,5 @@ PYEOF
 
 TMPSCRIPT=$(mktemp --suffix=_main.py)
 sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
-python "$TMPSCRIPT"
+PYTHONPATH="$WORKDIR" python "$TMPSCRIPT"
 rm -f "$TMPSCRIPT"
diff --git a/slurm/darcy_pg.slurm b/slurm/darcy_pg.slurm
index 5897108..a9a8843 100644
--- a/slurm/darcy_pg.slurm
+++ b/slurm/darcy_pg.slurm
@@ -38,5 +38,5 @@ PYEOF
 
 TMPSCRIPT=$(mktemp --suffix=_main.py)
 sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
-python "$TMPSCRIPT"
+PYTHONPATH="$WORKDIR" python "$TMPSCRIPT"
 rm -f "$TMPSCRIPT"
diff --git a/slurm/darcy_pidm_me.slurm b/slurm/darcy_pidm_me.slurm
index b5cae64..2604015 100644
--- a/slurm/darcy_pidm_me.slurm
+++ b/slurm/darcy_pidm_me.slurm
@@ -38,5 +38,5 @@ PYEOF
 
 TMPSCRIPT=$(mktemp --suffix=_main.py)
 sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
-python "$TMPSCRIPT"
+PYTHONPATH="$WORKDIR" python "$TMPSCRIPT"
 rm -f "$TMPSCRIPT"
diff --git a/slurm/darcy_pidm_se.slurm b/slurm/darcy_pidm_se.slurm
index 59fad7d..59a2c39 100644
--- a/slurm/darcy_pidm_se.slurm
+++ b/slurm/darcy_pidm_se.slurm
@@ -38,5 +38,5 @@ PYEOF
 
 TMPSCRIPT=$(mktemp --suffix=_main.py)
 sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
-python "$TMPSCRIPT"
+PYTHONPATH="$WORKDIR" python "$TMPSCRIPT"
 rm -f "$TMPSCRIPT"
diff --git a/slurm/logs/pidm_darcy_pg_9943187.err b/slurm/logs/pidm_darcy_pg_9943187.err
new file mode 100644
index 0000000..ad069c9
--- /dev/null
+++ b/slurm/logs/pidm_darcy_pg_9943187.err
@@ -0,0 +1,4 @@
+Traceback (most recent call last):
+  File "/tmp/tmp.BRlW0cyUiR_main.py", line 6, in <module>
+    from src.data_utils import *
+ModuleNotFoundError: No module named 'src'
diff --git a/slurm/logs/pidm_darcy_pg_9943187.out b/slurm/logs/pidm_darcy_pg_9943187.out
new file mode 100644
index 0000000..829d8ea
--- /dev/null
+++ b/slurm/logs/pidm_darcy_pg_9943187.out
@@ -0,0 +1,3 @@
+CUDA available: True
+Torch CUDA: 12.1
+GPU: NVIDIA A100 80GB PCIe
diff --git a/slurm/mechanics_cocogen.slurm b/slurm/mechanics_cocogen.slurm
index cac51b5..4255b80 100644
--- a/slurm/mechanics_cocogen.slurm
+++ b/slurm/mechanics_cocogen.slurm
@@ -42,5 +42,5 @@ PYEOF
 
 TMPSCRIPT=$(mktemp --suffix=_main.py)
 sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
-python "$TMPSCRIPT"
+PYTHONPATH="$WORKDIR" python "$TMPSCRIPT"
 rm -f "$TMPSCRIPT"
diff --git a/slurm/mechanics_diffusion.slurm b/slurm/mechanics_diffusion.slurm
index 6effa0e..7b2efc9 100644
--- a/slurm/mechanics_diffusion.slurm
+++ b/slurm/mechanics_diffusion.slurm
@@ -38,5 +38,5 @@ PYEOF
 
 TMPSCRIPT=$(mktemp --suffix=_main.py)
 sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
-python "$TMPSCRIPT"
+PYTHONPATH="$WORKDIR" python "$TMPSCRIPT"
 rm -f "$TMPSCRIPT"
diff --git a/slurm/mechanics_pg.slurm b/slurm/mechanics_pg.slurm
index e1a2ef8..950023e 100644
--- a/slurm/mechanics_pg.slurm
+++ b/slurm/mechanics_pg.slurm
@@ -42,5 +42,5 @@ PYEOF
 
 TMPSCRIPT=$(mktemp --suffix=_main.py)
 sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
-python "$TMPSCRIPT"
+PYTHONPATH="$WORKDIR" python "$TMPSCRIPT"
 rm -f "$TMPSCRIPT"
diff --git a/slurm/mechanics_pidm_me.slurm b/slurm/mechanics_pidm_me.slurm
index c1a2d6f..32484c7 100644
--- a/slurm/mechanics_pidm_me.slurm
+++ b/slurm/mechanics_pidm_me.slurm
@@ -38,5 +38,5 @@ PYEOF
 
 TMPSCRIPT=$(mktemp --suffix=_main.py)
 sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
-python "$TMPSCRIPT"
+PYTHONPATH="$WORKDIR" python "$TMPSCRIPT"
 rm -f "$TMPSCRIPT"
diff --git a/slurm/mechanics_pidm_se.slurm b/slurm/mechanics_pidm_se.slurm
index 7bef3ed..f7bf382 100644
--- a/slurm/mechanics_pidm_se.slurm
+++ b/slurm/mechanics_pidm_se.slurm
@@ -38,5 +38,5 @@ PYEOF
 
 TMPSCRIPT=$(mktemp --suffix=_main.py)
 sed "s/name = 'run_1'/name = '${PIDM_RUN_NAME}'/" main.py > "$TMPSCRIPT"
-python "$TMPSCRIPT"
+PYTHONPATH="$WORKDIR" python "$TMPSCRIPT"
 rm -f "$TMPSCRIPT"
diff --git a/slurm/toy.slurm b/slurm/toy.slurm
index e4ea3ec..aecae17 100644
--- a/slurm/toy.slurm
+++ b/slurm/toy.slurm
@@ -39,5 +39,5 @@ TMPSCRIPT=$(mktemp --suffix=_main_toy.py)
 sed -e "s/'wandb_track': True/'wandb_track': False/" \
     -e "s/'name': 'run_1'/'name': 'toy_${SLURM_JOB_ID}'/" \
     main_toy.py > "$TMPSCRIPT"
-python "$TMPSCRIPT"
+PYTHONPATH="$WORKDIR" python "$TMPSCRIPT"
 rm -f "$TMPSCRIPT"

From 7bbd6989fbc00c11abbb5cc7a8a585dfd82e104d Mon Sep 17 00:00:00 2001
From: dimanaStoyanova7 <stoyanovadimana557@gmail.com>
Date: Thu, 21 May 2026 09:33:23 +0200
Subject: [PATCH 03/12] Remove unintended files

---
 .gitignore                                  |   3 +
 CLAUDE.md                                   | 110 --------------------
 slurm/logs/.gitkeep                         |   0
 slurm/logs/eval_darcy_me_9912172.err        |   4 -
 slurm/logs/eval_darcy_me_9912172.out        |   0
 slurm/logs/eval_darcy_me_9912378.err        |  28 -----
 slurm/logs/eval_darcy_me_9912378.out        |   2 -
 slurm/logs/eval_darcy_me_9912408.err        |   0
 slurm/logs/eval_darcy_me_9912408.out        |   4 -
 slurm/logs/eval_darcy_se_9912173.err        |   4 -
 slurm/logs/eval_darcy_se_9912173.out        |   0
 slurm/logs/eval_darcy_se_9912379.err        |  28 -----
 slurm/logs/eval_darcy_se_9912379.out        |   2 -
 slurm/logs/eval_darcy_se_9912409.err        |   0
 slurm/logs/eval_darcy_se_9912409.out        |   4 -
 slurm/logs/eval_topo_diff_9912175.err       |   4 -
 slurm/logs/eval_topo_diff_9912175.out       |   0
 slurm/logs/eval_topo_diff_9912381.err       |   1 -
 slurm/logs/eval_topo_diff_9912381.out       |   0
 slurm/logs/eval_topo_pidm_9912174.err       |   4 -
 slurm/logs/eval_topo_pidm_9912174.out       |   0
 slurm/logs/eval_topo_pidm_9912380.err       |   1 -
 slurm/logs/eval_topo_pidm_9912380.out       |   0
 slurm/logs/pidm_darcy_cocogen_9913377.err   |   1 -
 slurm/logs/pidm_darcy_cocogen_9913377.out   |   1 -
 slurm/logs/pidm_darcy_cocogen_9913564.err   |   1 -
 slurm/logs/pidm_darcy_cocogen_9913564.out   |   1 -
 slurm/logs/pidm_darcy_diffusion_9913375.err |   6 --
 slurm/logs/pidm_darcy_diffusion_9913375.out |   1 -
 slurm/logs/pidm_darcy_diffusion_9913543.err |   1 -
 slurm/logs/pidm_darcy_diffusion_9913543.out |   1 -
 slurm/logs/pidm_darcy_diffusion_9940441.err |  11 --
 slurm/logs/pidm_darcy_diffusion_9940441.out |   1 -
 slurm/logs/pidm_darcy_pg_9913376.err        |   6 --
 slurm/logs/pidm_darcy_pg_9913376.out        |   1 -
 slurm/logs/pidm_darcy_pg_9913544.err        |   1 -
 slurm/logs/pidm_darcy_pg_9913544.out        |   1 -
 slurm/logs/pidm_darcy_pg_9943187.err        |   4 -
 slurm/logs/pidm_darcy_pg_9943187.out        |   3 -
 slurm/logs/pidm_toy_9908779.err             |   7 --
 slurm/logs/pidm_toy_9908779.out             |   0
 slurm/logs/pidm_toy_9912059.err             |   2 -
 slurm/logs/pidm_toy_9912059.out             |   0
 slurm/logs/pidm_toy_9912070.err             |   1 -
 slurm/logs/pidm_toy_9912070.out             |   1 -
 slurm/logs/pidm_toy_9912868.err             |   1 -
 slurm/logs/pidm_toy_9912868.out             |  21 ----
 47 files changed, 3 insertions(+), 270 deletions(-)
 create mode 100644 .gitignore
 delete mode 100644 CLAUDE.md
 delete mode 100644 slurm/logs/.gitkeep
 delete mode 100644 slurm/logs/eval_darcy_me_9912172.err
 delete mode 100644 slurm/logs/eval_darcy_me_9912172.out
 delete mode 100644 slurm/logs/eval_darcy_me_9912378.err
 delete mode 100644 slurm/logs/eval_darcy_me_9912378.out
 delete mode 100644 slurm/logs/eval_darcy_me_9912408.err
 delete mode 100644 slurm/logs/eval_darcy_me_9912408.out
 delete mode 100644 slurm/logs/eval_darcy_se_9912173.err
 delete mode 100644 slurm/logs/eval_darcy_se_9912173.out
 delete mode 100644 slurm/logs/eval_darcy_se_9912379.err
 delete mode 100644 slurm/logs/eval_darcy_se_9912379.out
 delete mode 100644 slurm/logs/eval_darcy_se_9912409.err
 delete mode 100644 slurm/logs/eval_darcy_se_9912409.out
 delete mode 100644 slurm/logs/eval_topo_diff_9912175.err
 delete mode 100644 slurm/logs/eval_topo_diff_9912175.out
 delete mode 100644 slurm/logs/eval_topo_diff_9912381.err
 delete mode 100644 slurm/logs/eval_topo_diff_9912381.out
 delete mode 100644 slurm/logs/eval_topo_pidm_9912174.err
 delete mode 100644 slurm/logs/eval_topo_pidm_9912174.out
 delete mode 100644 slurm/logs/eval_topo_pidm_9912380.err
 delete mode 100644 slurm/logs/eval_topo_pidm_9912380.out
 delete mode 100644 slurm/logs/pidm_darcy_cocogen_9913377.err
 delete mode 100644 slurm/logs/pidm_darcy_cocogen_9913377.out
 delete mode 100644 slurm/logs/pidm_darcy_cocogen_9913564.err
 delete mode 100644 slurm/logs/pidm_darcy_cocogen_9913564.out
 delete mode 100644 slurm/logs/pidm_darcy_diffusion_9913375.err
 delete mode 100644 slurm/logs/pidm_darcy_diffusion_9913375.out
 delete mode 100644 slurm/logs/pidm_darcy_diffusion_9913543.err
 delete mode 100644 slurm/logs/pidm_darcy_diffusion_9913543.out
 delete mode 100644 slurm/logs/pidm_darcy_diffusion_9940441.err
 delete mode 100644 slurm/logs/pidm_darcy_diffusion_9940441.out
 delete mode 100644 slurm/logs/pidm_darcy_pg_9913376.err
 delete mode 100644 slurm/logs/pidm_darcy_pg_9913376.out
 delete mode 100644 slurm/logs/pidm_darcy_pg_9913544.err
 delete mode 100644 slurm/logs/pidm_darcy_pg_9913544.out
 delete mode 100644 slurm/logs/pidm_darcy_pg_9943187.err
 delete mode 100644 slurm/logs/pidm_darcy_pg_9943187.out
 delete mode 100644 slurm/logs/pidm_toy_9908779.err
 delete mode 100644 slurm/logs/pidm_toy_9908779.out
 delete mode 100644 slurm/logs/pidm_toy_9912059.err
 delete mode 100644 slurm/logs/pidm_toy_9912059.out
 delete mode 100644 slurm/logs/pidm_toy_9912070.err
 delete mode 100644 slurm/logs/pidm_toy_9912070.out
 delete mode 100644 slurm/logs/pidm_toy_9912868.err
 delete mode 100644 slurm/logs/pidm_toy_9912868.out

diff --git a/.gitignore b/.gitignore
new file mode 100644
index 0000000..a19bd14
--- /dev/null
+++ b/.gitignore
@@ -0,0 +1,3 @@
+slurm/logs/
+*.err
+CLAUDE.md
\ No newline at end of file
diff --git a/CLAUDE.md b/CLAUDE.md
deleted file mode 100644
index d7d6476..0000000
--- a/CLAUDE.md
+++ /dev/null
@@ -1,110 +0,0 @@
-# PIDM Reproduction Project — Claude Context
-
-## What this project is
-Reproduction of "Physics-Informed Diffusion Models" (Bastek et al., ICLR 2025).
-We are reproducing the Darcy flow and topology optimization experiments from Section 4,
-running hyperparameter sweeps, and writing a blog post about our findings.
-
-Paper: https://arxiv.org/abs/2403.14404
-Repo: https://github.com/jhbastek/PhysicsInformedDiffusionModels
-
-## Who is working on this
-- Person 1 (dstoyanova): week 4 setup, Darcy flow reproduction, blog assembly
-- Person 2: topology optimization reproduction + ablation study
-- Person 3: hyperparameter sweep on Darcy flow
-
-## Cluster: DelftBlue (TU Delft HPC)
-- Login: `ssh dstoyanova@login.delftblue.tudelft.nl`
-- Home dir: `/home/dstoyanova/` — limited quota, do NOT store data or checkpoints here
-- Scratch dir: `/scratch/dstoyanova/` — use this for all data, checkpoints, outputs
-- Scheduler: SLURM
-- GPU partitions available:
-  - `gpu` — NVIDIA Tesla V100S, 32GB VRAM (phase 1)
-  - `gpu-a100` — NVIDIA A100, 80GB VRAM (phase 2)
-  - `gpu-a100-small` — A100 partitioned into 10GB instances (not suitable for us)
-- Use `gpu` or `gpu-a100` partition for all training jobs
-- Must be on TU Delft network or EduVPN to SSH in
-
-## Repo structure
-```
-PhysicsInformedDiffusionModels/
-├── main.py          # main training script for Darcy + topology opt.
-├── main_toy.py      # toy problem (unit circle), ~12 min, use as sanity check
-├── sample.py        # inference/evaluation script
-├── model.yaml       # config file — change this to switch between model variants
-├── src/             # model architecture and utilities
-├── data/            # place downloaded data here (darcy/ and mechanics/)
-└── trained_models/  # place downloaded pretrained models here
-```
-
-Data must be downloaded from ETHZ Research Collection:
-https://doi.org/10.3929/ethz-b-000674074
-Place unzipped contents under `/scratch/dstoyanova/PhysicsInformedDiffusionModels/`
-
-## Conda environment
-Environment name: `pidm`
-Python: 3.11
-Key packages: pytorch>=2.0.1, findiff, solidspy, pandas, einops, einops-exts,
-              rotary_embedding_torch, torchvision, opencv, tqdm, matplotlib,
-              imageio, wandb (optional)
-
-To activate: `conda activate pidm`
-Installed at: `/home/dstoyanova/miniconda3/envs/pidm`
-
-## The 5 model variants and their yaml configs
-
-All variants use the same main.py — only model.yaml changes.
-
-| Variant       | c_residual | x0_estimation | residual_grad_guidance | M_correction | N_correction |
-|---------------|------------|---------------|------------------------|--------------|--------------|
-| Diffusion     | 0          | mean          | False                  | 0            | 0            |
-| PG-Diffusion  | 0          | mean          | True                   | 0            | 0            |
-| CoCoGen       | 0          | mean          | False                  | 25           | 50           |
-| PIDM-ME       | 0.001      | mean          | False                  | 0            | 0            |
-| PIDM-SE       | 0.00001    | sample        | False                  | 0            | 0            |
-
-Fixed for all variants:
-- c_data: 1
-- c_ineq: 0
-- lambda_opt: 0
-- diff_steps: 100
-- fd_acc: 2
-- gov_eqs: darcy (for Darcy); mechanics (for topology opt.)
-
-Separate yaml files are stored as:
-`configs/darcy_diffusion.yaml`
-`configs/darcy_pg.yaml`
-`configs/darcy_cocogen.yaml`
-`configs/darcy_pidm_me.yaml`
-`configs/darcy_pidm_se.yaml`
-(and equivalent mechanics_ variants for topology opt.)
-
-## SLURM job scripts
-Stored in `slurm/`
-- `toy.slurm` — sanity check, ~12 min, 1 GPU
-- `darcy_<variant>.slurm` — Darcy flow training, ~13-22h, 1 GPU
-- `mechanics_<variant>.slurm` — topology opt. training, ~48-54h, 1 GPU
-
-All jobs request 1 GPU, 1 node, appropriate wall time.
-Submit with: `sbatch slurm/<script>.slurm`
-Check status: `squeue -u dstoyanova`
-Cancel job: `scancel <jobid>`
-
-## Week 4 order of operations
-1. SSH into DelftBlue
-2. Clone repo into /scratch/dstoyanova/
-3. Download and place data into /scratch/dstoyanova/PhysicsInformedDiffusionModels/
-4. Install miniconda and create pidm environment
-5. Run toy sanity check (main_toy.py via SLURM)
-6. If toy passes: prepare all yaml configs and submit all Darcy + topology jobs
-
-## Key paper results to reproduce
-- Fig. 2: residual error + test data loss curves over training for all 5 Darcy variants
-- Fig. 3: generated permeability/pressure fields + residual maps
-- Table 1: RMAE, MDN % CE, % VFE for topology opt. (in- and out-of-distribution)
-
-## Notes
-- Scratch storage is purged periodically — copy important checkpoints elsewhere
-- Topology opt. training takes ~48-54h — submit early, set wall time to 60h to be safe
-- CoCoGen required careful epsilon tuning in the paper — see Appendix A.6.2
-- The repo uses wandb for logging (optional) — set to disabled if no account
diff --git a/slurm/logs/.gitkeep b/slurm/logs/.gitkeep
deleted file mode 100644
index e69de29..0000000
diff --git a/slurm/logs/eval_darcy_me_9912172.err b/slurm/logs/eval_darcy_me_9912172.err
deleted file mode 100644
index 52e8d60..0000000
--- a/slurm/logs/eval_darcy_me_9912172.err
+++ /dev/null
@@ -1,4 +0,0 @@
-Traceback (most recent call last):
-  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/sample_eval.py", line 10, in <module>
-    import argparse, os, yaml, time
-ModuleNotFoundError: No module named 'yaml'
diff --git a/slurm/logs/eval_darcy_me_9912172.out b/slurm/logs/eval_darcy_me_9912172.out
deleted file mode 100644
index e69de29..0000000
diff --git a/slurm/logs/eval_darcy_me_9912378.err b/slurm/logs/eval_darcy_me_9912378.err
deleted file mode 100644
index 5576a00..0000000
--- a/slurm/logs/eval_darcy_me_9912378.err
+++ /dev/null
@@ -1,28 +0,0 @@
-Traceback (most recent call last):
-  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/sample_eval.py", line 117, in <module>
-    residuals = ResidualsDarcy(model=model, fd_acc=fd_acc, pixels_per_dim=pixels_per_dim,
-                ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/src/residuals_darcy.py", line 35, in __init__
-    self.grads = GradientsHelper(d0=d0, d1=d1, fd_acc = fd_acc, periodic=self.periodic, device=device)
-                 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/src/grad_utils.py", line 184, in __init__
-    self.stencil_gradients = StencilGradients(d0=d0, d1=d1, fd_acc = fd_acc, periodic=periodic, device = device)
-                             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/src/grad_utils.py", line 156, in __init__
-    self.d_d1 = StencilGradientComputation(FinDiff(1, d1, 1, acc=fd_acc).stencil((99,99)).data, periodic, device)
-                                           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/compatible.py", line 106, in FinDiff
-    return diff_from_tuple(args)
-           ^^^^^^^^^^^^^^^^^^^^^
-  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/compatible.py", line 92, in diff_from_tuple
-    return Diff(axis, h, **kwargs) ** order
-           ^^^^^^^^^^^^^^^^^^^^^^^
-  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/interface.py", line 62, in __init__
-    grid_axis = make_axis(axis, grid, periodic)
-                ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/grids.py", line 82, in make_axis
-    return EquidistantAxis(dim, spacing=config_or_axis, periodic=periodic)
-           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/grids.py", line 22, in __init__
-    raise ValueError("Spacing must be > 0.")
-ValueError: Spacing must be > 0.
diff --git a/slurm/logs/eval_darcy_me_9912378.out b/slurm/logs/eval_darcy_me_9912378.out
deleted file mode 100644
index 6ea6c31..0000000
--- a/slurm/logs/eval_darcy_me_9912378.out
+++ /dev/null
@@ -1,2 +0,0 @@
-
-Checkpoint loaded from trained_models/darcy/PIDM-ME/model/checkpoint_300000.pt
diff --git a/slurm/logs/eval_darcy_me_9912408.err b/slurm/logs/eval_darcy_me_9912408.err
deleted file mode 100644
index e69de29..0000000
diff --git a/slurm/logs/eval_darcy_me_9912408.out b/slurm/logs/eval_darcy_me_9912408.out
deleted file mode 100644
index 009a6f4..0000000
--- a/slurm/logs/eval_darcy_me_9912408.out
+++ /dev/null
@@ -1,4 +0,0 @@
-
-Checkpoint loaded from trained_models/darcy/PIDM-ME/model/checkpoint_300000.pt
-Number of trainable parameters: 10386482
-Evaluation for model PIDM-ME done (time: 00:00:00).
diff --git a/slurm/logs/eval_darcy_se_9912173.err b/slurm/logs/eval_darcy_se_9912173.err
deleted file mode 100644
index 52e8d60..0000000
--- a/slurm/logs/eval_darcy_se_9912173.err
+++ /dev/null
@@ -1,4 +0,0 @@
-Traceback (most recent call last):
-  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/sample_eval.py", line 10, in <module>
-    import argparse, os, yaml, time
-ModuleNotFoundError: No module named 'yaml'
diff --git a/slurm/logs/eval_darcy_se_9912173.out b/slurm/logs/eval_darcy_se_9912173.out
deleted file mode 100644
index e69de29..0000000
diff --git a/slurm/logs/eval_darcy_se_9912379.err b/slurm/logs/eval_darcy_se_9912379.err
deleted file mode 100644
index 5576a00..0000000
--- a/slurm/logs/eval_darcy_se_9912379.err
+++ /dev/null
@@ -1,28 +0,0 @@
-Traceback (most recent call last):
-  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/sample_eval.py", line 117, in <module>
-    residuals = ResidualsDarcy(model=model, fd_acc=fd_acc, pixels_per_dim=pixels_per_dim,
-                ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/src/residuals_darcy.py", line 35, in __init__
-    self.grads = GradientsHelper(d0=d0, d1=d1, fd_acc = fd_acc, periodic=self.periodic, device=device)
-                 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/src/grad_utils.py", line 184, in __init__
-    self.stencil_gradients = StencilGradients(d0=d0, d1=d1, fd_acc = fd_acc, periodic=periodic, device = device)
-                             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/src/grad_utils.py", line 156, in __init__
-    self.d_d1 = StencilGradientComputation(FinDiff(1, d1, 1, acc=fd_acc).stencil((99,99)).data, periodic, device)
-                                           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/compatible.py", line 106, in FinDiff
-    return diff_from_tuple(args)
-           ^^^^^^^^^^^^^^^^^^^^^
-  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/compatible.py", line 92, in diff_from_tuple
-    return Diff(axis, h, **kwargs) ** order
-           ^^^^^^^^^^^^^^^^^^^^^^^
-  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/interface.py", line 62, in __init__
-    grid_axis = make_axis(axis, grid, periodic)
-                ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/grids.py", line 82, in make_axis
-    return EquidistantAxis(dim, spacing=config_or_axis, periodic=periodic)
-           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/findiff/grids.py", line 22, in __init__
-    raise ValueError("Spacing must be > 0.")
-ValueError: Spacing must be > 0.
diff --git a/slurm/logs/eval_darcy_se_9912379.out b/slurm/logs/eval_darcy_se_9912379.out
deleted file mode 100644
index 4bd460c..0000000
--- a/slurm/logs/eval_darcy_se_9912379.out
+++ /dev/null
@@ -1,2 +0,0 @@
-
-Checkpoint loaded from trained_models/darcy/PIDM-SE/model/checkpoint_300000.pt
diff --git a/slurm/logs/eval_darcy_se_9912409.err b/slurm/logs/eval_darcy_se_9912409.err
deleted file mode 100644
index e69de29..0000000
diff --git a/slurm/logs/eval_darcy_se_9912409.out b/slurm/logs/eval_darcy_se_9912409.out
deleted file mode 100644
index dbb2d1c..0000000
--- a/slurm/logs/eval_darcy_se_9912409.out
+++ /dev/null
@@ -1,4 +0,0 @@
-
-Checkpoint loaded from trained_models/darcy/PIDM-SE/model/checkpoint_300000.pt
-Number of trainable parameters: 10386482
-Evaluation for model PIDM-SE done (time: 00:00:00).
diff --git a/slurm/logs/eval_topo_diff_9912175.err b/slurm/logs/eval_topo_diff_9912175.err
deleted file mode 100644
index 52e8d60..0000000
--- a/slurm/logs/eval_topo_diff_9912175.err
+++ /dev/null
@@ -1,4 +0,0 @@
-Traceback (most recent call last):
-  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/sample_eval.py", line 10, in <module>
-    import argparse, os, yaml, time
-ModuleNotFoundError: No module named 'yaml'
diff --git a/slurm/logs/eval_topo_diff_9912175.out b/slurm/logs/eval_topo_diff_9912175.out
deleted file mode 100644
index e69de29..0000000
diff --git a/slurm/logs/eval_topo_diff_9912381.err b/slurm/logs/eval_topo_diff_9912381.err
deleted file mode 100644
index c58f042..0000000
--- a/slurm/logs/eval_topo_diff_9912381.err
+++ /dev/null
@@ -1 +0,0 @@
-slurmstepd: error: *** JOB 9912381 ON gpu015 CANCELLED AT 2026-05-14T14:00:47 DUE TO TIME LIMIT ***
diff --git a/slurm/logs/eval_topo_diff_9912381.out b/slurm/logs/eval_topo_diff_9912381.out
deleted file mode 100644
index e69de29..0000000
diff --git a/slurm/logs/eval_topo_pidm_9912174.err b/slurm/logs/eval_topo_pidm_9912174.err
deleted file mode 100644
index 52e8d60..0000000
--- a/slurm/logs/eval_topo_pidm_9912174.err
+++ /dev/null
@@ -1,4 +0,0 @@
-Traceback (most recent call last):
-  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/sample_eval.py", line 10, in <module>
-    import argparse, os, yaml, time
-ModuleNotFoundError: No module named 'yaml'
diff --git a/slurm/logs/eval_topo_pidm_9912174.out b/slurm/logs/eval_topo_pidm_9912174.out
deleted file mode 100644
index e69de29..0000000
diff --git a/slurm/logs/eval_topo_pidm_9912380.err b/slurm/logs/eval_topo_pidm_9912380.err
deleted file mode 100644
index db74d50..0000000
--- a/slurm/logs/eval_topo_pidm_9912380.err
+++ /dev/null
@@ -1 +0,0 @@
-slurmstepd: error: *** JOB 9912380 ON gpu015 CANCELLED AT 2026-05-14T14:00:47 DUE TO TIME LIMIT ***
diff --git a/slurm/logs/eval_topo_pidm_9912380.out b/slurm/logs/eval_topo_pidm_9912380.out
deleted file mode 100644
index e69de29..0000000
diff --git a/slurm/logs/pidm_darcy_cocogen_9913377.err b/slurm/logs/pidm_darcy_cocogen_9913377.err
deleted file mode 100644
index 6eab51f..0000000
--- a/slurm/logs/pidm_darcy_cocogen_9913377.err
+++ /dev/null
@@ -1 +0,0 @@
-  0%|          | 0/300001 [00:00<?, ?it/s]training loss: 2.933e+00:   0%|          | 0/300001 [00:33<?, ?it/s]slurmstepd: error: *** JOB 9913377 ON gpu018 CANCELLED AT 2026-05-14T16:02:53 ***
diff --git a/slurm/logs/pidm_darcy_cocogen_9913377.out b/slurm/logs/pidm_darcy_cocogen_9913377.out
deleted file mode 100644
index 4b80c77..0000000
--- a/slurm/logs/pidm_darcy_cocogen_9913377.out
+++ /dev/null
@@ -1 +0,0 @@
-Number of trainable parameters: 10386482
diff --git a/slurm/logs/pidm_darcy_cocogen_9913564.err b/slurm/logs/pidm_darcy_cocogen_9913564.err
deleted file mode 100644
index d349b27..0000000
--- a/slurm/logs/pidm_darcy_cocogen_9913564.err
+++ /dev/null
@@ -1 +0,0 @@
-  0%|          | 0/300001 [00:00<?, ?it/s]training loss: 3.250e+00:   0%|          | 0/300001 [00:34<?, ?it/s]training loss: 3.250e+00:   0%|          | 1/300001 [23:32<117690:41:59, 1412.29s/it]training loss: 3.250e+00:   0%|          | 2/300001 [24:05<50077:18:36, 600.93s/it]  training loss: 3.250e+00:   0%|          | 3/300001 [24:38<28472:50:32, 341.68s/it]training loss: 3.250e+00:   0%|          | 4/300001 [25:10<18298:31:57, 219.58s/it]training loss: 3.250e+00:   0%|          | 5/300001 [25:42<12664:14:35, 151.97s/it]training loss: 3.250e+00:   0%|          | 6/300001 [26:14<9250:45:17, 111.01s/it] training loss: 3.250e+00:   0%|          | 7/300001 [26:46<7088:44:09, 85.07s/it] training loss: 3.250e+00:   0%|          | 8/300001 [27:17<5658:48:40, 67.91s/it]training loss: 3.250e+00:   0%|          | 9/300001 [27:48<4711:18:40, 56.54s/it]training loss: 3.250e+00:   0%|          | 10/300001 [28:22<4119:42:03, 49.44s/it]training loss: 3.250e+00:   0%|          | 11/300001 [28:55<3717:24:35, 44.61s/it]training loss: 3.250e+00:   0%|          | 12/300001 [29:27<3390:29:17, 40.69s/it]training loss: 3.250e+00:   0%|          | 13/300001 [30:00<3191:32:30, 38.30s/it]training loss: 3.250e+00:   0%|          | 14/300001 [30:31<3015:03:21, 36.18s/it]training loss: 3.250e+00:   0%|          | 15/300001 [31:05<2954:55:46, 35.46s/it]training loss: 3.250e+00:   0%|          | 16/300001 [31:37<2860:28:02, 34.33s/it]training loss: 3.250e+00:   0%|          | 17/300001 [32:09<2813:01:42, 33.76s/it]training loss: 3.250e+00:   0%|          | 18/300001 [32:42<2776:42:30, 33.32s/it]training loss: 3.250e+00:   0%|          | 19/300001 [33:14<2758:28:52, 33.10s/it]training loss: 3.250e+00:   0%|          | 20/300001 [33:47<2753:39:39, 33.05s/it]training loss: 2.818e-01:   0%|          | 20/300001 [34:20<2753:39:39, 33.05s/it]training loss: 2.818e-01:   0%|          | 21/300001 [34:20<2752:21:59, 33.03s/it]training loss: 2.818e-01:   0%|          | 22/300001 [34:53<2754:35:21, 33.06s/it]training loss: 2.818e-01:   0%|          | 23/300001 [35:26<2743:41:18, 32.93s/it]training loss: 2.818e-01:   0%|          | 24/300001 [35:57<2708:54:53, 32.51s/it]training loss: 2.818e-01:   0%|          | 25/300001 [36:30<2705:39:08, 32.47s/it]training loss: 2.818e-01:   0%|          | 26/300001 [37:02<2702:35:37, 32.43s/it]training loss: 2.818e-01:   0%|          | 27/300001 [37:34<2686:45:46, 32.24s/it]training loss: 2.818e-01:   0%|          | 28/300001 [38:06<2688:48:28, 32.27s/it]training loss: 2.818e-01:   0%|          | 29/300001 [38:39<2710:54:52, 32.53s/it]training loss: 2.818e-01:   0%|          | 30/300001 [39:11<2688:45:26, 32.27s/it]training loss: 2.818e-01:   0%|          | 31/300001 [39:44<2697:34:58, 32.37s/it]training loss: 2.818e-01:   0%|          | 32/300001 [40:16<2699:51:09, 32.40s/it]training loss: 2.818e-01:   0%|          | 33/300001 [40:48<2676:24:31, 32.12s/it]training loss: 2.818e-01:   0%|          | 34/300001 [41:20<2683:13:07, 32.20s/it]training loss: 2.818e-01:   0%|          | 35/300001 [41:53<2699:06:29, 32.39s/it]training loss: 2.818e-01:   0%|          | 36/300001 [42:25<2706:37:31, 32.48s/it]training loss: 2.818e-01:   0%|          | 37/300001 [42:58<2706:31:02, 32.48s/it]training loss: 2.818e-01:   0%|          | 38/300001 [43:30<2697:47:04, 32.38s/it]training loss: 2.818e-01:   0%|          | 39/300001 [44:01<2662:21:29, 31.95s/it]training loss: 2.818e-01:   0%|          | 40/300001 [44:33<2673:56:42, 32.09s/it]training loss: 6.856e-02:   0%|          | 40/300001 [45:06<2673:56:42, 32.09s/it]training loss: 6.856e-02:   0%|          | 41/300001 [45:06<2686:55:43, 32.25s/it]training loss: 6.856e-02:   0%|          | 42/300001 [45:38<2688:55:36, 32.27s/it]training loss: 6.856e-02:   0%|          | 43/300001 [46:11<2695:51:24, 32.35s/it]training loss: 6.856e-02:   0%|          | 44/300001 [46:44<2702:00:42, 32.43s/it]training loss: 6.856e-02:   0%|          | 45/300001 [47:16<2701:56:04, 32.43s/it]training loss: 6.856e-02:   0%|          | 46/300001 [47:48<2687:22:11, 32.25s/it]training loss: 6.856e-02:   0%|          | 47/300001 [48:20<2690:20:44, 32.29s/it]training loss: 6.856e-02:   0%|          | 48/300001 [48:52<2682:41:31, 32.20s/it]training loss: 6.856e-02:   0%|          | 49/300001 [49:25<2702:51:43, 32.44s/it]training loss: 6.856e-02:   0%|          | 50/300001 [49:58<2712:08:46, 32.55s/it]training loss: 6.856e-02:   0%|          | 51/300001 [50:30<2694:41:03, 32.34s/it]training loss: 6.856e-02:   0%|          | 52/300001 [51:02<2693:50:31, 32.33s/it]training loss: 6.856e-02:   0%|          | 53/300001 [51:34<2693:35:08, 32.33s/it]training loss: 6.856e-02:   0%|          | 54/300001 [52:07<2698:16:16, 32.38s/it]training loss: 6.856e-02:   0%|          | 55/300001 [52:39<2692:26:54, 32.32s/it]training loss: 6.856e-02:   0%|          | 56/300001 [53:12<2698:29:22, 32.39s/it]training loss: 6.856e-02:   0%|          | 57/300001 [53:43<2681:43:33, 32.19s/it]training loss: 6.856e-02:   0%|          | 58/300001 [54:17<2710:56:02, 32.54s/it]training loss: 6.856e-02:   0%|          | 59/300001 [54:50<2731:33:40, 32.79s/it]training loss: 6.856e-02:   0%|          | 60/300001 [55:23<2736:13:45, 32.84s/it]training loss: 4.237e-02:   0%|          | 60/300001 [55:54<2736:13:45, 32.84s/it]training loss: 4.237e-02:   0%|          | 61/300001 [55:54<2680:45:31, 32.18s/it]training loss: 4.237e-02:   0%|          | 62/300001 [56:26<2686:03:57, 32.24s/it]training loss: 4.237e-02:   0%|          | 63/300001 [56:59<2699:49:53, 32.40s/it]training loss: 4.237e-02:   0%|          | 64/300001 [57:31<2701:52:38, 32.43s/it]training loss: 4.237e-02:   0%|          | 65/300001 [58:04<2700:20:57, 32.41s/it]training loss: 4.237e-02:   0%|          | 66/300001 [58:35<2683:21:44, 32.21s/it]training loss: 4.237e-02:   0%|          | 67/300001 [59:10<2733:32:02, 32.81s/it]training loss: 4.237e-02:   0%|          | 68/300001 [59:41<2687:57:39, 32.26s/it]training loss: 4.237e-02:   0%|          | 69/300001 [1:00:13<2684:04:10, 32.22s/it]training loss: 4.237e-02:   0%|          | 70/300001 [1:00:45<2689:18:53, 32.28s/it]training loss: 4.237e-02:   0%|          | 71/300001 [1:01:18<2695:47:13, 32.36s/it]training loss: 4.237e-02:   0%|          | 72/300001 [1:01:50<2702:24:47, 32.44s/it]training loss: 4.237e-02:   0%|          | 73/300001 [1:02:23<2701:17:54, 32.42s/it]training loss: 4.237e-02:   0%|          | 74/300001 [1:02:54<2683:33:00, 32.21s/it]training loss: 4.237e-02:   0%|          | 75/300001 [1:03:25<2645:55:33, 31.76s/it]training loss: 4.237e-02:   0%|          | 76/300001 [1:03:58<2670:06:14, 32.05s/it]training loss: 4.237e-02:   0%|          | 77/300001 [1:04:31<2684:29:17, 32.22s/it]training loss: 4.237e-02:   0%|          | 78/300001 [1:05:03<2681:43:21, 32.19s/it]training loss: 4.237e-02:   0%|          | 79/300001 [1:05:36<2702:39:21, 32.44s/it]training loss: 4.237e-02:   0%|          | 80/300001 [1:06:08<2693:59:52, 32.34s/it]training loss: 3.210e-02:   0%|          | 80/300001 [1:06:41<2693:59:52, 32.34s/it]training loss: 3.210e-02:   0%|          | 81/300001 [1:06:41<2714:34:05, 32.58s/it]training loss: 3.210e-02:   0%|          | 82/300001 [1:07:13<2693:02:45, 32.33s/it]training loss: 3.210e-02:   0%|          | 83/300001 [1:07:45<2694:23:47, 32.34s/it]training loss: 3.210e-02:   0%|          | 84/300001 [1:08:18<2712:27:46, 32.56s/it]training loss: 3.210e-02:   0%|          | 85/300001 [1:08:50<2687:41:39, 32.26s/it]training loss: 3.210e-02:   0%|          | 86/300001 [1:09:21<2671:55:54, 32.07s/it]training loss: 3.210e-02:   0%|          | 87/300001 [1:09:54<2686:57:19, 32.25s/it]training loss: 3.210e-02:   0%|          | 88/300001 [1:10:27<2705:11:54, 32.47s/it]training loss: 3.210e-02:   0%|          | 89/300001 [1:11:00<2713:01:00, 32.57s/it]training loss: 3.210e-02:   0%|          | 90/300001 [1:11:32<2709:24:40, 32.52s/it]training loss: 3.210e-02:   0%|          | 91/300001 [1:12:06<2731:01:40, 32.78s/it]training loss: 3.210e-02:   0%|          | 92/300001 [1:12:37<2693:47:53, 32.34s/it]training loss: 3.210e-02:   0%|          | 93/300001 [1:13:08<2675:05:24, 32.11s/it]training loss: 3.210e-02:   0%|          | 94/300001 [1:13:41<2689:12:21, 32.28s/it]training loss: 3.210e-02:   0%|          | 95/300001 [1:14:14<2704:35:36, 32.47s/it]training loss: 3.210e-02:   0%|          | 96/300001 [1:14:46<2698:22:24, 32.39s/it]training loss: 3.210e-02:   0%|          | 97/300001 [1:15:19<2713:41:48, 32.57s/it]training loss: 3.210e-02:   0%|          | 98/300001 [1:15:51<2701:39:47, 32.43s/it]training loss: 3.210e-02:   0%|          | 99/300001 [1:16:24<2703:54:03, 32.46s/it]training loss: 3.210e-02:   0%|          | 100/300001 [1:16:56<2688:59:45, 32.28s/it]training loss: 2.823e-02:   0%|          | 100/300001 [1:17:28<2688:59:45, 32.28s/it]training loss: 2.823e-02:   0%|          | 101/300001 [1:17:28<2701:55:08, 32.43s/it]training loss: 2.823e-02:   0%|          | 102/300001 [1:18:01<2699:27:58, 32.40s/it]training loss: 2.823e-02:   0%|          | 103/300001 [1:18:33<2699:34:42, 32.41s/it]training loss: 2.823e-02:   0%|          | 104/300001 [1:19:05<2690:19:31, 32.29s/it]training loss: 2.823e-02:   0%|          | 105/300001 [1:19:38<2695:56:45, 32.36s/it]training loss: 2.823e-02:   0%|          | 106/300001 [1:20:11<2726:22:59, 32.73s/it]training loss: 2.823e-02:   0%|          | 107/300001 [1:20:43<2700:19:00, 32.42s/it]training loss: 2.823e-02:   0%|          | 108/300001 [1:21:15<2698:43:02, 32.40s/it]training loss: 2.823e-02:   0%|          | 109/300001 [1:21:48<2696:41:06, 32.37s/it]training loss: 2.823e-02:   0%|          | 110/300001 [1:22:20<2704:44:18, 32.47s/it]training loss: 2.823e-02:   0%|          | 111/300001 [1:22:53<2701:04:45, 32.42s/it]training loss: 2.823e-02:   0%|          | 112/300001 [1:23:25<2708:32:20, 32.51s/it]training loss: 2.823e-02:   0%|          | 113/300001 [1:23:58<2698:08:11, 32.39s/it]training loss: 2.823e-02:   0%|          | 114/300001 [1:24:29<2682:10:12, 32.20s/it]training loss: 2.823e-02:   0%|          | 115/300001 [1:25:01<2681:17:26, 32.19s/it]training loss: 2.823e-02:   0%|          | 116/300001 [1:25:34<2696:29:15, 32.37s/it]training loss: 2.823e-02:   0%|          | 117/300001 [1:26:06<2673:27:08, 32.09s/it]training loss: 2.823e-02:   0%|          | 118/300001 [1:26:39<2697:54:42, 32.39s/it]training loss: 2.823e-02:   0%|          | 119/300001 [1:27:11<2701:51:10, 32.43s/it]training loss: 2.823e-02:   0%|          | 120/300001 [1:27:42<2665:26:13, 32.00s/it]training loss: 2.844e-02:   0%|          | 120/300001 [1:28:14<2665:26:13, 32.00s/it]training loss: 2.844e-02:   0%|          | 121/300001 [1:28:14<2664:00:58, 31.98s/it]training loss: 2.844e-02:   0%|          | 122/300001 [1:28:46<2664:36:05, 31.99s/it]training loss: 2.844e-02:   0%|          | 123/300001 [1:29:17<2631:11:49, 31.59s/it]training loss: 2.844e-02:   0%|          | 124/300001 [1:29:50<2680:52:13, 32.18s/it]training loss: 2.844e-02:   0%|          | 125/300001 [1:30:24<2708:09:05, 32.51s/it]training loss: 2.844e-02:   0%|          | 126/300001 [1:30:56<2689:42:56, 32.29s/it]training loss: 2.844e-02:   0%|          | 127/300001 [1:31:28<2692:03:06, 32.32s/it]training loss: 2.844e-02:   0%|          | 128/300001 [1:32:00<2685:58:40, 32.25s/it]training loss: 2.844e-02:   0%|          | 129/300001 [1:32:34<2730:02:08, 32.77s/it]training loss: 2.844e-02:   0%|          | 130/300001 [1:33:06<2705:23:34, 32.48s/it]training loss: 2.844e-02:   0%|          | 131/300001 [1:33:38<2691:49:12, 32.32s/it]training loss: 2.844e-02:   0%|          | 132/300001 [1:34:11<2713:27:40, 32.58s/it]training loss: 2.844e-02:   0%|          | 133/300001 [1:34:43<2700:42:47, 32.42s/it]training loss: 2.844e-02:   0%|          | 134/300001 [1:35:15<2688:47:52, 32.28s/it]training loss: 2.844e-02:   0%|          | 135/300001 [1:35:47<2680:11:00, 32.18s/it]training loss: 2.844e-02:   0%|          | 136/300001 [1:36:19<2684:51:53, 32.23s/it]training loss: 2.844e-02:   0%|          | 137/300001 [1:36:53<2721:30:09, 32.67s/it]training loss: 2.844e-02:   0%|          | 138/300001 [1:37:24<2676:09:08, 32.13s/it]training loss: 2.844e-02:   0%|          | 139/300001 [1:37:56<2675:53:50, 32.13s/it]training loss: 2.844e-02:   0%|          | 140/300001 [1:38:29<2693:07:20, 32.33s/it]training loss: 2.464e-02:   0%|          | 140/300001 [1:39:01<2693:07:20, 32.33s/it]training loss: 2.464e-02:   0%|          | 141/300001 [1:39:01<2683:19:07, 32.21s/it]training loss: 2.464e-02:   0%|          | 142/300001 [1:39:32<2650:01:43, 31.82s/it]training loss: 2.464e-02:   0%|          | 143/300001 [1:40:04<2671:48:43, 32.08s/it]training loss: 2.464e-02:   0%|          | 144/300001 [1:40:37<2684:41:19, 32.23s/it]training loss: 2.464e-02:   0%|          | 145/300001 [1:41:09<2688:32:32, 32.28s/it]training loss: 2.464e-02:   0%|          | 146/300001 [1:41:42<2693:14:14, 32.33s/it]training loss: 2.464e-02:   0%|          | 147/300001 [1:42:13<2660:44:41, 31.94s/it]training loss: 2.464e-02:   0%|          | 148/300001 [1:42:46<2689:11:26, 32.29s/it]training loss: 2.464e-02:   0%|          | 149/300001 [1:43:19<2719:12:17, 32.65s/it]training loss: 2.464e-02:   0%|          | 150/300001 [1:43:52<2721:09:35, 32.67s/it]training loss: 2.464e-02:   0%|          | 151/300001 [1:44:25<2723:35:16, 32.70s/it]training loss: 2.464e-02:   0%|          | 152/300001 [1:44:58<2731:12:24, 32.79s/it]training loss: 2.464e-02:   0%|          | 153/300001 [1:45:31<2738:44:24, 32.88s/it]training loss: 2.464e-02:   0%|          | 154/300001 [1:46:04<2743:50:54, 32.94s/it]training loss: 2.464e-02:   0%|          | 155/300001 [1:46:36<2714:26:45, 32.59s/it]training loss: 2.464e-02:   0%|          | 156/300001 [1:47:08<2707:47:54, 32.51s/it]training loss: 2.464e-02:   0%|          | 157/300001 [1:47:31<2466:17:32, 29.61s/it]training loss: 2.464e-02:   0%|          | 158/300001 [1:48:04<2552:10:49, 30.64s/it]training loss: 2.464e-02:   0%|          | 159/300001 [1:48:36<2590:30:26, 31.10s/it]training loss: 2.464e-02:   0%|          | 160/300001 [1:49:08<2612:51:59, 31.37s/it]training loss: 1.694e-02:   0%|          | 160/300001 [1:49:41<2612:51:59, 31.37s/it]training loss: 1.694e-02:   0%|          | 161/300001 [1:49:41<2653:23:02, 31.86s/it]training loss: 1.694e-02:   0%|          | 162/300001 [1:50:13<2653:44:20, 31.86s/it]training loss: 1.694e-02:   0%|          | 163/300001 [1:50:46<2694:47:28, 32.35s/it]training loss: 1.694e-02:   0%|          | 164/300001 [1:51:18<2680:28:05, 32.18s/it]training loss: 1.694e-02:   0%|          | 165/300001 [1:51:51<2686:20:12, 32.25s/it]training loss: 1.694e-02:   0%|          | 166/300001 [1:52:24<2703:46:56, 32.46s/it]training loss: 1.694e-02:   0%|          | 167/300001 [1:52:56<2689:28:09, 32.29s/it]training loss: 1.694e-02:   0%|          | 168/300001 [1:53:28<2685:47:36, 32.25s/it]training loss: 1.694e-02:   0%|          | 169/300001 [1:54:00<2684:54:53, 32.24s/it]training loss: 1.694e-02:   0%|          | 170/300001 [1:54:32<2676:30:20, 32.14s/it]training loss: 1.694e-02:   0%|          | 171/300001 [1:55:05<2692:26:50, 32.33s/it]training loss: 1.694e-02:   0%|          | 172/300001 [1:55:37<2692:15:49, 32.33s/it]training loss: 1.694e-02:   0%|          | 173/300001 [1:56:09<2683:51:36, 32.22s/it]training loss: 1.694e-02:   0%|          | 174/300001 [1:56:42<2700:49:42, 32.43s/it]training loss: 1.694e-02:   0%|          | 175/300001 [1:57:15<2710:59:34, 32.55s/it]training loss: 1.694e-02:   0%|          | 176/300001 [1:57:48<2725:18:15, 32.72s/it]training loss: 1.694e-02:   0%|          | 177/300001 [1:58:20<2723:44:27, 32.70s/it]training loss: 1.694e-02:   0%|          | 178/300001 [1:58:52<2707:48:39, 32.51s/it]training loss: 1.694e-02:   0%|          | 179/300001 [1:59:24<2695:30:42, 32.37s/it]training loss: 1.694e-02:   0%|          | 180/300001 [1:59:57<2697:57:47, 32.39s/it]training loss: 2.042e-02:   0%|          | 180/300001 [2:00:29<2697:57:47, 32.39s/it]training loss: 2.042e-02:   0%|          | 181/300001 [2:00:29<2682:00:40, 32.20s/it]training loss: 2.042e-02:   0%|          | 182/300001 [2:01:02<2711:19:47, 32.56s/it]training loss: 2.042e-02:   0%|          | 183/300001 [2:01:34<2701:19:56, 32.44s/it]training loss: 2.042e-02:   0%|          | 184/300001 [2:02:06<2695:44:15, 32.37s/it]training loss: 2.042e-02:   0%|          | 185/300001 [2:02:39<2697:19:03, 32.39s/it]training loss: 2.042e-02:   0%|          | 186/300001 [2:03:11<2689:50:49, 32.30s/it]training loss: 2.042e-02:   0%|          | 187/300001 [2:03:44<2702:04:18, 32.44s/it]training loss: 2.042e-02:   0%|          | 188/300001 [2:04:16<2688:47:06, 32.29s/it]training loss: 2.042e-02:   0%|          | 189/300001 [2:04:48<2679:12:28, 32.17s/it]training loss: 2.042e-02:   0%|          | 190/300001 [2:05:20<2689:54:29, 32.30s/it]training loss: 2.042e-02:   0%|          | 191/300001 [2:05:51<2665:18:14, 32.00s/it]training loss: 2.042e-02:   0%|          | 192/300001 [2:06:24<2673:32:20, 32.10s/it]training loss: 2.042e-02:   0%|          | 193/300001 [2:06:55<2644:29:59, 31.75s/it]training loss: 2.042e-02:   0%|          | 194/300001 [2:07:27<2664:20:33, 31.99s/it]training loss: 2.042e-02:   0%|          | 195/300001 [2:08:01<2702:46:54, 32.45s/it]training loss: 2.042e-02:   0%|          | 196/300001 [2:08:34<2718:57:25, 32.65s/it]training loss: 2.042e-02:   0%|          | 197/300001 [2:09:06<2706:31:29, 32.50s/it]training loss: 2.042e-02:   0%|          | 198/300001 [2:09:39<2727:12:56, 32.75s/it]training loss: 2.042e-02:   0%|          | 199/300001 [2:10:13<2746:18:13, 32.98s/it]training loss: 2.042e-02:   0%|          | 200/300001 [2:10:47<2762:08:29, 33.17s/it]training loss: 1.852e-02:   0%|          | 200/300001 [2:11:19<2762:08:29, 33.17s/it]training loss: 1.852e-02:   0%|          | 201/300001 [2:11:19<2748:57:05, 33.01s/it]training loss: 1.852e-02:   0%|          | 202/300001 [2:11:52<2732:55:30, 32.82s/it]training loss: 1.852e-02:   0%|          | 203/300001 [2:12:26<2763:10:13, 33.18s/it]training loss: 1.852e-02:   0%|          | 204/300001 [2:12:58<2733:30:05, 32.82s/it]training loss: 1.852e-02:   0%|          | 205/300001 [2:13:30<2724:54:28, 32.72s/it]training loss: 1.852e-02:   0%|          | 206/300001 [2:14:02<2706:00:49, 32.49s/it]training loss: 1.852e-02:   0%|          | 207/300001 [2:14:35<2714:41:58, 32.60s/it]training loss: 1.852e-02:   0%|          | 208/300001 [2:15:06<2680:15:22, 32.19s/it]training loss: 1.852e-02:   0%|          | 209/300001 [2:15:39<2698:58:37, 32.41s/it]training loss: 1.852e-02:   0%|          | 210/300001 [2:16:11<2681:17:20, 32.20s/it]training loss: 1.852e-02:   0%|          | 211/300001 [2:16:43<2674:45:56, 32.12s/it]training loss: 1.852e-02:   0%|          | 212/300001 [2:17:15<2685:50:27, 32.25s/it]training loss: 1.852e-02:   0%|          | 213/300001 [2:17:48<2704:05:30, 32.47s/it]training loss: 1.852e-02:   0%|          | 214/300001 [2:18:19<2674:24:59, 32.12s/it]training loss: 1.852e-02:   0%|          | 215/300001 [2:18:53<2700:43:55, 32.43s/it]training loss: 1.852e-02:   0%|          | 216/300001 [2:19:25<2689:30:24, 32.30s/it]training loss: 1.852e-02:   0%|          | 217/300001 [2:19:58<2708:58:22, 32.53s/it]training loss: 1.852e-02:   0%|          | 218/300001 [2:20:30<2693:22:58, 32.34s/it]training loss: 1.852e-02:   0%|          | 219/300001 [2:21:02<2686:24:05, 32.26s/it]training loss: 1.852e-02:   0%|          | 220/300001 [2:21:34<2676:02:05, 32.14s/it]training loss: 1.564e-02:   0%|          | 220/300001 [2:22:06<2676:02:05, 32.14s/it]training loss: 1.564e-02:   0%|          | 221/300001 [2:22:06<2677:40:26, 32.16s/it]training loss: 1.564e-02:   0%|          | 222/300001 [2:22:39<2692:54:13, 32.34s/it]training loss: 1.564e-02:   0%|          | 223/300001 [2:23:11<2698:37:20, 32.41s/it]training loss: 1.564e-02:   0%|          | 224/300001 [2:23:42<2673:30:55, 32.11s/it]training loss: 1.564e-02:   0%|          | 225/300001 [2:24:14<2655:28:47, 31.89s/it]training loss: 1.564e-02:   0%|          | 226/300001 [2:24:46<2650:29:10, 31.83s/it]training loss: 1.564e-02:   0%|          | 227/300001 [2:25:17<2645:20:57, 31.77s/it]training loss: 1.564e-02:   0%|          | 228/300001 [2:25:50<2674:25:33, 32.12s/it]training loss: 1.564e-02:   0%|          | 229/300001 [2:26:23<2701:17:13, 32.44s/it]training loss: 1.564e-02:   0%|          | 230/300001 [2:26:55<2690:32:43, 32.31s/it]training loss: 1.564e-02:   0%|          | 231/300001 [2:27:26<2658:30:55, 31.93s/it]training loss: 1.564e-02:   0%|          | 232/300001 [2:27:58<2661:36:17, 31.96s/it]training loss: 1.564e-02:   0%|          | 233/300001 [2:28:31<2668:09:00, 32.04s/it]training loss: 1.564e-02:   0%|          | 234/300001 [2:29:01<2635:10:59, 31.65s/it]training loss: 1.564e-02:   0%|          | 235/300001 [2:29:34<2654:25:15, 31.88s/it]training loss: 1.564e-02:   0%|          | 236/300001 [2:30:06<2667:40:47, 32.04s/it]training loss: 1.564e-02:   0%|          | 237/300001 [2:30:38<2671:19:07, 32.08s/it]training loss: 1.564e-02:   0%|          | 238/300001 [2:31:12<2713:12:42, 32.58s/it]training loss: 1.564e-02:   0%|          | 239/300001 [2:31:45<2719:35:00, 32.66s/it]training loss: 1.564e-02:   0%|          | 240/300001 [2:32:16<2689:24:22, 32.30s/it]training loss: 1.659e-02:   0%|          | 240/300001 [2:32:49<2689:24:22, 32.30s/it]training loss: 1.659e-02:   0%|          | 241/300001 [2:32:49<2690:08:03, 32.31s/it]training loss: 1.659e-02:   0%|          | 242/300001 [2:33:21<2694:02:44, 32.35s/it]training loss: 1.659e-02:   0%|          | 243/300001 [2:33:53<2687:35:46, 32.28s/it]training loss: 1.659e-02:   0%|          | 244/300001 [2:34:24<2659:55:33, 31.94s/it]training loss: 1.659e-02:   0%|          | 245/300001 [2:34:57<2685:03:23, 32.25s/it]training loss: 1.659e-02:   0%|          | 246/300001 [2:35:29<2666:14:36, 32.02s/it]training loss: 1.659e-02:   0%|          | 247/300001 [2:36:02<2695:20:13, 32.37s/it]training loss: 1.659e-02:   0%|          | 248/300001 [2:36:34<2671:38:21, 32.09s/it]training loss: 1.659e-02:   0%|          | 249/300001 [2:37:06<2679:27:36, 32.18s/it]training loss: 1.659e-02:   0%|          | 250/300001 [2:37:38<2685:21:57, 32.25s/it]training loss: 1.659e-02:   0%|          | 251/300001 [2:38:11<2689:11:44, 32.30s/it]training loss: 1.659e-02:   0%|          | 252/300001 [2:38:43<2699:20:02, 32.42s/it]training loss: 1.659e-02:   0%|          | 253/300001 [2:39:15<2670:53:07, 32.08s/it]training loss: 1.659e-02:   0%|          | 254/300001 [2:39:47<2671:59:16, 32.09s/it]training loss: 1.659e-02:   0%|          | 255/300001 [2:40:19<2673:23:17, 32.11s/it]training loss: 1.659e-02:   0%|          | 256/300001 [2:40:52<2683:33:59, 32.23s/it]training loss: 1.659e-02:   0%|          | 257/300001 [2:41:24<2690:11:51, 32.31s/it]training loss: 1.659e-02:   0%|          | 258/300001 [2:41:56<2694:35:54, 32.36s/it]training loss: 1.659e-02:   0%|          | 259/300001 [2:42:28<2681:39:20, 32.21s/it]training loss: 1.659e-02:   0%|          | 260/300001 [2:43:01<2700:08:32, 32.43s/it]training loss: 1.446e-02:   0%|          | 260/300001 [2:43:34<2700:08:32, 32.43s/it]training loss: 1.446e-02:   0%|          | 261/300001 [2:43:34<2705:09:17, 32.49s/it]training loss: 1.446e-02:   0%|          | 262/300001 [2:44:06<2704:18:36, 32.48s/it]training loss: 1.446e-02:   0%|          | 263/300001 [2:44:39<2706:30:05, 32.51s/it]training loss: 1.446e-02:   0%|          | 264/300001 [2:45:11<2700:27:28, 32.43s/it]training loss: 1.446e-02:   0%|          | 265/300001 [2:45:44<2716:50:09, 32.63s/it]training loss: 1.446e-02:   0%|          | 266/300001 [2:46:18<2735:29:30, 32.85s/it]training loss: 1.446e-02:   0%|          | 267/300001 [2:46:50<2731:59:28, 32.81s/it]training loss: 1.446e-02:   0%|          | 268/300001 [2:47:22<2704:39:39, 32.48s/it]training loss: 1.446e-02:   0%|          | 269/300001 [2:47:55<2722:25:53, 32.70s/it]training loss: 1.446e-02:   0%|          | 270/300001 [2:48:28<2721:41:31, 32.69s/it]training loss: 1.446e-02:   0%|          | 271/300001 [2:49:01<2740:39:41, 32.92s/it]training loss: 1.446e-02:   0%|          | 272/300001 [2:49:33<2711:47:38, 32.57s/it]training loss: 1.446e-02:   0%|          | 273/300001 [2:50:06<2711:51:07, 32.57s/it]training loss: 1.446e-02:   0%|          | 274/300001 [2:50:38<2694:42:30, 32.37s/it]training loss: 1.446e-02:   0%|          | 275/300001 [2:51:11<2709:26:16, 32.54s/it]training loss: 1.446e-02:   0%|          | 276/300001 [2:51:42<2691:13:05, 32.32s/it]training loss: 1.446e-02:   0%|          | 277/300001 [2:52:16<2731:59:09, 32.81s/it]training loss: 1.446e-02:   0%|          | 278/300001 [2:52:50<2754:30:18, 33.08s/it]training loss: 1.446e-02:   0%|          | 279/300001 [2:53:23<2757:03:48, 33.12s/it]training loss: 1.446e-02:   0%|          | 280/300001 [2:53:56<2755:53:17, 33.10s/it]training loss: 1.090e-02:   0%|          | 280/300001 [2:54:29<2755:53:17, 33.10s/it]training loss: 1.090e-02:   0%|          | 281/300001 [2:54:29<2753:51:24, 33.08s/it]training loss: 1.090e-02:   0%|          | 282/300001 [2:55:01<2705:40:44, 32.50s/it]training loss: 1.090e-02:   0%|          | 283/300001 [2:55:32<2681:57:45, 32.21s/it]training loss: 1.090e-02:   0%|          | 284/300001 [2:56:04<2671:17:10, 32.09s/it]training loss: 1.090e-02:   0%|          | 285/300001 [2:56:37<2708:21:06, 32.53s/it]training loss: 1.090e-02:   0%|          | 286/300001 [2:57:10<2709:32:51, 32.55s/it]training loss: 1.090e-02:   0%|          | 287/300001 [2:57:42<2690:35:58, 32.32s/it]training loss: 1.090e-02:   0%|          | 288/300001 [2:58:14<2677:59:13, 32.17s/it]training loss: 1.090e-02:   0%|          | 289/300001 [2:58:45<2656:29:23, 31.91s/it]training loss: 1.090e-02:   0%|          | 290/300001 [2:59:17<2665:25:52, 32.02s/it]training loss: 1.090e-02:   0%|          | 291/300001 [2:59:49<2667:53:08, 32.05s/it]training loss: 1.090e-02:   0%|          | 292/300001 [3:00:21<2662:15:52, 31.98s/it]training loss: 1.090e-02:   0%|          | 293/300001 [3:00:55<2706:12:31, 32.51s/it]training loss: 1.090e-02:   0%|          | 294/300001 [3:01:28<2710:30:42, 32.56s/it]training loss: 1.090e-02:   0%|          | 295/300001 [3:01:59<2677:22:07, 32.16s/it]training loss: 1.090e-02:   0%|          | 296/300001 [3:02:32<2713:19:19, 32.59s/it]training loss: 1.090e-02:   0%|          | 297/300001 [3:03:05<2702:29:04, 32.46s/it]training loss: 1.090e-02:   0%|          | 298/300001 [3:03:36<2685:15:05, 32.25s/it]training loss: 1.090e-02:   0%|          | 299/300001 [3:04:08<2671:39:44, 32.09s/it]training loss: 1.090e-02:   0%|          | 300/300001 [3:04:40<2677:55:13, 32.17s/it]training loss: 1.049e-02:   0%|          | 300/300001 [3:05:12<2677:55:13, 32.17s/it]training loss: 1.049e-02:   0%|          | 301/300001 [3:05:12<2663:18:49, 31.99s/it]training loss: 1.049e-02:   0%|          | 302/300001 [3:05:44<2668:56:49, 32.06s/it]training loss: 1.049e-02:   0%|          | 303/300001 [3:06:15<2645:11:15, 31.77s/it]training loss: 1.049e-02:   0%|          | 304/300001 [3:06:48<2667:11:10, 32.04s/it]training loss: 1.049e-02:   0%|          | 305/300001 [3:07:22<2708:07:13, 32.53s/it]training loss: 1.049e-02:   0%|          | 306/300001 [3:07:54<2710:06:25, 32.55s/it]training loss: 1.049e-02:   0%|          | 307/300001 [3:08:26<2681:32:38, 32.21s/it]training loss: 1.049e-02:   0%|          | 308/300001 [3:08:58<2687:24:05, 32.28s/it]training loss: 1.049e-02:   0%|          | 309/300001 [3:09:30<2683:35:59, 32.24s/it]training loss: 1.049e-02:   0%|          | 310/300001 [3:10:01<2659:51:43, 31.95s/it]training loss: 1.049e-02:   0%|          | 311/300001 [3:10:34<2678:54:39, 32.18s/it]training loss: 1.049e-02:   0%|          | 312/300001 [3:11:06<2670:30:18, 32.08s/it]training loss: 1.049e-02:   0%|          | 313/300001 [3:11:37<2653:53:12, 31.88s/it]training loss: 1.049e-02:   0%|          | 314/300001 [3:12:00<2426:00:53, 29.14s/it]training loss: 1.049e-02:   0%|          | 315/300001 [3:12:32<2500:23:50, 30.04s/it]training loss: 1.049e-02:   0%|          | 316/300001 [3:13:04<2552:37:27, 30.66s/it]training loss: 1.049e-02:   0%|          | 317/300001 [3:13:37<2603:47:59, 31.28s/it]training loss: 1.049e-02:   0%|          | 318/300001 [3:14:10<2640:55:34, 31.72s/it]training loss: 1.049e-02:   0%|          | 319/300001 [3:14:43<2679:36:32, 32.19s/it]training loss: 1.049e-02:   0%|          | 320/300001 [3:15:16<2701:26:43, 32.45s/it]training loss: 1.102e-02:   0%|          | 320/300001 [3:15:49<2701:26:43, 32.45s/it]training loss: 1.102e-02:   0%|          | 321/300001 [3:15:49<2706:24:00, 32.51s/it]training loss: 1.102e-02:   0%|          | 322/300001 [3:16:22<2713:16:35, 32.59s/it]training loss: 1.102e-02:   0%|          | 323/300001 [3:16:53<2692:51:58, 32.35s/it]training loss: 1.102e-02:   0%|          | 324/300001 [3:17:27<2710:07:26, 32.56s/it]training loss: 1.102e-02:   0%|          | 325/300001 [3:17:59<2703:57:27, 32.48s/it]training loss: 1.102e-02:   0%|          | 326/300001 [3:18:31<2698:19:06, 32.41s/it]training loss: 1.102e-02:   0%|          | 327/300001 [3:19:03<2688:27:56, 32.30s/it]training loss: 1.102e-02:   0%|          | 328/300001 [3:19:36<2698:04:51, 32.41s/it]training loss: 1.102e-02:   0%|          | 329/300001 [3:20:08<2681:19:05, 32.21s/it]training loss: 1.102e-02:   0%|          | 330/300001 [3:20:41<2707:29:22, 32.53s/it]training loss: 1.102e-02:   0%|          | 331/300001 [3:21:13<2708:13:40, 32.53s/it]training loss: 1.102e-02:   0%|          | 332/300001 [3:21:45<2680:20:42, 32.20s/it]training loss: 1.102e-02:   0%|          | 333/300001 [3:22:18<2709:22:01, 32.55s/it]training loss: 1.102e-02:   0%|          | 334/300001 [3:22:50<2699:54:09, 32.43s/it]training loss: 1.102e-02:   0%|          | 335/300001 [3:23:23<2711:19:42, 32.57s/it]training loss: 1.102e-02:   0%|          | 336/300001 [3:23:55<2698:34:18, 32.42s/it]training loss: 1.102e-02:   0%|          | 337/300001 [3:24:27<2693:25:28, 32.36s/it]training loss: 1.102e-02:   0%|          | 338/300001 [3:25:00<2697:11:55, 32.40s/it]training loss: 1.102e-02:   0%|          | 339/300001 [3:25:33<2715:30:50, 32.62s/it]training loss: 1.102e-02:   0%|          | 340/300001 [3:26:04<2675:28:06, 32.14s/it]training loss: 1.178e-02:   0%|          | 340/300001 [3:26:37<2675:28:06, 32.14s/it]training loss: 1.178e-02:   0%|          | 341/300001 [3:26:37<2690:02:36, 32.32s/it]training loss: 1.178e-02:   0%|          | 342/300001 [3:27:10<2708:41:31, 32.54s/it]training loss: 1.178e-02:   0%|          | 343/300001 [3:27:44<2737:04:08, 32.88s/it]training loss: 1.178e-02:   0%|          | 344/300001 [3:28:15<2702:11:10, 32.46s/it]training loss: 1.178e-02:   0%|          | 345/300001 [3:28:48<2711:37:09, 32.58s/it]training loss: 1.178e-02:   0%|          | 346/300001 [3:29:21<2714:25:49, 32.61s/it]training loss: 1.178e-02:   0%|          | 347/300001 [3:29:53<2701:07:20, 32.45s/it]training loss: 1.178e-02:   0%|          | 348/300001 [3:30:25<2689:42:08, 32.31s/it]training loss: 1.178e-02:   0%|          | 349/300001 [3:30:58<2707:25:06, 32.53s/it]training loss: 1.178e-02:   0%|          | 350/300001 [3:31:31<2714:34:12, 32.61s/it]training loss: 1.178e-02:   0%|          | 351/300001 [3:32:04<2743:42:44, 32.96s/it]training loss: 1.178e-02:   0%|          | 352/300001 [3:32:36<2720:44:35, 32.69s/it]training loss: 1.178e-02:   0%|          | 353/300001 [3:33:08<2706:18:00, 32.51s/it]training loss: 1.178e-02:   0%|          | 354/300001 [3:33:41<2711:10:16, 32.57s/it]training loss: 1.178e-02:   0%|          | 355/300001 [3:34:13<2702:26:06, 32.47s/it]training loss: 1.178e-02:   0%|          | 356/300001 [3:34:45<2684:46:09, 32.26s/it]training loss: 1.178e-02:   0%|          | 357/300001 [3:35:17<2678:16:31, 32.18s/it]training loss: 1.178e-02:   0%|          | 358/300001 [3:35:49<2676:44:36, 32.16s/it]training loss: 1.178e-02:   0%|          | 359/300001 [3:36:22<2680:47:51, 32.21s/it]training loss: 1.178e-02:   0%|          | 360/300001 [3:36:54<2697:45:12, 32.41s/it]training loss: 1.177e-02:   0%|          | 360/300001 [3:37:27<2697:45:12, 32.41s/it]training loss: 1.177e-02:   0%|          | 361/300001 [3:37:27<2691:10:32, 32.33s/it]training loss: 1.177e-02:   0%|          | 362/300001 [3:37:58<2669:32:13, 32.07s/it]training loss: 1.177e-02:   0%|          | 363/300001 [3:38:30<2670:57:09, 32.09s/it]training loss: 1.177e-02:   0%|          | 364/300001 [3:39:02<2671:49:35, 32.10s/it]training loss: 1.177e-02:   0%|          | 365/300001 [3:39:34<2672:39:15, 32.11s/it]training loss: 1.177e-02:   0%|          | 366/300001 [3:40:07<2676:46:25, 32.16s/it]training loss: 1.177e-02:   0%|          | 367/300001 [3:40:39<2680:12:19, 32.20s/it]training loss: 1.177e-02:   0%|          | 368/300001 [3:41:11<2666:13:57, 32.03s/it]training loss: 1.177e-02:   0%|          | 369/300001 [3:41:43<2670:38:23, 32.09s/it]training loss: 1.177e-02:   0%|          | 370/300001 [3:42:17<2714:38:52, 32.62s/it]training loss: 1.177e-02:   0%|          | 371/300001 [3:42:50<2718:39:59, 32.66s/it]training loss: 1.177e-02:   0%|          | 372/300001 [3:43:22<2705:24:38, 32.51s/it]training loss: 1.177e-02:   0%|          | 373/300001 [3:43:54<2694:20:34, 32.37s/it]training loss: 1.177e-02:   0%|          | 374/300001 [3:44:26<2687:43:04, 32.29s/it]training loss: 1.177e-02:   0%|          | 375/300001 [3:44:59<2700:52:04, 32.45s/it]training loss: 1.177e-02:   0%|          | 376/300001 [3:45:31<2707:24:53, 32.53s/it]training loss: 1.177e-02:   0%|          | 377/300001 [3:46:05<2724:45:19, 32.74s/it]training loss: 1.177e-02:   0%|          | 378/300001 [3:46:37<2724:52:00, 32.74s/it]training loss: 1.177e-02:   0%|          | 379/300001 [3:47:10<2711:11:34, 32.58s/it]training loss: 1.177e-02:   0%|          | 380/300001 [3:47:43<2736:40:30, 32.88s/it]training loss: 1.195e-02:   0%|          | 380/300001 [3:48:16<2736:40:30, 32.88s/it]training loss: 1.195e-02:   0%|          | 381/300001 [3:48:16<2726:21:29, 32.76s/it]training loss: 1.195e-02:   0%|          | 382/300001 [3:48:48<2717:35:24, 32.65s/it]training loss: 1.195e-02:   0%|          | 383/300001 [3:49:21<2715:49:42, 32.63s/it]training loss: 1.195e-02:   0%|          | 384/300001 [3:49:54<2732:08:02, 32.83s/it]training loss: 1.195e-02:   0%|          | 385/300001 [3:50:25<2697:40:36, 32.41s/it]training loss: 1.195e-02:   0%|          | 386/300001 [3:50:57<2681:30:40, 32.22s/it]training loss: 1.195e-02:   0%|          | 387/300001 [3:51:30<2695:33:36, 32.39s/it]training loss: 1.195e-02:   0%|          | 388/300001 [3:52:02<2690:10:22, 32.32s/it]training loss: 1.195e-02:   0%|          | 389/300001 [3:52:34<2683:17:20, 32.24s/it]training loss: 1.195e-02:   0%|          | 390/300001 [3:53:07<2690:41:36, 32.33s/it]training loss: 1.195e-02:   0%|          | 391/300001 [3:53:39<2682:39:22, 32.23s/it]training loss: 1.195e-02:   0%|          | 392/300001 [3:54:10<2660:05:36, 31.96s/it]training loss: 1.195e-02:   0%|          | 393/300001 [3:54:43<2687:45:38, 32.30s/it]training loss: 1.195e-02:   0%|          | 394/300001 [3:55:14<2664:18:55, 32.01s/it]training loss: 1.195e-02:   0%|          | 395/300001 [3:55:46<2651:59:45, 31.87s/it]training loss: 1.195e-02:   0%|          | 396/300001 [3:56:19<2670:36:52, 32.09s/it]training loss: 1.195e-02:   0%|          | 397/300001 [3:56:50<2657:16:58, 31.93s/it]training loss: 1.195e-02:   0%|          | 398/300001 [3:57:20<2619:19:23, 31.47s/it]training loss: 1.195e-02:   0%|          | 399/300001 [3:57:53<2647:05:06, 31.81s/it]training loss: 1.195e-02:   0%|          | 400/300001 [3:58:26<2676:32:57, 32.16s/it]training loss: 1.096e-02:   0%|          | 400/300001 [3:58:58<2676:32:57, 32.16s/it]training loss: 1.096e-02:   0%|          | 401/300001 [3:58:58<2667:40:16, 32.05s/it]training loss: 1.096e-02:   0%|          | 402/300001 [3:59:30<2676:20:48, 32.16s/it]training loss: 1.096e-02:   0%|          | 403/300001 [4:00:01<2648:06:39, 31.82s/it]training loss: 1.096e-02:   0%|          | 404/300001 [4:00:33<2637:52:26, 31.70s/it]training loss: 1.096e-02:   0%|          | 405/300001 [4:01:04<2626:37:59, 31.56s/it]training loss: 1.096e-02:   0%|          | 406/300001 [4:01:36<2641:02:38, 31.74s/it]training loss: 1.096e-02:   0%|          | 407/300001 [4:02:08<2651:40:07, 31.86s/it]training loss: 1.096e-02:   0%|          | 408/300001 [4:02:39<2629:13:06, 31.59s/it]training loss: 1.096e-02:   0%|          | 409/300001 [4:03:12<2660:15:06, 31.97s/it]training loss: 1.096e-02:   0%|          | 410/300001 [4:03:45<2674:58:39, 32.14s/it]training loss: 1.096e-02:   0%|          | 411/300001 [4:04:17<2670:27:51, 32.09s/it]training loss: 1.096e-02:   0%|          | 412/300001 [4:04:49<2669:17:30, 32.08s/it]training loss: 1.096e-02:   0%|          | 413/300001 [4:05:21<2686:48:04, 32.29s/it]training loss: 1.096e-02:   0%|          | 414/300001 [4:05:53<2680:05:40, 32.21s/it]training loss: 1.096e-02:   0%|          | 415/300001 [4:06:26<2677:20:49, 32.17s/it]training loss: 1.096e-02:   0%|          | 416/300001 [4:06:59<2722:34:24, 32.72s/it]training loss: 1.096e-02:   0%|          | 417/300001 [4:07:32<2721:57:33, 32.71s/it]training loss: 1.096e-02:   0%|          | 418/300001 [4:08:05<2733:08:20, 32.84s/it]training loss: 1.096e-02:   0%|          | 419/300001 [4:08:39<2743:02:07, 32.96s/it]training loss: 1.096e-02:   0%|          | 420/300001 [4:09:12<2752:08:02, 33.07s/it]training loss: 1.025e-02:   0%|          | 420/300001 [4:09:45<2752:08:02, 33.07s/it]training loss: 1.025e-02:   0%|          | 421/300001 [4:09:45<2744:59:13, 32.99s/it]training loss: 1.025e-02:   0%|          | 422/300001 [4:10:16<2712:37:43, 32.60s/it]training loss: 1.025e-02:   0%|          | 423/300001 [4:10:50<2725:36:29, 32.75s/it]training loss: 1.025e-02:   0%|          | 424/300001 [4:11:21<2691:59:37, 32.35s/it]training loss: 1.025e-02:   0%|          | 425/300001 [4:11:53<2687:15:23, 32.29s/it]training loss: 1.025e-02:   0%|          | 426/300001 [4:12:25<2671:08:52, 32.10s/it]training loss: 1.025e-02:   0%|          | 427/300001 [4:12:56<2649:53:48, 31.84s/it]training loss: 1.025e-02:   0%|          | 428/300001 [4:13:29<2679:02:24, 32.19s/it]training loss: 1.025e-02:   0%|          | 429/300001 [4:14:01<2668:15:43, 32.06s/it]training loss: 1.025e-02:   0%|          | 430/300001 [4:14:34<2688:32:20, 32.31s/it]training loss: 1.025e-02:   0%|          | 431/300001 [4:15:06<2689:01:08, 32.31s/it]training loss: 1.025e-02:   0%|          | 432/300001 [4:15:38<2673:57:06, 32.13s/it]training loss: 1.025e-02:   0%|          | 433/300001 [4:16:11<2697:02:12, 32.41s/it]training loss: 1.025e-02:   0%|          | 434/300001 [4:16:43<2687:48:50, 32.30s/it]training loss: 1.025e-02:   0%|          | 435/300001 [4:17:15<2674:15:08, 32.14s/it]training loss: 1.025e-02:   0%|          | 436/300001 [4:17:47<2684:22:25, 32.26s/it]training loss: 1.025e-02:   0%|          | 437/300001 [4:18:19<2688:09:40, 32.30s/it]training loss: 1.025e-02:   0%|          | 438/300001 [4:18:52<2685:27:12, 32.27s/it]training loss: 1.025e-02:   0%|          | 439/300001 [4:19:23<2657:57:10, 31.94s/it]training loss: 1.025e-02:   0%|          | 440/300001 [4:19:55<2666:18:23, 32.04s/it]training loss: 1.087e-02:   0%|          | 440/300001 [4:20:27<2666:18:23, 32.04s/it]training loss: 1.087e-02:   0%|          | 441/300001 [4:20:27<2672:38:56, 32.12s/it]training loss: 1.087e-02:   0%|          | 442/300001 [4:21:00<2684:02:00, 32.26s/it]training loss: 1.087e-02:   0%|          | 443/300001 [4:21:33<2694:10:48, 32.38s/it]training loss: 1.087e-02:   0%|          | 444/300001 [4:22:05<2682:51:52, 32.24s/it]training loss: 1.087e-02:   0%|          | 445/300001 [4:22:36<2674:46:01, 32.14s/it]training loss: 1.087e-02:   0%|          | 446/300001 [4:23:10<2710:56:59, 32.58s/it]training loss: 1.087e-02:   0%|          | 447/300001 [4:23:43<2728:12:49, 32.79s/it]training loss: 1.087e-02:   0%|          | 448/300001 [4:24:16<2729:07:16, 32.80s/it]training loss: 1.087e-02:   0%|          | 449/300001 [4:24:49<2728:19:07, 32.79s/it]training loss: 1.087e-02:   0%|          | 450/300001 [4:25:21<2708:04:53, 32.55s/it]training loss: 1.087e-02:   0%|          | 451/300001 [4:25:54<2714:13:58, 32.62s/it]training loss: 1.087e-02:   0%|          | 452/300001 [4:26:25<2686:36:21, 32.29s/it]training loss: 1.087e-02:   0%|          | 453/300001 [4:26:57<2673:28:45, 32.13s/it]training loss: 1.087e-02:   0%|          | 454/300001 [4:27:30<2699:48:22, 32.45s/it]training loss: 1.087e-02:   0%|          | 455/300001 [4:28:03<2708:28:40, 32.55s/it]training loss: 1.087e-02:   0%|          | 456/300001 [4:28:36<2713:04:17, 32.61s/it]training loss: 1.087e-02:   0%|          | 457/300001 [4:29:09<2724:37:12, 32.75s/it]training loss: 1.087e-02:   0%|          | 458/300001 [4:29:41<2718:55:17, 32.68s/it]training loss: 1.087e-02:   0%|          | 459/300001 [4:30:14<2712:39:06, 32.60s/it]training loss: 1.087e-02:   0%|          | 460/300001 [4:30:45<2673:19:13, 32.13s/it]training loss: 9.073e-03:   0%|          | 460/300001 [4:31:17<2673:19:13, 32.13s/it]training loss: 9.073e-03:   0%|          | 461/300001 [4:31:17<2687:00:18, 32.29s/it]training loss: 9.073e-03:   0%|          | 462/300001 [4:31:50<2693:35:30, 32.37s/it]training loss: 9.073e-03:   0%|          | 463/300001 [4:32:23<2716:06:09, 32.64s/it]training loss: 9.073e-03:   0%|          | 464/300001 [4:32:56<2720:36:44, 32.70s/it]training loss: 9.073e-03:   0%|          | 465/300001 [4:33:29<2724:42:09, 32.75s/it]training loss: 9.073e-03:   0%|          | 466/300001 [4:34:01<2696:07:06, 32.40s/it]training loss: 9.073e-03:   0%|          | 467/300001 [4:34:34<2727:43:37, 32.78s/it]training loss: 9.073e-03:   0%|          | 468/300001 [4:35:06<2708:41:11, 32.55s/it]training loss: 9.073e-03:   0%|          | 469/300001 [4:35:38<2684:57:01, 32.27s/it]training loss: 9.073e-03:   0%|          | 470/300001 [4:36:09<2665:31:00, 32.04s/it]training loss: 9.073e-03:   0%|          | 471/300001 [4:36:32<2429:24:22, 29.20s/it]training loss: 9.073e-03:   0%|          | 472/300001 [4:37:04<2511:26:32, 30.18s/it]training loss: 9.073e-03:   0%|          | 473/300001 [4:37:38<2591:17:29, 31.14s/it]training loss: 9.073e-03:   0%|          | 474/300001 [4:38:10<2617:32:40, 31.46s/it]training loss: 9.073e-03:   0%|          | 475/300001 [4:38:42<2624:18:48, 31.54s/it]training loss: 9.073e-03:   0%|          | 476/300001 [4:39:13<2625:27:29, 31.56s/it]training loss: 9.073e-03:   0%|          | 477/300001 [4:39:46<2649:13:56, 31.84s/it]training loss: 9.073e-03:   0%|          | 478/300001 [4:40:18<2663:21:26, 32.01s/it]training loss: 9.073e-03:   0%|          | 479/300001 [4:40:50<2655:53:58, 31.92s/it]training loss: 9.073e-03:   0%|          | 480/300001 [4:41:23<2676:20:30, 32.17s/it]training loss: 1.018e-02:   0%|          | 480/300001 [4:41:55<2676:20:30, 32.17s/it]training loss: 1.018e-02:   0%|          | 481/300001 [4:41:55<2682:22:47, 32.24s/it]training loss: 1.018e-02:   0%|          | 482/300001 [4:42:27<2677:54:43, 32.19s/it]training loss: 1.018e-02:   0%|          | 483/300001 [4:42:59<2681:56:55, 32.24s/it]training loss: 1.018e-02:   0%|          | 484/300001 [4:43:32<2691:20:03, 32.35s/it]training loss: 1.018e-02:   0%|          | 485/300001 [4:44:02<2635:31:41, 31.68s/it]training loss: 1.018e-02:   0%|          | 486/300001 [4:44:35<2664:44:02, 32.03s/it]training loss: 1.018e-02:   0%|          | 487/300001 [4:45:07<2671:55:19, 32.12s/it]training loss: 1.018e-02:   0%|          | 488/300001 [4:45:40<2680:28:02, 32.22s/it]training loss: 1.018e-02:   0%|          | 489/300001 [4:46:12<2672:40:21, 32.12s/it]training loss: 1.018e-02:   0%|          | 490/300001 [4:46:44<2669:49:39, 32.09s/it]training loss: 1.018e-02:   0%|          | 491/300001 [4:47:17<2702:46:51, 32.49s/it]training loss: 1.018e-02:   0%|          | 492/300001 [4:47:50<2710:42:48, 32.58s/it]training loss: 1.018e-02:   0%|          | 493/300001 [4:48:22<2708:21:23, 32.55s/it]training loss: 1.018e-02:   0%|          | 494/300001 [4:48:55<2710:32:12, 32.58s/it]training loss: 1.018e-02:   0%|          | 495/300001 [4:49:27<2702:55:16, 32.49s/it]training loss: 1.018e-02:   0%|          | 496/300001 [4:49:59<2692:14:26, 32.36s/it]training loss: 1.018e-02:   0%|          | 497/300001 [4:50:31<2669:00:41, 32.08s/it]training loss: 1.018e-02:   0%|          | 498/300001 [4:51:04<2685:18:17, 32.28s/it]training loss: 1.018e-02:   0%|          | 499/300001 [4:51:35<2672:25:01, 32.12s/it]training loss: 1.018e-02:   0%|          | 500/300001 [4:52:07<2670:17:20, 32.10s/it]training loss: 8.834e-03:   0%|          | 500/300001 [4:52:39<2670:17:20, 32.10s/it]training loss: 8.834e-03:   0%|          | 501/300001 [4:52:44<2773:30:52, 33.34s/it]training loss: 8.834e-03:   0%|          | 502/300001 [4:53:17<2771:18:42, 33.31s/it]training loss: 8.834e-03:   0%|          | 503/300001 [4:53:50<2762:41:22, 33.21s/it]training loss: 8.834e-03:   0%|          | 504/300001 [4:54:23<2758:14:16, 33.15s/it]training loss: 8.834e-03:   0%|          | 505/300001 [4:54:56<2753:03:01, 33.09s/it]training loss: 8.834e-03:   0%|          | 506/300001 [4:55:29<2762:15:21, 33.20s/it]training loss: 8.834e-03:   0%|          | 507/300001 [4:56:02<2743:18:11, 32.98s/it]training loss: 8.834e-03:   0%|          | 508/300001 [4:56:34<2718:42:23, 32.68s/it]training loss: 8.834e-03:   0%|          | 509/300001 [4:57:06<2707:04:06, 32.54s/it]training loss: 8.834e-03:   0%|          | 510/300001 [4:57:40<2739:19:50, 32.93s/it]training loss: 8.834e-03:   0%|          | 511/300001 [4:58:13<2735:53:23, 32.89s/it]training loss: 8.834e-03:   0%|          | 512/300001 [4:58:45<2734:46:41, 32.87s/it]training loss: 8.834e-03:   0%|          | 513/300001 [4:59:19<2753:04:17, 33.09s/it]training loss: 8.834e-03:   0%|          | 514/300001 [4:59:52<2760:20:47, 33.18s/it]training loss: 8.834e-03:   0%|          | 515/300001 [5:00:27<2800:49:21, 33.67s/it]training loss: 8.834e-03:   0%|          | 516/300001 [5:01:01<2800:25:08, 33.66s/it]training loss: 8.834e-03:   0%|          | 517/300001 [5:01:33<2756:49:57, 33.14s/it]training loss: 8.834e-03:   0%|          | 518/300001 [5:02:05<2733:10:27, 32.85s/it]training loss: 8.834e-03:   0%|          | 519/300001 [5:02:38<2728:56:06, 32.80s/it]training loss: 8.834e-03:   0%|          | 520/300001 [5:03:09<2704:29:05, 32.51s/it]training loss: 9.339e-03:   0%|          | 520/300001 [5:03:41<2704:29:05, 32.51s/it]training loss: 9.339e-03:   0%|          | 521/300001 [5:03:41<2691:46:05, 32.36s/it]training loss: 9.339e-03:   0%|          | 522/300001 [5:04:14<2700:16:30, 32.46s/it]training loss: 9.339e-03:   0%|          | 523/300001 [5:04:46<2696:22:49, 32.41s/it]training loss: 9.339e-03:   0%|          | 524/300001 [5:05:19<2696:23:56, 32.41s/it]training loss: 9.339e-03:   0%|          | 525/300001 [5:05:51<2689:58:11, 32.34s/it]training loss: 9.339e-03:   0%|          | 526/300001 [5:06:23<2692:09:35, 32.36s/it]training loss: 9.339e-03:   0%|          | 527/300001 [5:06:56<2707:37:01, 32.55s/it]training loss: 9.339e-03:   0%|          | 528/300001 [5:07:28<2692:34:06, 32.37s/it]training loss: 9.339e-03:   0%|          | 529/300001 [5:08:01<2698:14:44, 32.44s/it]training loss: 9.339e-03:   0%|          | 530/300001 [5:08:33<2685:01:56, 32.28s/it]training loss: 9.339e-03:   0%|          | 531/300001 [5:09:06<2696:17:00, 32.41s/it]training loss: 9.339e-03:   0%|          | 532/300001 [5:09:38<2697:19:05, 32.43s/it]training loss: 9.339e-03:   0%|          | 533/300001 [5:10:10<2683:31:52, 32.26s/it]training loss: 9.339e-03:   0%|          | 534/300001 [5:10:43<2701:14:34, 32.47s/it]training loss: 9.339e-03:   0%|          | 535/300001 [5:11:15<2701:49:30, 32.48s/it]training loss: 9.339e-03:   0%|          | 536/300001 [5:11:49<2726:50:12, 32.78s/it]training loss: 9.339e-03:   0%|          | 537/300001 [5:12:21<2716:06:33, 32.65s/it]training loss: 9.339e-03:   0%|          | 538/300001 [5:12:54<2723:42:55, 32.74s/it]training loss: 9.339e-03:   0%|          | 539/300001 [5:13:26<2705:56:15, 32.53s/it]training loss: 9.339e-03:   0%|          | 540/300001 [5:13:59<2715:38:27, 32.65s/it]training loss: 8.590e-03:   0%|          | 540/300001 [5:14:30<2715:38:27, 32.65s/it]training loss: 8.590e-03:   0%|          | 541/300001 [5:14:30<2675:22:57, 32.16s/it]training loss: 8.590e-03:   0%|          | 542/300001 [5:15:04<2705:16:32, 32.52s/it]training loss: 8.590e-03:   0%|          | 543/300001 [5:15:36<2711:32:24, 32.60s/it]training loss: 8.590e-03:   0%|          | 544/300001 [5:16:09<2725:10:27, 32.76s/it]training loss: 8.590e-03:   0%|          | 545/300001 [5:16:43<2743:47:20, 32.99s/it]training loss: 8.590e-03:   0%|          | 546/300001 [5:17:16<2744:08:12, 32.99s/it]training loss: 8.590e-03:   0%|          | 547/300001 [5:17:49<2748:02:54, 33.04s/it]training loss: 8.590e-03:   0%|          | 548/300001 [5:18:23<2757:35:59, 33.15s/it]training loss: 8.590e-03:   0%|          | 549/300001 [5:18:55<2745:43:38, 33.01s/it]training loss: 8.590e-03:   0%|          | 550/300001 [5:19:27<2704:57:14, 32.52s/it]training loss: 8.590e-03:   0%|          | 551/300001 [5:20:00<2722:42:16, 32.73s/it]training loss: 8.590e-03:   0%|          | 552/300001 [5:20:32<2702:02:08, 32.48s/it]training loss: 8.590e-03:   0%|          | 553/300001 [5:21:04<2703:53:14, 32.51s/it]training loss: 8.590e-03:   0%|          | 554/300001 [5:21:36<2690:57:51, 32.35s/it]training loss: 8.590e-03:   0%|          | 555/300001 [5:22:08<2685:40:49, 32.29s/it]training loss: 8.590e-03:   0%|          | 556/300001 [5:22:40<2679:00:31, 32.21s/it]training loss: 8.590e-03:   0%|          | 557/300001 [5:23:13<2677:29:18, 32.19s/it]training loss: 8.590e-03:   0%|          | 558/300001 [5:23:45<2676:09:19, 32.17s/it]training loss: 8.590e-03:   0%|          | 559/300001 [5:24:17<2684:37:58, 32.28s/it]training loss: 8.590e-03:   0%|          | 560/300001 [5:24:51<2709:24:10, 32.57s/it]training loss: 9.032e-03:   0%|          | 560/300001 [5:25:24<2709:24:10, 32.57s/it]training loss: 9.032e-03:   0%|          | 561/300001 [5:25:24<2730:37:48, 32.83s/it]training loss: 9.032e-03:   0%|          | 562/300001 [5:25:55<2693:35:45, 32.38s/it]training loss: 9.032e-03:   0%|          | 563/300001 [5:26:27<2682:11:24, 32.25s/it]training loss: 9.032e-03:   0%|          | 564/300001 [5:27:00<2690:02:28, 32.34s/it]training loss: 9.032e-03:   0%|          | 565/300001 [5:27:32<2680:53:06, 32.23s/it]training loss: 9.032e-03:   0%|          | 566/300001 [5:28:04<2692:33:33, 32.37s/it]training loss: 9.032e-03:   0%|          | 567/300001 [5:28:37<2693:07:44, 32.38s/it]training loss: 9.032e-03:   0%|          | 568/300001 [5:29:10<2703:02:29, 32.50s/it]training loss: 9.032e-03:   0%|          | 569/300001 [5:29:42<2701:31:54, 32.48s/it]training loss: 9.032e-03:   0%|          | 570/300001 [5:30:14<2687:06:52, 32.31s/it]training loss: 9.032e-03:   0%|          | 571/300001 [5:30:46<2681:04:23, 32.23s/it]training loss: 9.032e-03:   0%|          | 572/300001 [5:31:18<2681:23:18, 32.24s/it]training loss: 9.032e-03:   0%|          | 573/300001 [5:31:51<2688:23:29, 32.32s/it]training loss: 9.032e-03:   0%|          | 574/300001 [5:32:23<2696:31:01, 32.42s/it]training loss: 9.032e-03:   0%|          | 575/300001 [5:32:56<2696:33:00, 32.42s/it]training loss: 9.032e-03:   0%|          | 576/300001 [5:33:28<2695:41:59, 32.41s/it]training loss: 9.032e-03:   0%|          | 577/300001 [5:34:00<2674:48:47, 32.16s/it]training loss: 9.032e-03:   0%|          | 578/300001 [5:34:33<2711:46:50, 32.60s/it]training loss: 9.032e-03:   0%|          | 579/300001 [5:35:05<2679:48:46, 32.22s/it]training loss: 9.032e-03:   0%|          | 580/300001 [5:35:38<2702:51:53, 32.50s/it]training loss: 9.345e-03:   0%|          | 580/300001 [5:36:11<2702:51:53, 32.50s/it]training loss: 9.345e-03:   0%|          | 581/300001 [5:36:11<2713:21:25, 32.62s/it]training loss: 9.345e-03:   0%|          | 582/300001 [5:36:43<2704:28:53, 32.52s/it]training loss: 9.345e-03:   0%|          | 583/300001 [5:37:16<2706:19:47, 32.54s/it]training loss: 9.345e-03:   0%|          | 584/300001 [5:37:48<2688:37:09, 32.33s/it]training loss: 9.345e-03:   0%|          | 585/300001 [5:38:19<2671:39:52, 32.12s/it]training loss: 9.345e-03:   0%|          | 586/300001 [5:38:50<2643:15:16, 31.78s/it]training loss: 9.345e-03:   0%|          | 587/300001 [5:39:22<2637:39:34, 31.71s/it]training loss: 9.345e-03:   0%|          | 588/300001 [5:39:55<2686:46:58, 32.30s/it]training loss: 9.345e-03:   0%|          | 589/300001 [5:40:29<2719:53:43, 32.70s/it]training loss: 9.345e-03:   0%|          | 590/300001 [5:41:02<2735:35:22, 32.89s/it]training loss: 9.345e-03:   0%|          | 591/300001 [5:41:35<2731:48:02, 32.85s/it]training loss: 9.345e-03:   0%|          | 592/300001 [5:42:08<2733:49:51, 32.87s/it]training loss: 9.345e-03:   0%|          | 593/300001 [5:42:41<2737:19:12, 32.91s/it]training loss: 9.345e-03:   0%|          | 594/300001 [5:43:14<2732:50:05, 32.86s/it]training loss: 9.345e-03:   0%|          | 595/300001 [5:43:45<2698:32:37, 32.45s/it]training loss: 9.345e-03:   0%|          | 596/300001 [5:44:18<2703:31:29, 32.51s/it]training loss: 9.345e-03:   0%|          | 597/300001 [5:44:51<2727:11:38, 32.79s/it]training loss: 9.345e-03:   0%|          | 598/300001 [5:45:23<2692:26:02, 32.37s/it]training loss: 9.345e-03:   0%|          | 599/300001 [5:45:55<2688:34:00, 32.33s/it]training loss: 9.345e-03:   0%|          | 600/300001 [5:46:26<2667:53:48, 32.08s/it]training loss: 8.208e-03:   0%|          | 600/300001 [5:46:58<2667:53:48, 32.08s/it]training loss: 8.208e-03:   0%|          | 601/300001 [5:46:58<2652:00:11, 31.89s/it]training loss: 8.208e-03:   0%|          | 602/300001 [5:47:30<2669:01:39, 32.09s/it]training loss: 8.208e-03:   0%|          | 603/300001 [5:48:02<2663:49:02, 32.03s/it]training loss: 8.208e-03:   0%|          | 604/300001 [5:48:35<2667:33:32, 32.08s/it]training loss: 8.208e-03:   0%|          | 605/300001 [5:49:08<2691:27:37, 32.36s/it]training loss: 8.208e-03:   0%|          | 606/300001 [5:49:40<2694:49:30, 32.40s/it]training loss: 8.208e-03:   0%|          | 607/300001 [5:50:11<2658:30:42, 31.97s/it]training loss: 8.208e-03:   0%|          | 608/300001 [5:50:43<2660:28:22, 31.99s/it]training loss: 8.208e-03:   0%|          | 609/300001 [5:51:15<2670:00:25, 32.11s/it]training loss: 8.208e-03:   0%|          | 610/300001 [5:51:47<2653:59:12, 31.91s/it]training loss: 8.208e-03:   0%|          | 611/300001 [5:52:19<2660:36:44, 31.99s/it]training loss: 8.208e-03:   0%|          | 612/300001 [5:52:51<2670:18:46, 32.11s/it]training loss: 8.208e-03:   0%|          | 613/300001 [5:53:24<2681:48:17, 32.25s/it]training loss: 8.208e-03:   0%|          | 614/300001 [5:53:56<2674:01:16, 32.15s/it]training loss: 8.208e-03:   0%|          | 615/300001 [5:54:28<2668:25:10, 32.09s/it]training loss: 8.208e-03:   0%|          | 616/300001 [5:55:01<2688:16:36, 32.33s/it]training loss: 8.208e-03:   0%|          | 617/300001 [5:55:33<2681:08:40, 32.24s/it]training loss: 8.208e-03:   0%|          | 618/300001 [5:56:05<2674:46:56, 32.16s/it]training loss: 8.208e-03:   0%|          | 619/300001 [5:56:36<2655:51:15, 31.94s/it]training loss: 8.208e-03:   0%|          | 620/300001 [5:57:08<2655:03:03, 31.93s/it]training loss: 7.626e-03:   0%|          | 620/300001 [5:57:41<2655:03:03, 31.93s/it]training loss: 7.626e-03:   0%|          | 621/300001 [5:57:41<2689:06:23, 32.34s/it]training loss: 7.626e-03:   0%|          | 622/300001 [5:58:13<2678:44:11, 32.21s/it]training loss: 7.626e-03:   0%|          | 623/300001 [5:58:47<2707:14:53, 32.55s/it]training loss: 7.626e-03:   0%|          | 624/300001 [5:59:18<2686:38:54, 32.31s/it]training loss: 7.626e-03:   0%|          | 625/300001 [5:59:51<2693:57:31, 32.39s/it]training loss: 7.626e-03:   0%|          | 626/300001 [6:00:23<2680:38:20, 32.23s/it]training loss: 7.626e-03:   0%|          | 627/300001 [6:00:55<2684:13:03, 32.28s/it]training loss: 7.626e-03:   0%|          | 628/300001 [6:01:17<2422:03:36, 29.13s/it]training loss: 7.626e-03:   0%|          | 629/300001 [6:01:49<2504:02:40, 30.11s/it]training loss: 7.626e-03:   0%|          | 630/300001 [6:02:21<2540:29:04, 30.55s/it]training loss: 7.626e-03:   0%|          | 631/300001 [6:02:55<2619:45:38, 31.50s/it]training loss: 7.626e-03:   0%|          | 632/300001 [6:03:26<2611:44:46, 31.41s/it]training loss: 7.626e-03:   0%|          | 633/300001 [6:03:58<2639:21:10, 31.74s/it]training loss: 7.626e-03:   0%|          | 634/300001 [6:04:31<2651:07:05, 31.88s/it]training loss: 7.626e-03:   0%|          | 635/300001 [6:05:03<2665:44:16, 32.06s/it]training loss: 7.626e-03:   0%|          | 636/300001 [6:05:35<2668:16:07, 32.09s/it]training loss: 7.626e-03:   0%|          | 637/300001 [6:06:09<2706:05:06, 32.54s/it]training loss: 7.626e-03:   0%|          | 638/300001 [6:06:41<2701:54:50, 32.49s/it]training loss: 7.626e-03:   0%|          | 639/300001 [6:07:14<2716:28:40, 32.67s/it]training loss: 7.626e-03:   0%|          | 640/300001 [6:07:47<2708:24:55, 32.57s/it]training loss: 7.198e-03:   0%|          | 640/300001 [6:08:18<2708:24:55, 32.57s/it]training loss: 7.198e-03:   0%|          | 641/300001 [6:08:18<2670:46:59, 32.12s/it]training loss: 7.198e-03:   0%|          | 642/300001 [6:08:51<2700:48:48, 32.48s/it]training loss: 7.198e-03:   0%|          | 643/300001 [6:09:23<2689:25:00, 32.34s/it]training loss: 7.198e-03:   0%|          | 644/300001 [6:09:55<2671:58:25, 32.13s/it]training loss: 7.198e-03:   0%|          | 645/300001 [6:10:27<2682:48:12, 32.26s/it]training loss: 7.198e-03:   0%|          | 646/300001 [6:11:01<2707:04:40, 32.55s/it]training loss: 7.198e-03:   0%|          | 647/300001 [6:11:33<2700:10:37, 32.47s/it]training loss: 7.198e-03:   0%|          | 648/300001 [6:12:05<2699:55:18, 32.47s/it]training loss: 7.198e-03:   0%|          | 649/300001 [6:12:37<2692:51:19, 32.38s/it]training loss: 7.198e-03:   0%|          | 650/300001 [6:13:11<2715:33:40, 32.66s/it]training loss: 7.198e-03:   0%|          | 651/300001 [6:13:43<2702:06:30, 32.50s/it]training loss: 7.198e-03:   0%|          | 652/300001 [6:14:16<2705:41:05, 32.54s/it]training loss: 7.198e-03:   0%|          | 653/300001 [6:14:48<2697:54:22, 32.45s/it]training loss: 7.198e-03:   0%|          | 654/300001 [6:15:20<2689:45:11, 32.35s/it]training loss: 7.198e-03:   0%|          | 655/300001 [6:15:52<2690:23:30, 32.36s/it]training loss: 7.198e-03:   0%|          | 656/300001 [6:16:24<2679:16:26, 32.22s/it]training loss: 7.198e-03:   0%|          | 657/300001 [6:16:56<2675:59:18, 32.18s/it]training loss: 7.198e-03:   0%|          | 658/300001 [6:17:30<2706:31:51, 32.55s/it]training loss: 7.198e-03:   0%|          | 659/300001 [6:18:02<2706:39:23, 32.55s/it]training loss: 7.198e-03:   0%|          | 660/300001 [6:18:33<2670:54:46, 32.12s/it]training loss: 8.114e-03:   0%|          | 660/300001 [6:19:06<2670:54:46, 32.12s/it]training loss: 8.114e-03:   0%|          | 661/300001 [6:19:06<2676:59:26, 32.19s/it]training loss: 8.114e-03:   0%|          | 662/300001 [6:19:37<2665:00:59, 32.05s/it]training loss: 8.114e-03:   0%|          | 663/300001 [6:20:08<2639:48:44, 31.75s/it]training loss: 8.114e-03:   0%|          | 664/300001 [6:20:40<2633:43:55, 31.67s/it]training loss: 8.114e-03:   0%|          | 665/300001 [6:21:13<2657:49:26, 31.96s/it]training loss: 8.114e-03:   0%|          | 666/300001 [6:21:46<2682:41:19, 32.26s/it]training loss: 8.114e-03:   0%|          | 667/300001 [6:22:17<2661:49:10, 32.01s/it]training loss: 8.114e-03:   0%|          | 668/300001 [6:22:50<2690:16:22, 32.36s/it]training loss: 8.114e-03:   0%|          | 669/300001 [6:23:22<2683:48:37, 32.28s/it]training loss: 8.114e-03:   0%|          | 670/300001 [6:23:54<2669:06:12, 32.10s/it]training loss: 8.114e-03:   0%|          | 671/300001 [6:24:26<2675:08:38, 32.17s/it]training loss: 8.114e-03:   0%|          | 672/300001 [6:24:59<2692:51:53, 32.39s/it]training loss: 8.114e-03:   0%|          | 673/300001 [6:25:33<2718:00:42, 32.69s/it]training loss: 8.114e-03:   0%|          | 674/300001 [6:26:05<2717:57:48, 32.69s/it]training loss: 8.114e-03:   0%|          | 675/300001 [6:26:38<2712:51:48, 32.63s/it]training loss: 8.114e-03:   0%|          | 676/300001 [6:27:09<2689:24:30, 32.35s/it]training loss: 8.114e-03:   0%|          | 677/300001 [6:27:41<2669:26:03, 32.11s/it]training loss: 8.114e-03:   0%|          | 678/300001 [6:28:13<2671:56:35, 32.14s/it]training loss: 8.114e-03:   0%|          | 679/300001 [6:28:45<2672:51:42, 32.15s/it]training loss: 8.114e-03:   0%|          | 680/300001 [6:29:18<2677:51:16, 32.21s/it]training loss: 8.454e-03:   0%|          | 680/300001 [6:29:49<2677:51:16, 32.21s/it]training loss: 8.454e-03:   0%|          | 681/300001 [6:29:49<2657:47:05, 31.97s/it]training loss: 8.454e-03:   0%|          | 682/300001 [6:30:21<2669:08:54, 32.10s/it]training loss: 8.454e-03:   0%|          | 683/300001 [6:30:53<2648:57:08, 31.86s/it]training loss: 8.454e-03:   0%|          | 684/300001 [6:31:25<2646:04:28, 31.83s/it]training loss: 8.454e-03:   0%|          | 685/300001 [6:31:57<2663:05:59, 32.03s/it]training loss: 8.454e-03:   0%|          | 686/300001 [6:32:28<2645:30:10, 31.82s/it]training loss: 8.454e-03:   0%|          | 687/300001 [6:32:59<2624:44:38, 31.57s/it]training loss: 8.454e-03:   0%|          | 688/300001 [6:33:32<2640:06:19, 31.75s/it]training loss: 8.454e-03:   0%|          | 689/300001 [6:34:03<2629:30:36, 31.63s/it]training loss: 8.454e-03:   0%|          | 690/300001 [6:34:35<2650:03:42, 31.87s/it]training loss: 8.454e-03:   0%|          | 691/300001 [6:35:09<2695:55:07, 32.43s/it]training loss: 8.454e-03:   0%|          | 692/300001 [6:35:42<2713:40:11, 32.64s/it]training loss: 8.454e-03:   0%|          | 693/300001 [6:36:14<2692:18:35, 32.38s/it]training loss: 8.454e-03:   0%|          | 694/300001 [6:36:48<2721:57:36, 32.74s/it]training loss: 8.454e-03:   0%|          | 695/300001 [6:37:20<2718:50:49, 32.70s/it]training loss: 8.454e-03:   0%|          | 696/300001 [6:37:54<2736:15:55, 32.91s/it]training loss: 8.454e-03:   0%|          | 697/300001 [6:38:27<2749:28:00, 33.07s/it]training loss: 8.454e-03:   0%|          | 698/300001 [6:38:59<2731:22:18, 32.85s/it]training loss: 8.454e-03:   0%|          | 699/300001 [6:39:32<2719:32:28, 32.71s/it]training loss: 8.454e-03:   0%|          | 700/300001 [6:40:04<2718:24:32, 32.70s/it]training loss: 7.659e-03:   0%|          | 700/300001 [6:40:37<2718:24:32, 32.70s/it]training loss: 7.659e-03:   0%|          | 701/300001 [6:40:37<2727:41:42, 32.81s/it]training loss: 7.659e-03:   0%|          | 702/300001 [6:41:09<2688:01:49, 32.33s/it]training loss: 7.659e-03:   0%|          | 703/300001 [6:41:40<2668:03:32, 32.09s/it]training loss: 7.659e-03:   0%|          | 704/300001 [6:42:12<2671:10:41, 32.13s/it]training loss: 7.659e-03:   0%|          | 705/300001 [6:42:45<2671:28:01, 32.13s/it]training loss: 7.659e-03:   0%|          | 706/300001 [6:43:17<2668:31:24, 32.10s/it]training loss: 7.659e-03:   0%|          | 707/300001 [6:43:49<2669:54:58, 32.11s/it]training loss: 7.659e-03:   0%|          | 708/300001 [6:44:22<2695:47:05, 32.43s/it]training loss: 7.659e-03:   0%|          | 709/300001 [6:44:53<2675:15:47, 32.18s/it]training loss: 7.659e-03:   0%|          | 710/300001 [6:45:26<2677:43:17, 32.21s/it]training loss: 7.659e-03:   0%|          | 711/300001 [6:45:59<2696:57:26, 32.44s/it]training loss: 7.659e-03:   0%|          | 712/300001 [6:46:30<2665:35:53, 32.06s/it]training loss: 7.659e-03:   0%|          | 713/300001 [6:47:03<2696:09:16, 32.43s/it]training loss: 7.659e-03:   0%|          | 714/300001 [6:47:36<2707:06:20, 32.56s/it]training loss: 7.659e-03:   0%|          | 715/300001 [6:48:08<2701:04:07, 32.49s/it]training loss: 7.659e-03:   0%|          | 716/300001 [6:48:39<2666:27:25, 32.07s/it]training loss: 7.659e-03:   0%|          | 717/300001 [6:49:13<2702:32:44, 32.51s/it]training loss: 7.659e-03:   0%|          | 718/300001 [6:49:46<2710:33:52, 32.60s/it]training loss: 7.659e-03:   0%|          | 719/300001 [6:50:18<2699:35:46, 32.47s/it]training loss: 7.659e-03:   0%|          | 720/300001 [6:50:51<2704:29:13, 32.53s/it]training loss: 7.829e-03:   0%|          | 720/300001 [6:51:23<2704:29:13, 32.53s/it]training loss: 7.829e-03:   0%|          | 721/300001 [6:51:23<2709:11:10, 32.59s/it]training loss: 7.829e-03:   0%|          | 722/300001 [6:51:56<2711:13:35, 32.61s/it]training loss: 7.829e-03:   0%|          | 723/300001 [6:52:28<2687:49:01, 32.33s/it]training loss: 7.829e-03:   0%|          | 724/300001 [6:53:00<2675:43:17, 32.19s/it]training loss: 7.829e-03:   0%|          | 725/300001 [6:53:32<2683:56:34, 32.29s/it]training loss: 7.829e-03:   0%|          | 726/300001 [6:54:05<2687:30:32, 32.33s/it]training loss: 7.829e-03:   0%|          | 727/300001 [6:54:36<2676:52:39, 32.20s/it]training loss: 7.829e-03:   0%|          | 728/300001 [6:55:08<2673:03:46, 32.15s/it]training loss: 7.829e-03:   0%|          | 729/300001 [6:55:41<2686:09:09, 32.31s/it]training loss: 7.829e-03:   0%|          | 730/300001 [6:56:12<2660:55:35, 32.01s/it]training loss: 7.829e-03:   0%|          | 731/300001 [6:56:44<2646:10:17, 31.83s/it]training loss: 7.829e-03:   0%|          | 732/300001 [6:57:16<2649:11:42, 31.87s/it]training loss: 7.829e-03:   0%|          | 733/300001 [6:57:49<2678:02:53, 32.22s/it]training loss: 7.829e-03:   0%|          | 734/300001 [6:58:21<2680:26:14, 32.24s/it]training loss: 7.829e-03:   0%|          | 735/300001 [6:58:54<2683:03:17, 32.28s/it]training loss: 7.829e-03:   0%|          | 736/300001 [6:59:26<2687:07:37, 32.32s/it]training loss: 7.829e-03:   0%|          | 737/300001 [6:59:59<2713:51:51, 32.65s/it]training loss: 7.829e-03:   0%|          | 738/300001 [7:00:32<2719:25:56, 32.71s/it]training loss: 7.829e-03:   0%|          | 739/300001 [7:01:05<2719:51:15, 32.72s/it]training loss: 7.829e-03:   0%|          | 740/300001 [7:01:38<2721:44:45, 32.74s/it]training loss: 7.182e-03:   0%|          | 740/300001 [7:02:09<2721:44:45, 32.74s/it]training loss: 7.182e-03:   0%|          | 741/300001 [7:02:09<2684:26:57, 32.29s/it]training loss: 7.182e-03:   0%|          | 742/300001 [7:02:41<2667:32:15, 32.09s/it]training loss: 7.182e-03:   0%|          | 743/300001 [7:03:13<2671:15:40, 32.13s/it]training loss: 7.182e-03:   0%|          | 744/300001 [7:03:45<2676:19:57, 32.20s/it]training loss: 7.182e-03:   0%|          | 745/300001 [7:04:18<2682:49:57, 32.27s/it]training loss: 7.182e-03:   0%|          | 746/300001 [7:04:50<2688:29:44, 32.34s/it]training loss: 7.182e-03:   0%|          | 747/300001 [7:05:22<2687:12:26, 32.33s/it]training loss: 7.182e-03:   0%|          | 748/300001 [7:05:55<2695:01:29, 32.42s/it]training loss: 7.182e-03:   0%|          | 749/300001 [7:06:28<2709:40:37, 32.60s/it]training loss: 7.182e-03:   0%|          | 750/300001 [7:07:01<2707:48:50, 32.58s/it]training loss: 7.182e-03:   0%|          | 751/300001 [7:07:33<2705:31:06, 32.55s/it]training loss: 7.182e-03:   0%|          | 752/300001 [7:08:06<2710:59:11, 32.61s/it]training loss: 7.182e-03:   0%|          | 753/300001 [7:08:39<2723:04:39, 32.76s/it]training loss: 7.182e-03:   0%|          | 754/300001 [7:09:11<2704:27:29, 32.54s/it]training loss: 7.182e-03:   0%|          | 755/300001 [7:09:42<2673:57:52, 32.17s/it]training loss: 7.182e-03:   0%|          | 756/300001 [7:10:13<2631:11:36, 31.65s/it]training loss: 7.182e-03:   0%|          | 757/300001 [7:10:45<2647:21:39, 31.85s/it]training loss: 7.182e-03:   0%|          | 758/300001 [7:11:17<2642:07:31, 31.79s/it]training loss: 7.182e-03:   0%|          | 759/300001 [7:11:50<2679:02:32, 32.23s/it]training loss: 7.182e-03:   0%|          | 760/300001 [7:12:22<2683:27:13, 32.28s/it]training loss: 7.122e-03:   0%|          | 760/300001 [7:12:54<2683:27:13, 32.28s/it]training loss: 7.122e-03:   0%|          | 761/300001 [7:12:55<2680:39:46, 32.25s/it]training loss: 7.122e-03:   0%|          | 762/300001 [7:13:27<2679:40:44, 32.24s/it]training loss: 7.122e-03:   0%|          | 763/300001 [7:14:02<2754:03:28, 33.13s/it]training loss: 7.122e-03:   0%|          | 764/300001 [7:14:34<2716:40:57, 32.68s/it]training loss: 7.122e-03:   0%|          | 765/300001 [7:15:07<2743:23:03, 33.00s/it]training loss: 7.122e-03:   0%|          | 766/300001 [7:15:40<2741:31:33, 32.98s/it]training loss: 7.122e-03:   0%|          | 767/300001 [7:16:14<2759:27:27, 33.20s/it]training loss: 7.122e-03:   0%|          | 768/300001 [7:16:45<2712:26:41, 32.63s/it]training loss: 7.122e-03:   0%|          | 769/300001 [7:17:19<2737:08:13, 32.93s/it]training loss: 7.122e-03:   0%|          | 770/300001 [7:17:52<2731:32:51, 32.86s/it]training loss: 7.122e-03:   0%|          | 771/300001 [7:18:24<2726:30:54, 32.80s/it]training loss: 7.122e-03:   0%|          | 772/300001 [7:18:56<2703:38:41, 32.53s/it]training loss: 7.122e-03:   0%|          | 773/300001 [7:19:29<2715:16:07, 32.67s/it]training loss: 7.122e-03:   0%|          | 774/300001 [7:20:02<2729:00:40, 32.83s/it]training loss: 7.122e-03:   0%|          | 775/300001 [7:20:34<2696:36:30, 32.44s/it]training loss: 7.122e-03:   0%|          | 776/300001 [7:21:06<2689:42:36, 32.36s/it]training loss: 7.122e-03:   0%|          | 777/300001 [7:21:40<2734:45:50, 32.90s/it]training loss: 7.122e-03:   0%|          | 778/300001 [7:22:13<2720:39:20, 32.73s/it]training loss: 7.122e-03:   0%|          | 779/300001 [7:22:44<2695:31:51, 32.43s/it]training loss: 7.122e-03:   0%|          | 780/300001 [7:23:17<2691:53:34, 32.39s/it]training loss: 7.272e-03:   0%|          | 780/300001 [7:23:50<2691:53:34, 32.39s/it]training loss: 7.272e-03:   0%|          | 781/300001 [7:23:50<2710:39:30, 32.61s/it]training loss: 7.272e-03:   0%|          | 782/300001 [7:24:22<2701:51:02, 32.51s/it]training loss: 7.272e-03:   0%|          | 783/300001 [7:24:53<2666:55:18, 32.09s/it]training loss: 7.272e-03:   0%|          | 784/300001 [7:25:26<2687:12:14, 32.33s/it]training loss: 7.272e-03:   0%|          | 785/300001 [7:25:48<2429:32:12, 29.23s/it]training loss: 7.272e-03:   0%|          | 786/300001 [7:26:20<2492:45:17, 29.99s/it]training loss: 7.272e-03:   0%|          | 787/300001 [7:26:53<2575:17:38, 30.98s/it]training loss: 7.272e-03:   0%|          | 788/300001 [7:27:25<2601:44:46, 31.30s/it]training loss: 7.272e-03:   0%|          | 789/300001 [7:27:58<2639:47:00, 31.76s/it]training loss: 7.272e-03:   0%|          | 790/300001 [7:28:31<2665:41:25, 32.07s/it]training loss: 7.272e-03:   0%|          | 791/300001 [7:29:03<2668:43:38, 32.11s/it]training loss: 7.272e-03:   0%|          | 792/300001 [7:29:36<2693:43:49, 32.41s/it]training loss: 7.272e-03:   0%|          | 793/300001 [7:30:08<2694:18:56, 32.42s/it]training loss: 7.272e-03:   0%|          | 794/300001 [7:30:41<2691:59:41, 32.39s/it]training loss: 7.272e-03:   0%|          | 795/300001 [7:31:14<2702:05:12, 32.51s/it]training loss: 7.272e-03:   0%|          | 796/300001 [7:31:46<2695:15:49, 32.43s/it]training loss: 7.272e-03:   0%|          | 797/300001 [7:32:19<2714:12:15, 32.66s/it]training loss: 7.272e-03:   0%|          | 798/300001 [7:32:50<2672:11:52, 32.15s/it]training loss: 7.272e-03:   0%|          | 799/300001 [7:33:23<2695:31:08, 32.43s/it]training loss: 7.272e-03:   0%|          | 800/300001 [7:33:55<2689:35:19, 32.36s/it]training loss: 6.817e-03:   0%|          | 800/300001 [7:34:28<2689:35:19, 32.36s/it]training loss: 6.817e-03:   0%|          | 801/300001 [7:34:28<2693:32:54, 32.41s/it]training loss: 6.817e-03:   0%|          | 802/300001 [7:35:00<2685:15:33, 32.31s/it]training loss: 6.817e-03:   0%|          | 803/300001 [7:35:32<2689:04:34, 32.36s/it]training loss: 6.817e-03:   0%|          | 804/300001 [7:36:05<2689:34:40, 32.36s/it]training loss: 6.817e-03:   0%|          | 805/300001 [7:36:37<2693:08:30, 32.40s/it]training loss: 6.817e-03:   0%|          | 806/300001 [7:37:09<2667:21:28, 32.09s/it]training loss: 6.817e-03:   0%|          | 807/300001 [7:37:41<2681:47:15, 32.27s/it]training loss: 6.817e-03:   0%|          | 808/300001 [7:38:13<2680:06:44, 32.25s/it]training loss: 6.817e-03:   0%|          | 809/300001 [7:38:46<2679:45:12, 32.24s/it]training loss: 6.817e-03:   0%|          | 810/300001 [7:39:19<2706:30:47, 32.57s/it]training loss: 6.817e-03:   0%|          | 811/300001 [7:39:52<2720:25:24, 32.73s/it]training loss: 6.817e-03:   0%|          | 812/300001 [7:40:24<2708:42:38, 32.59s/it]training loss: 6.817e-03:   0%|          | 813/300001 [7:40:57<2713:23:21, 32.65s/it]training loss: 6.817e-03:   0%|          | 814/300001 [7:41:29<2695:14:04, 32.43s/it]training loss: 6.817e-03:   0%|          | 815/300001 [7:42:02<2717:54:40, 32.70s/it]training loss: 6.817e-03:   0%|          | 816/300001 [7:42:34<2693:26:19, 32.41s/it]training loss: 6.817e-03:   0%|          | 817/300001 [7:43:06<2667:51:38, 32.10s/it]training loss: 6.817e-03:   0%|          | 818/300001 [7:43:39<2694:59:51, 32.43s/it]training loss: 6.817e-03:   0%|          | 819/300001 [7:44:12<2706:03:28, 32.56s/it]training loss: 6.817e-03:   0%|          | 820/300001 [7:44:45<2725:36:03, 32.80s/it]training loss: 8.380e-03:   0%|          | 820/300001 [7:45:17<2725:36:03, 32.80s/it]training loss: 8.380e-03:   0%|          | 821/300001 [7:45:17<2703:32:41, 32.53s/it]training loss: 8.380e-03:   0%|          | 822/300001 [7:45:49<2687:05:14, 32.33s/it]training loss: 8.380e-03:   0%|          | 823/300001 [7:46:21<2677:37:45, 32.22s/it]training loss: 8.380e-03:   0%|          | 824/300001 [7:46:53<2683:58:26, 32.30s/it]training loss: 8.380e-03:   0%|          | 825/300001 [7:47:26<2684:44:46, 32.31s/it]training loss: 8.380e-03:   0%|          | 826/300001 [7:47:57<2676:03:00, 32.20s/it]training loss: 8.380e-03:   0%|          | 827/300001 [7:48:29<2655:24:44, 31.95s/it]training loss: 8.380e-03:   0%|          | 828/300001 [7:49:01<2668:39:36, 32.11s/it]training loss: 8.380e-03:   0%|          | 829/300001 [7:49:34<2675:51:24, 32.20s/it]training loss: 8.380e-03:   0%|          | 830/300001 [7:50:05<2654:27:52, 31.94s/it]training loss: 8.380e-03:   0%|          | 831/300001 [7:50:37<2648:06:03, 31.87s/it]training loss: 8.380e-03:   0%|          | 832/300001 [7:51:11<2708:20:51, 32.59s/it]training loss: 8.380e-03:   0%|          | 833/300001 [7:51:44<2722:07:56, 32.76s/it]training loss: 8.380e-03:   0%|          | 834/300001 [7:52:16<2710:50:18, 32.62s/it]training loss: 8.380e-03:   0%|          | 835/300001 [7:52:48<2677:35:20, 32.22s/it]training loss: 8.380e-03:   0%|          | 836/300001 [7:53:21<2694:16:30, 32.42s/it]training loss: 8.380e-03:   0%|          | 837/300001 [7:53:54<2706:07:09, 32.56s/it]training loss: 8.380e-03:   0%|          | 838/300001 [7:54:27<2715:42:46, 32.68s/it]training loss: 8.380e-03:   0%|          | 839/300001 [7:54:58<2688:09:15, 32.35s/it]training loss: 8.380e-03:   0%|          | 840/300001 [7:55:31<2694:21:49, 32.42s/it]training loss: 6.932e-03:   0%|          | 840/300001 [7:56:04<2694:21:49, 32.42s/it]training loss: 6.932e-03:   0%|          | 841/300001 [7:56:04<2720:15:59, 32.73s/it]training loss: 6.932e-03:   0%|          | 842/300001 [7:56:37<2722:33:23, 32.76s/it]training loss: 6.932e-03:   0%|          | 843/300001 [7:57:12<2774:44:13, 33.39s/it]training loss: 6.932e-03:   0%|          | 844/300001 [7:57:44<2743:45:01, 33.02s/it]training loss: 6.932e-03:   0%|          | 845/300001 [7:58:17<2739:45:51, 32.97s/it]training loss: 6.932e-03:   0%|          | 846/300001 [7:58:50<2733:24:02, 32.89s/it]training loss: 6.932e-03:   0%|          | 847/300001 [7:59:22<2713:16:22, 32.65s/it]training loss: 6.932e-03:   0%|          | 848/300001 [7:59:54<2708:06:17, 32.59s/it]training loss: 6.932e-03:   0%|          | 849/300001 [8:00:25<2672:25:29, 32.16s/it]training loss: 6.932e-03:   0%|          | 850/300001 [8:00:58<2681:58:53, 32.28s/it]training loss: 6.932e-03:   0%|          | 851/300001 [8:01:31<2706:00:58, 32.56s/it]training loss: 6.932e-03:   0%|          | 852/300001 [8:02:04<2718:28:31, 32.71s/it]training loss: 6.932e-03:   0%|          | 853/300001 [8:02:36<2697:49:04, 32.47s/it]training loss: 6.932e-03:   0%|          | 854/300001 [8:03:09<2702:00:16, 32.52s/it]training loss: 6.932e-03:   0%|          | 855/300001 [8:03:42<2713:57:39, 32.66s/it]training loss: 6.932e-03:   0%|          | 856/300001 [8:04:14<2707:23:19, 32.58s/it]training loss: 6.932e-03:   0%|          | 857/300001 [8:04:46<2700:35:03, 32.50s/it]training loss: 6.932e-03:   0%|          | 858/300001 [8:05:19<2714:42:59, 32.67s/it]training loss: 6.932e-03:   0%|          | 859/300001 [8:05:51<2699:56:57, 32.49s/it]training loss: 6.932e-03:   0%|          | 860/300001 [8:06:25<2714:27:38, 32.67s/it]training loss: 7.668e-03:   0%|          | 860/300001 [8:06:58<2714:27:38, 32.67s/it]training loss: 7.668e-03:   0%|          | 861/300001 [8:06:58<2735:51:41, 32.92s/it]training loss: 7.668e-03:   0%|          | 862/300001 [8:07:30<2713:13:13, 32.65s/it]training loss: 7.668e-03:   0%|          | 863/300001 [8:08:02<2697:55:43, 32.47s/it]training loss: 7.668e-03:   0%|          | 864/300001 [8:08:35<2713:44:29, 32.66s/it]training loss: 7.668e-03:   0%|          | 865/300001 [8:09:07<2697:59:33, 32.47s/it]training loss: 7.668e-03:   0%|          | 866/300001 [8:09:39<2685:02:08, 32.31s/it]training loss: 7.668e-03:   0%|          | 867/300001 [8:10:13<2710:32:02, 32.62s/it]training loss: 7.668e-03:   0%|          | 868/300001 [8:10:44<2678:33:09, 32.24s/it]training loss: 7.668e-03:   0%|          | 869/300001 [8:11:16<2671:24:58, 32.15s/it]training loss: 7.668e-03:   0%|          | 870/300001 [8:11:49<2686:33:43, 32.33s/it]training loss: 7.668e-03:   0%|          | 871/300001 [8:12:21<2681:34:44, 32.27s/it]training loss: 7.668e-03:   0%|          | 872/300001 [8:12:53<2687:29:42, 32.34s/it]training loss: 7.668e-03:   0%|          | 873/300001 [8:13:25<2663:05:12, 32.05s/it]training loss: 7.668e-03:   0%|          | 874/300001 [8:13:56<2652:05:31, 31.92s/it]training loss: 7.668e-03:   0%|          | 875/300001 [8:14:28<2659:02:02, 32.00s/it]training loss: 7.668e-03:   0%|          | 876/300001 [8:15:01<2678:59:35, 32.24s/it]training loss: 7.668e-03:   0%|          | 877/300001 [8:15:33<2675:13:59, 32.20s/it]training loss: 7.668e-03:   0%|          | 878/300001 [8:16:06<2676:05:34, 32.21s/it]training loss: 7.668e-03:   0%|          | 879/300001 [8:16:37<2652:01:01, 31.92s/it]training loss: 7.668e-03:   0%|          | 880/300001 [8:17:09<2665:11:38, 32.08s/it]training loss: 7.367e-03:   0%|          | 880/300001 [8:17:43<2665:11:38, 32.08s/it]training loss: 7.367e-03:   0%|          | 881/300001 [8:17:43<2706:58:09, 32.58s/it]training loss: 7.367e-03:   0%|          | 882/300001 [8:18:17<2732:57:13, 32.89s/it]training loss: 7.367e-03:   0%|          | 883/300001 [8:18:49<2717:32:55, 32.71s/it]training loss: 7.367e-03:   0%|          | 884/300001 [8:19:21<2700:34:11, 32.50s/it]training loss: 7.367e-03:   0%|          | 885/300001 [8:19:54<2710:02:02, 32.62s/it]training loss: 7.367e-03:   0%|          | 886/300001 [8:20:25<2664:23:21, 32.07s/it]training loss: 7.367e-03:   0%|          | 887/300001 [8:20:57<2665:55:57, 32.09s/it]training loss: 7.367e-03:   0%|          | 888/300001 [8:21:29<2667:18:48, 32.10s/it]training loss: 7.367e-03:   0%|          | 889/300001 [8:22:01<2681:11:24, 32.27s/it]training loss: 7.367e-03:   0%|          | 890/300001 [8:22:33<2660:37:19, 32.02s/it]training loss: 7.367e-03:   0%|          | 891/300001 [8:23:06<2674:35:17, 32.19s/it]training loss: 7.367e-03:   0%|          | 892/300001 [8:23:38<2682:11:41, 32.28s/it]training loss: 7.367e-03:   0%|          | 893/300001 [8:24:12<2719:10:40, 32.73s/it]training loss: 7.367e-03:   0%|          | 894/300001 [8:24:45<2730:15:53, 32.86s/it]training loss: 7.367e-03:   0%|          | 895/300001 [8:25:17<2705:31:00, 32.56s/it]training loss: 7.367e-03:   0%|          | 896/300001 [8:25:48<2681:36:10, 32.28s/it]training loss: 7.367e-03:   0%|          | 897/300001 [8:26:20<2661:18:46, 32.03s/it]training loss: 7.367e-03:   0%|          | 898/300001 [8:26:53<2699:15:54, 32.49s/it]training loss: 7.367e-03:   0%|          | 899/300001 [8:27:26<2692:49:14, 32.41s/it]training loss: 7.367e-03:   0%|          | 900/300001 [8:27:58<2689:09:36, 32.37s/it]training loss: 6.462e-03:   0%|          | 900/300001 [8:28:30<2689:09:36, 32.37s/it]training loss: 6.462e-03:   0%|          | 901/300001 [8:28:30<2685:26:00, 32.32s/it]training loss: 6.462e-03:   0%|          | 902/300001 [8:29:02<2682:58:04, 32.29s/it]training loss: 6.462e-03:   0%|          | 903/300001 [8:29:35<2679:14:43, 32.25s/it]training loss: 6.462e-03:   0%|          | 904/300001 [8:30:07<2687:53:59, 32.35s/it]training loss: 6.462e-03:   0%|          | 905/300001 [8:30:39<2687:57:45, 32.35s/it]training loss: 6.462e-03:   0%|          | 906/300001 [8:31:12<2683:46:35, 32.30s/it]training loss: 6.462e-03:   0%|          | 907/300001 [8:31:44<2680:35:18, 32.26s/it]training loss: 6.462e-03:   0%|          | 908/300001 [8:32:16<2689:02:20, 32.37s/it]training loss: 6.462e-03:   0%|          | 909/300001 [8:32:49<2682:45:04, 32.29s/it]training loss: 6.462e-03:   0%|          | 910/300001 [8:33:21<2674:57:18, 32.20s/it]training loss: 6.462e-03:   0%|          | 911/300001 [8:33:54<2700:26:33, 32.50s/it]training loss: 6.462e-03:   0%|          | 912/300001 [8:34:25<2669:38:09, 32.13s/it]training loss: 6.462e-03:   0%|          | 913/300001 [8:34:57<2665:41:55, 32.09s/it]training loss: 6.462e-03:   0%|          | 914/300001 [8:35:30<2698:39:45, 32.48s/it]training loss: 6.462e-03:   0%|          | 915/300001 [8:36:04<2716:19:50, 32.70s/it]training loss: 6.462e-03:   0%|          | 916/300001 [8:36:36<2702:10:52, 32.53s/it]training loss: 6.462e-03:   0%|          | 917/300001 [8:37:08<2685:26:56, 32.32s/it]training loss: 6.462e-03:   0%|          | 918/300001 [8:37:38<2643:29:01, 31.82s/it]training loss: 6.462e-03:   0%|          | 919/300001 [8:38:10<2644:31:53, 31.83s/it]training loss: 6.462e-03:   0%|          | 920/300001 [8:38:43<2667:17:16, 32.11s/it]training loss: 6.883e-03:   0%|          | 920/300001 [8:39:15<2667:17:16, 32.11s/it]training loss: 6.883e-03:   0%|          | 921/300001 [8:39:15<2670:18:47, 32.14s/it]training loss: 6.883e-03:   0%|          | 922/300001 [8:39:48<2689:31:45, 32.37s/it]training loss: 6.883e-03:   0%|          | 923/300001 [8:40:19<2658:27:14, 32.00s/it]training loss: 6.883e-03:   0%|          | 924/300001 [8:40:52<2672:13:02, 32.17s/it]training loss: 6.883e-03:   0%|          | 925/300001 [8:41:24<2680:26:59, 32.26s/it]training loss: 6.883e-03:   0%|          | 926/300001 [8:41:56<2671:50:50, 32.16s/it]training loss: 6.883e-03:   0%|          | 927/300001 [8:42:28<2677:37:22, 32.23s/it]training loss: 6.883e-03:   0%|          | 928/300001 [8:43:01<2674:17:53, 32.19s/it]training loss: 6.883e-03:   0%|          | 929/300001 [8:43:32<2655:30:36, 31.96s/it]training loss: 6.883e-03:   0%|          | 930/300001 [8:44:05<2672:02:28, 32.16s/it]training loss: 6.883e-03:   0%|          | 931/300001 [8:44:37<2676:10:25, 32.21s/it]training loss: 6.883e-03:   0%|          | 932/300001 [8:45:09<2671:14:07, 32.15s/it]training loss: 6.883e-03:   0%|          | 933/300001 [8:45:42<2703:10:47, 32.54s/it]training loss: 6.883e-03:   0%|          | 934/300001 [8:46:14<2683:41:54, 32.30s/it]training loss: 6.883e-03:   0%|          | 935/300001 [8:46:46<2668:22:37, 32.12s/it]training loss: 6.883e-03:   0%|          | 936/300001 [8:47:19<2693:46:25, 32.43s/it]training loss: 6.883e-03:   0%|          | 937/300001 [8:47:52<2710:23:24, 32.63s/it]training loss: 6.883e-03:   0%|          | 938/300001 [8:48:25<2722:22:41, 32.77s/it]training loss: 6.883e-03:   0%|          | 939/300001 [8:48:58<2723:10:06, 32.78s/it]training loss: 6.883e-03:   0%|          | 940/300001 [8:49:32<2745:27:43, 33.05s/it]training loss: 7.860e-03:   0%|          | 940/300001 [8:50:04<2745:27:43, 33.05s/it]training loss: 7.860e-03:   0%|          | 941/300001 [8:50:04<2719:32:00, 32.74s/it]training loss: 7.860e-03:   0%|          | 942/300001 [8:50:26<2450:21:35, 29.50s/it]training loss: 7.860e-03:   0%|          | 943/300001 [8:50:58<2516:39:14, 30.29s/it]training loss: 7.860e-03:   0%|          | 944/300001 [8:51:32<2602:38:43, 31.33s/it]training loss: 7.860e-03:   0%|          | 945/300001 [8:52:04<2631:40:00, 31.68s/it]training loss: 7.860e-03:   0%|          | 946/300001 [8:52:35<2615:29:03, 31.48s/it]training loss: 7.860e-03:   0%|          | 947/300001 [8:53:07<2634:13:33, 31.71s/it]training loss: 7.860e-03:   0%|          | 948/300001 [8:53:40<2665:34:27, 32.09s/it]training loss: 7.860e-03:   0%|          | 949/300001 [8:54:13<2677:49:31, 32.24s/it]training loss: 7.860e-03:   0%|          | 950/300001 [8:54:45<2678:45:15, 32.25s/it]training loss: 7.860e-03:   0%|          | 951/300001 [8:55:16<2648:47:35, 31.89s/it]training loss: 7.860e-03:   0%|          | 952/300001 [8:55:48<2649:22:13, 31.89s/it]training loss: 7.860e-03:   0%|          | 953/300001 [8:56:20<2649:37:51, 31.90s/it]training loss: 7.860e-03:   0%|          | 954/300001 [8:56:53<2680:36:44, 32.27s/it]training loss: 7.860e-03:   0%|          | 955/300001 [8:57:26<2692:36:08, 32.41s/it]training loss: 7.860e-03:   0%|          | 956/300001 [8:57:59<2703:10:58, 32.54s/it]training loss: 7.860e-03:   0%|          | 957/300001 [8:58:32<2725:10:13, 32.81s/it]training loss: 7.860e-03:   0%|          | 958/300001 [8:59:04<2705:52:21, 32.57s/it]training loss: 7.860e-03:   0%|          | 959/300001 [8:59:38<2745:11:20, 33.05s/it]training loss: 7.860e-03:   0%|          | 960/300001 [9:00:11<2735:32:54, 32.93s/it]training loss: 7.030e-03:   0%|          | 960/300001 [9:00:44<2735:32:54, 32.93s/it]training loss: 7.030e-03:   0%|          | 961/300001 [9:00:44<2734:08:09, 32.91s/it]training loss: 7.030e-03:   0%|          | 962/300001 [9:01:16<2719:50:44, 32.74s/it]training loss: 7.030e-03:   0%|          | 963/300001 [9:01:48<2695:53:09, 32.45s/it]training loss: 7.030e-03:   0%|          | 964/300001 [9:02:19<2662:45:39, 32.06s/it]training loss: 7.030e-03:   0%|          | 965/300001 [9:02:53<2699:40:34, 32.50s/it]training loss: 7.030e-03:   0%|          | 966/300001 [9:03:25<2704:54:57, 32.56s/it]training loss: 7.030e-03:   0%|          | 967/300001 [9:03:57<2681:32:44, 32.28s/it]training loss: 7.030e-03:   0%|          | 968/300001 [9:04:29<2681:27:14, 32.28s/it]training loss: 7.030e-03:   0%|          | 969/300001 [9:05:01<2674:03:36, 32.19s/it]training loss: 7.030e-03:   0%|          | 970/300001 [9:05:33<2659:36:38, 32.02s/it]training loss: 7.030e-03:   0%|          | 971/300001 [9:06:06<2677:50:52, 32.24s/it]training loss: 7.030e-03:   0%|          | 972/300001 [9:06:38<2679:28:41, 32.26s/it]training loss: 7.030e-03:   0%|          | 973/300001 [9:07:12<2717:41:07, 32.72s/it]training loss: 7.030e-03:   0%|          | 974/300001 [9:07:44<2719:10:47, 32.74s/it]training loss: 7.030e-03:   0%|          | 975/300001 [9:08:17<2702:44:59, 32.54s/it]training loss: 7.030e-03:   0%|          | 976/300001 [9:08:49<2709:30:57, 32.62s/it]training loss: 7.030e-03:   0%|          | 977/300001 [9:09:22<2704:35:05, 32.56s/it]training loss: 7.030e-03:   0%|          | 978/300001 [9:09:54<2706:39:43, 32.59s/it]training loss: 7.030e-03:   0%|          | 979/300001 [9:10:26<2685:18:39, 32.33s/it]training loss: 7.030e-03:   0%|          | 980/300001 [9:10:58<2665:26:52, 32.09s/it]training loss: 8.535e-03:   0%|          | 980/300001 [9:11:31<2665:26:52, 32.09s/it]training loss: 8.535e-03:   0%|          | 981/300001 [9:11:31<2691:06:47, 32.40s/it]training loss: 8.535e-03:   0%|          | 982/300001 [9:12:02<2668:13:21, 32.12s/it]training loss: 8.535e-03:   0%|          | 983/300001 [9:12:35<2694:17:55, 32.44s/it]training loss: 8.535e-03:   0%|          | 984/300001 [9:13:07<2660:09:49, 32.03s/it]training loss: 8.535e-03:   0%|          | 985/300001 [9:13:40<2691:19:28, 32.40s/it]training loss: 8.535e-03:   0%|          | 986/300001 [9:14:12<2698:02:31, 32.48s/it]training loss: 8.535e-03:   0%|          | 987/300001 [9:14:45<2701:55:08, 32.53s/it]training loss: 8.535e-03:   0%|          | 988/300001 [9:15:18<2701:38:37, 32.53s/it]training loss: 8.535e-03:   0%|          | 989/300001 [9:15:50<2690:15:24, 32.39s/it]training loss: 8.535e-03:   0%|          | 990/300001 [9:16:23<2711:08:57, 32.64s/it]training loss: 8.535e-03:   0%|          | 991/300001 [9:16:56<2711:12:41, 32.64s/it]training loss: 8.535e-03:   0%|          | 992/300001 [9:17:28<2706:47:39, 32.59s/it]training loss: 8.535e-03:   0%|          | 993/300001 [9:18:00<2696:50:41, 32.47s/it]training loss: 8.535e-03:   0%|          | 994/300001 [9:18:33<2696:49:41, 32.47s/it]training loss: 8.535e-03:   0%|          | 995/300001 [9:19:05<2684:42:36, 32.32s/it]training loss: 8.535e-03:   0%|          | 996/300001 [9:19:37<2689:48:50, 32.39s/it]training loss: 8.535e-03:   0%|          | 997/300001 [9:20:09<2686:24:07, 32.34s/it]training loss: 8.535e-03:   0%|          | 998/300001 [9:20:41<2660:16:16, 32.03s/it]training loss: 8.535e-03:   0%|          | 999/300001 [9:21:15<2703:26:03, 32.55s/it]training loss: 8.535e-03:   0%|          | 1000/300001 [9:21:47<2697:34:37, 32.48s/it]training loss: 6.867e-03:   0%|          | 1000/300001 [9:22:19<2697:34:37, 32.48s/it]training loss: 6.867e-03:   0%|          | 1001/300001 [9:22:23<2781:34:46, 33.49s/it]training loss: 6.867e-03:   0%|          | 1002/300001 [9:22:54<2726:12:29, 32.82s/it]training loss: 6.867e-03:   0%|          | 1003/300001 [9:23:27<2719:34:36, 32.74s/it]training loss: 6.867e-03:   0%|          | 1004/300001 [9:23:58<2693:22:09, 32.43s/it]training loss: 6.867e-03:   0%|          | 1005/300001 [9:24:29<2664:21:42, 32.08s/it]training loss: 6.867e-03:   0%|          | 1006/300001 [9:25:03<2699:06:17, 32.50s/it]training loss: 6.867e-03:   0%|          | 1007/300001 [9:25:35<2692:43:14, 32.42s/it]training loss: 6.867e-03:   0%|          | 1008/300001 [9:26:07<2680:03:27, 32.27s/it]training loss: 6.867e-03:   0%|          | 1009/300001 [9:26:39<2673:27:50, 32.19s/it]training loss: 6.867e-03:   0%|          | 1010/300001 [9:27:11<2663:54:05, 32.07s/it]training loss: 6.867e-03:   0%|          | 1011/300001 [9:27:44<2681:14:31, 32.28s/it]training loss: 6.867e-03:   0%|          | 1012/300001 [9:28:16<2693:59:06, 32.44s/it]training loss: 6.867e-03:   0%|          | 1013/300001 [9:28:49<2688:03:09, 32.37s/it]training loss: 6.867e-03:   0%|          | 1014/300001 [9:29:22<2702:06:20, 32.54s/it]training loss: 6.867e-03:   0%|          | 1015/300001 [9:29:54<2691:19:04, 32.41s/it]training loss: 6.867e-03:   0%|          | 1016/300001 [9:30:25<2671:11:17, 32.16s/it]training loss: 6.867e-03:   0%|          | 1017/300001 [9:30:58<2673:58:33, 32.20s/it]training loss: 6.867e-03:   0%|          | 1018/300001 [9:31:29<2663:11:44, 32.07s/it]training loss: 6.867e-03:   0%|          | 1019/300001 [9:32:02<2665:41:57, 32.10s/it]training loss: 6.867e-03:   0%|          | 1020/300001 [9:32:34<2670:25:18, 32.15s/it]training loss: 7.214e-03:   0%|          | 1020/300001 [9:33:06<2670:25:18, 32.15s/it]training loss: 7.214e-03:   0%|          | 1021/300001 [9:33:06<2680:01:43, 32.27s/it]training loss: 7.214e-03:   0%|          | 1022/300001 [9:33:38<2676:36:01, 32.23s/it]training loss: 7.214e-03:   0%|          | 1023/300001 [9:34:12<2696:52:07, 32.47s/it]training loss: 7.214e-03:   0%|          | 1024/300001 [9:34:44<2698:39:43, 32.49s/it]training loss: 7.214e-03:   0%|          | 1025/300001 [9:35:16<2695:10:58, 32.45s/it]training loss: 7.214e-03:   0%|          | 1026/300001 [9:35:49<2706:16:58, 32.59s/it]training loss: 7.214e-03:   0%|          | 1027/300001 [9:36:22<2699:56:45, 32.51s/it]training loss: 7.214e-03:   0%|          | 1028/300001 [9:36:54<2693:11:52, 32.43s/it]training loss: 7.214e-03:   0%|          | 1029/300001 [9:37:28<2735:26:50, 32.94s/it]training loss: 7.214e-03:   0%|          | 1030/300001 [9:38:00<2712:38:46, 32.66s/it]training loss: 7.214e-03:   0%|          | 1031/300001 [9:38:32<2707:17:48, 32.60s/it]training loss: 7.214e-03:   0%|          | 1032/300001 [9:39:06<2724:00:29, 32.80s/it]training loss: 7.214e-03:   0%|          | 1033/300001 [9:39:38<2705:06:55, 32.57s/it]training loss: 7.214e-03:   0%|          | 1034/300001 [9:40:12<2743:49:47, 33.04s/it]training loss: 7.214e-03:   0%|          | 1035/300001 [9:40:46<2778:27:34, 33.46s/it]training loss: 7.214e-03:   0%|          | 1036/300001 [9:41:18<2734:37:20, 32.93s/it]training loss: 7.214e-03:   0%|          | 1037/300001 [9:41:52<2751:58:44, 33.14s/it]training loss: 7.214e-03:   0%|          | 1038/300001 [9:42:25<2766:46:06, 33.32s/it]training loss: 7.214e-03:   0%|          | 1039/300001 [9:42:58<2756:30:41, 33.19s/it]training loss: 7.214e-03:   0%|          | 1040/300001 [9:43:30<2709:30:10, 32.63s/it]training loss: 6.844e-03:   0%|          | 1040/300001 [9:44:02<2709:30:10, 32.63s/it]training loss: 6.844e-03:   0%|          | 1041/300001 [9:44:02<2709:07:27, 32.62s/it]training loss: 6.844e-03:   0%|          | 1042/300001 [9:44:35<2715:58:23, 32.71s/it]training loss: 6.844e-03:   0%|          | 1043/300001 [9:45:09<2735:05:35, 32.94s/it]training loss: 6.844e-03:   0%|          | 1044/300001 [9:45:42<2744:31:18, 33.05s/it]training loss: 6.844e-03:   0%|          | 1045/300001 [9:46:14<2731:43:33, 32.90s/it]training loss: 6.844e-03:   0%|          | 1046/300001 [9:46:47<2720:34:40, 32.76s/it]training loss: 6.844e-03:   0%|          | 1047/300001 [9:47:18<2683:36:37, 32.32s/it]training loss: 6.844e-03:   0%|          | 1048/300001 [9:47:50<2680:52:30, 32.28s/it]training loss: 6.844e-03:   0%|          | 1049/300001 [9:48:22<2667:01:33, 32.12s/it]training loss: 6.844e-03:   0%|          | 1050/300001 [9:48:56<2702:11:47, 32.54s/it]training loss: 6.844e-03:   0%|          | 1051/300001 [9:49:28<2695:34:11, 32.46s/it]training loss: 6.844e-03:   0%|          | 1052/300001 [9:50:01<2722:52:11, 32.79s/it]training loss: 6.844e-03:   0%|          | 1053/300001 [9:50:34<2715:12:32, 32.70s/it]training loss: 6.844e-03:   0%|          | 1054/300001 [9:51:06<2694:06:58, 32.44s/it]training loss: 6.844e-03:   0%|          | 1055/300001 [9:51:38<2684:24:28, 32.33s/it]training loss: 6.844e-03:   0%|          | 1056/300001 [9:52:10<2682:43:02, 32.31s/it]training loss: 6.844e-03:   0%|          | 1057/300001 [9:52:43<2686:01:34, 32.35s/it]training loss: 6.844e-03:   0%|          | 1058/300001 [9:53:15<2697:42:48, 32.49s/it]training loss: 6.844e-03:   0%|          | 1059/300001 [9:53:48<2692:58:53, 32.43s/it]training loss: 6.844e-03:   0%|          | 1060/300001 [9:54:20<2700:23:10, 32.52s/it]training loss: 6.970e-03:   0%|          | 1060/300001 [9:54:52<2700:23:10, 32.52s/it]training loss: 6.970e-03:   0%|          | 1061/300001 [9:54:52<2672:46:11, 32.19s/it]training loss: 6.970e-03:   0%|          | 1062/300001 [9:55:25<2690:59:32, 32.41s/it]training loss: 6.970e-03:   0%|          | 1063/300001 [9:55:57<2693:00:00, 32.43s/it]training loss: 6.970e-03:   0%|          | 1064/300001 [9:56:30<2692:30:39, 32.43s/it]training loss: 6.970e-03:   0%|          | 1065/300001 [9:57:02<2682:03:24, 32.30s/it]training loss: 6.970e-03:   0%|          | 1066/300001 [9:57:35<2700:57:18, 32.53s/it]training loss: 6.970e-03:   0%|          | 1067/300001 [9:58:07<2706:53:54, 32.60s/it]training loss: 6.970e-03:   0%|          | 1068/300001 [9:58:41<2722:54:15, 32.79s/it]training loss: 6.970e-03:   0%|          | 1069/300001 [9:59:13<2714:24:34, 32.69s/it]training loss: 6.970e-03:   0%|          | 1070/300001 [9:59:46<2716:19:24, 32.71s/it]training loss: 6.970e-03:   0%|          | 1071/300001 [10:00:17<2685:17:04, 32.34s/it]training loss: 6.970e-03:   0%|          | 1072/300001 [10:00:50<2684:01:41, 32.32s/it]training loss: 6.970e-03:   0%|          | 1073/300001 [10:01:22<2686:40:11, 32.36s/it]training loss: 6.970e-03:   0%|          | 1074/300001 [10:01:53<2661:58:34, 32.06s/it]training loss: 6.970e-03:   0%|          | 1075/300001 [10:02:26<2668:51:00, 32.14s/it]training loss: 6.970e-03:   0%|          | 1076/300001 [10:02:58<2679:12:24, 32.27s/it]training loss: 6.970e-03:   0%|          | 1077/300001 [10:03:32<2702:29:03, 32.55s/it]training loss: 6.970e-03:   0%|          | 1078/300001 [10:04:05<2717:15:00, 32.72s/it]training loss: 6.970e-03:   0%|          | 1079/300001 [10:04:36<2677:07:48, 32.24s/it]training loss: 6.970e-03:   0%|          | 1080/300001 [10:05:08<2682:57:55, 32.31s/it]training loss: 6.521e-03:   0%|          | 1080/300001 [10:05:41<2682:57:55, 32.31s/it]training loss: 6.521e-03:   0%|          | 1081/300001 [10:05:41<2704:42:21, 32.57s/it]training loss: 6.521e-03:   0%|          | 1082/300001 [10:06:14<2703:13:14, 32.56s/it]training loss: 6.521e-03:   0%|          | 1083/300001 [10:06:46<2694:56:51, 32.46s/it]training loss: 6.521e-03:   0%|          | 1084/300001 [10:07:19<2704:20:44, 32.57s/it]training loss: 6.521e-03:   0%|          | 1085/300001 [10:07:52<2702:21:31, 32.55s/it]training loss: 6.521e-03:   0%|          | 1086/300001 [10:08:24<2704:01:51, 32.57s/it]training loss: 6.521e-03:   0%|          | 1087/300001 [10:08:55<2668:01:57, 32.13s/it]training loss: 6.521e-03:   0%|          | 1088/300001 [10:09:28<2678:52:42, 32.26s/it]training loss: 6.521e-03:   0%|          | 1089/300001 [10:10:01<2692:53:44, 32.43s/it]training loss: 6.521e-03:   0%|          | 1090/300001 [10:10:33<2699:15:12, 32.51s/it]training loss: 6.521e-03:   0%|          | 1091/300001 [10:11:06<2708:35:19, 32.62s/it]training loss: 6.521e-03:   0%|          | 1092/300001 [10:11:39<2705:04:47, 32.58s/it]training loss: 6.521e-03:   0%|          | 1093/300001 [10:12:11<2703:23:41, 32.56s/it]training loss: 6.521e-03:   0%|          | 1094/300001 [10:12:43<2693:41:28, 32.44s/it]training loss: 6.521e-03:   0%|          | 1095/300001 [10:13:16<2705:45:33, 32.59s/it]training loss: 6.521e-03:   0%|          | 1096/300001 [10:13:48<2691:11:35, 32.41s/it]training loss: 6.521e-03:   0%|          | 1097/300001 [10:14:21<2695:18:14, 32.46s/it]training loss: 6.521e-03:   0%|          | 1098/300001 [10:14:55<2724:19:10, 32.81s/it]training loss: 6.521e-03:   0%|          | 1099/300001 [10:15:17<2475:47:28, 29.82s/it]training loss: 6.521e-03:   0%|          | 1100/300001 [10:15:49<2523:44:14, 30.40s/it]training loss: 7.421e-03:   0%|          | 1100/300001 [10:16:21<2523:44:14, 30.40s/it]training loss: 7.421e-03:   0%|          | 1101/300001 [10:16:21<2558:20:11, 30.81s/it]training loss: 7.421e-03:   0%|          | 1102/300001 [10:16:54<2607:53:12, 31.41s/it]training loss: 7.421e-03:   0%|          | 1103/300001 [10:17:27<2651:03:02, 31.93s/it]training loss: 7.421e-03:   0%|          | 1104/300001 [10:18:00<2683:37:20, 32.32s/it]training loss: 7.421e-03:   0%|          | 1105/300001 [10:18:33<2694:31:45, 32.45s/it]training loss: 7.421e-03:   0%|          | 1106/300001 [10:19:05<2678:29:19, 32.26s/it]training loss: 7.421e-03:   0%|          | 1107/300001 [10:19:37<2675:36:15, 32.23s/it]training loss: 7.421e-03:   0%|          | 1108/300001 [10:20:08<2659:21:27, 32.03s/it]training loss: 7.421e-03:   0%|          | 1109/300001 [10:20:41<2663:56:07, 32.09s/it]training loss: 7.421e-03:   0%|          | 1110/300001 [10:21:14<2699:10:57, 32.51s/it]training loss: 7.421e-03:   0%|          | 1111/300001 [10:21:48<2731:57:37, 32.91s/it]training loss: 7.421e-03:   0%|          | 1112/300001 [10:22:21<2741:49:41, 33.02s/it]training loss: 7.421e-03:   0%|          | 1113/300001 [10:22:53<2707:23:15, 32.61s/it]training loss: 7.421e-03:   0%|          | 1114/300001 [10:23:25<2698:34:42, 32.50s/it]training loss: 7.421e-03:   0%|          | 1115/300001 [10:23:59<2731:47:13, 32.90s/it]training loss: 7.421e-03:   0%|          | 1116/300001 [10:24:32<2729:04:45, 32.87s/it]training loss: 7.421e-03:   0%|          | 1117/300001 [10:25:05<2750:47:33, 33.13s/it]training loss: 7.421e-03:   0%|          | 1118/300001 [10:25:38<2733:49:06, 32.93s/it]training loss: 7.421e-03:   0%|          | 1119/300001 [10:26:10<2718:43:19, 32.75s/it]training loss: 7.421e-03:   0%|          | 1120/300001 [10:26:42<2696:08:18, 32.47s/it]training loss: 6.365e-03:   0%|          | 1120/300001 [10:27:15<2696:08:18, 32.47s/it]training loss: 6.365e-03:   0%|          | 1121/300001 [10:27:15<2702:24:40, 32.55s/it]training loss: 6.365e-03:   0%|          | 1122/300001 [10:27:46<2671:59:46, 32.18s/it]training loss: 6.365e-03:   0%|          | 1123/300001 [10:28:19<2697:41:57, 32.49s/it]training loss: 6.365e-03:   0%|          | 1124/300001 [10:28:51<2680:14:47, 32.28s/it]training loss: 6.365e-03:   0%|          | 1125/300001 [10:29:24<2704:32:50, 32.58s/it]training loss: 6.365e-03:   0%|          | 1126/300001 [10:29:56<2685:59:41, 32.35s/it]training loss: 6.365e-03:   0%|          | 1127/300001 [10:30:29<2705:30:25, 32.59s/it]training loss: 6.365e-03:   0%|          | 1128/300001 [10:31:01<2692:39:53, 32.43s/it]training loss: 6.365e-03:   0%|          | 1129/300001 [10:31:35<2723:20:55, 32.80s/it]training loss: 6.365e-03:   0%|          | 1130/300001 [10:32:08<2732:37:40, 32.92s/it]training loss: 6.365e-03:   0%|          | 1131/300001 [10:32:40<2710:53:43, 32.65s/it]training loss: 6.365e-03:   0%|          | 1132/300001 [10:33:13<2715:27:29, 32.71s/it]training loss: 6.365e-03:   0%|          | 1133/300001 [10:33:45<2692:26:54, 32.43s/it]training loss: 6.365e-03:   0%|          | 1134/300001 [10:34:19<2723:55:43, 32.81s/it]training loss: 6.365e-03:   0%|          | 1135/300001 [10:34:51<2719:25:08, 32.76s/it]training loss: 6.365e-03:   0%|          | 1136/300001 [10:35:24<2725:44:09, 32.83s/it]training loss: 6.365e-03:   0%|          | 1137/300001 [10:35:56<2706:14:54, 32.60s/it]training loss: 6.365e-03:   0%|          | 1138/300001 [10:36:29<2702:56:22, 32.56s/it]training loss: 6.365e-03:   0%|          | 1139/300001 [10:37:02<2715:49:37, 32.71s/it]training loss: 6.365e-03:   0%|          | 1140/300001 [10:37:35<2712:59:02, 32.68s/it]training loss: 6.405e-03:   0%|          | 1140/300001 [10:38:07<2712:59:02, 32.68s/it]training loss: 6.405e-03:   0%|          | 1141/300001 [10:38:07<2703:57:58, 32.57s/it]training loss: 6.405e-03:   0%|          | 1142/300001 [10:38:39<2696:20:37, 32.48s/it]training loss: 6.405e-03:   0%|          | 1143/300001 [10:39:12<2713:04:00, 32.68s/it]training loss: 6.405e-03:   0%|          | 1144/300001 [10:39:44<2693:58:15, 32.45s/it]training loss: 6.405e-03:   0%|          | 1145/300001 [10:40:18<2722:26:14, 32.79s/it]training loss: 6.405e-03:   0%|          | 1146/300001 [10:40:50<2720:37:20, 32.77s/it]training loss: 6.405e-03:   0%|          | 1147/300001 [10:41:23<2726:19:42, 32.84s/it]training loss: 6.405e-03:   0%|          | 1148/300001 [10:41:56<2719:10:02, 32.76s/it]training loss: 6.405e-03:   0%|          | 1149/300001 [10:42:29<2713:44:48, 32.69s/it]training loss: 6.405e-03:   0%|          | 1150/300001 [10:43:01<2717:42:26, 32.74s/it]training loss: 6.405e-03:   0%|          | 1151/300001 [10:43:34<2703:01:00, 32.56s/it]training loss: 6.405e-03:   0%|          | 1152/300001 [10:44:07<2711:57:37, 32.67s/it]training loss: 6.405e-03:   0%|          | 1153/300001 [10:44:39<2696:47:55, 32.49s/it]training loss: 6.405e-03:   0%|          | 1154/300001 [10:45:11<2697:23:47, 32.49s/it]training loss: 6.405e-03:   0%|          | 1155/300001 [10:45:43<2682:03:49, 32.31s/it]training loss: 6.405e-03:   0%|          | 1156/300001 [10:46:15<2673:28:15, 32.21s/it]training loss: 6.405e-03:   0%|          | 1157/300001 [10:46:47<2671:41:14, 32.18s/it]training loss: 6.405e-03:   0%|          | 1158/300001 [10:47:19<2664:28:51, 32.10s/it]training loss: 6.405e-03:   0%|          | 1159/300001 [10:47:51<2667:48:21, 32.14s/it]training loss: 6.405e-03:   0%|          | 1160/300001 [10:48:24<2684:22:05, 32.34s/it]training loss: 6.427e-03:   0%|          | 1160/300001 [10:48:55<2684:22:05, 32.34s/it]training loss: 6.427e-03:   0%|          | 1161/300001 [10:48:55<2656:13:00, 32.00s/it]training loss: 6.427e-03:   0%|          | 1162/300001 [10:49:26<2633:53:41, 31.73s/it]training loss: 6.427e-03:   0%|          | 1163/300001 [10:49:58<2635:15:17, 31.75s/it]training loss: 6.427e-03:   0%|          | 1164/300001 [10:50:31<2666:24:41, 32.12s/it]training loss: 6.427e-03:   0%|          | 1165/300001 [10:51:04<2693:41:42, 32.45s/it]training loss: 6.427e-03:   0%|          | 1166/300001 [10:51:37<2699:22:46, 32.52s/it]training loss: 6.427e-03:   0%|          | 1167/300001 [10:52:10<2702:06:49, 32.55s/it]training loss: 6.427e-03:   0%|          | 1168/300001 [10:52:43<2730:48:06, 32.90s/it]training loss: 6.427e-03:   0%|          | 1169/300001 [10:53:17<2753:52:04, 33.18s/it]training loss: 6.427e-03:   0%|          | 1170/300001 [10:53:48<2706:37:45, 32.61s/it]training loss: 6.427e-03:   0%|          | 1171/300001 [10:54:21<2701:28:54, 32.54s/it]training loss: 6.427e-03:   0%|          | 1172/300001 [10:54:54<2713:19:43, 32.69s/it]training loss: 6.427e-03:   0%|          | 1173/300001 [10:55:26<2703:58:32, 32.57s/it]training loss: 6.427e-03:   0%|          | 1174/300001 [10:55:58<2680:38:37, 32.29s/it]training loss: 6.427e-03:   0%|          | 1175/300001 [10:56:29<2665:58:06, 32.12s/it]training loss: 6.427e-03:   0%|          | 1176/300001 [10:57:02<2674:53:23, 32.22s/it]training loss: 6.427e-03:   0%|          | 1177/300001 [10:57:34<2673:05:44, 32.20s/it]training loss: 6.427e-03:   0%|          | 1178/300001 [10:58:08<2711:43:40, 32.67s/it]training loss: 6.427e-03:   0%|          | 1179/300001 [10:58:41<2729:45:50, 32.89s/it]training loss: 6.427e-03:   0%|          | 1180/300001 [10:59:14<2729:16:00, 32.88s/it]training loss: 6.375e-03:   0%|          | 1180/300001 [10:59:45<2729:16:00, 32.88s/it]training loss: 6.375e-03:   0%|          | 1181/300001 [10:59:45<2688:33:01, 32.39s/it]training loss: 6.375e-03:   0%|          | 1182/300001 [11:00:18<2684:22:46, 32.34s/it]training loss: 6.375e-03:   0%|          | 1183/300001 [11:00:50<2677:13:53, 32.25s/it]training loss: 6.375e-03:   0%|          | 1184/300001 [11:01:22<2670:56:03, 32.18s/it]training loss: 6.375e-03:   0%|          | 1185/300001 [11:01:56<2718:24:09, 32.75s/it]training loss: 6.375e-03:   0%|          | 1186/300001 [11:02:27<2689:10:21, 32.40s/it]training loss: 6.375e-03:   0%|          | 1187/300001 [11:03:01<2723:36:45, 32.81s/it]training loss: 6.375e-03:   0%|          | 1188/300001 [11:03:33<2713:26:42, 32.69s/it]training loss: 6.375e-03:   0%|          | 1189/300001 [11:04:07<2729:08:36, 32.88s/it]training loss: 6.375e-03:   0%|          | 1190/300001 [11:04:40<2727:54:15, 32.87s/it]training loss: 6.375e-03:   0%|          | 1191/300001 [11:05:12<2712:01:31, 32.67s/it]training loss: 6.375e-03:   0%|          | 1192/300001 [11:05:45<2723:43:43, 32.82s/it]training loss: 6.375e-03:   0%|          | 1193/300001 [11:06:17<2712:41:05, 32.68s/it]training loss: 6.375e-03:   0%|          | 1194/300001 [11:06:50<2708:03:44, 32.63s/it]training loss: 6.375e-03:   0%|          | 1195/300001 [11:07:22<2685:57:38, 32.36s/it]training loss: 6.375e-03:   0%|          | 1196/300001 [11:07:55<2700:31:49, 32.54s/it]training loss: 6.375e-03:   0%|          | 1197/300001 [11:08:26<2674:48:43, 32.23s/it]training loss: 6.375e-03:   0%|          | 1198/300001 [11:08:59<2680:35:28, 32.30s/it]training loss: 6.375e-03:   0%|          | 1199/300001 [11:09:31<2672:36:54, 32.20s/it]training loss: 6.375e-03:   0%|          | 1200/300001 [11:10:04<2712:59:01, 32.69s/it]training loss: 6.515e-03:   0%|          | 1200/300001 [11:10:37<2712:59:01, 32.69s/it]training loss: 6.515e-03:   0%|          | 1201/300001 [11:10:37<2705:43:49, 32.60s/it]training loss: 6.515e-03:   0%|          | 1202/300001 [11:11:08<2678:53:22, 32.28s/it]training loss: 6.515e-03:   0%|          | 1203/300001 [11:11:42<2705:38:02, 32.60s/it]training loss: 6.515e-03:   0%|          | 1204/300001 [11:12:14<2705:00:42, 32.59s/it]training loss: 6.515e-03:   0%|          | 1205/300001 [11:12:47<2720:03:02, 32.77s/it]training loss: 6.515e-03:   0%|          | 1206/300001 [11:13:20<2722:05:54, 32.80s/it]training loss: 6.515e-03:   0%|          | 1207/300001 [11:13:52<2696:28:26, 32.49s/it]training loss: 6.515e-03:   0%|          | 1208/300001 [11:14:24<2680:45:23, 32.30s/it]training loss: 6.515e-03:   0%|          | 1209/300001 [11:14:57<2709:58:34, 32.65s/it]training loss: 6.515e-03:   0%|          | 1210/300001 [11:15:29<2696:55:54, 32.49s/it]training loss: 6.515e-03:   0%|          | 1211/300001 [11:16:02<2687:48:55, 32.38s/it]training loss: 6.515e-03:   0%|          | 1212/300001 [11:16:34<2682:10:53, 32.32s/it]training loss: 6.515e-03:   0%|          | 1213/300001 [11:17:06<2672:09:28, 32.20s/it]training loss: 6.515e-03:   0%|          | 1214/300001 [11:17:39<2711:43:33, 32.67s/it]training loss: 6.515e-03:   0%|          | 1215/300001 [11:18:12<2702:23:05, 32.56s/it]training loss: 6.515e-03:   0%|          | 1216/300001 [11:18:44<2694:17:18, 32.46s/it]training loss: 6.515e-03:   0%|          | 1217/300001 [11:19:15<2663:32:58, 32.09s/it]training loss: 6.515e-03:   0%|          | 1218/300001 [11:19:48<2678:08:46, 32.27s/it]training loss: 6.515e-03:   0%|          | 1219/300001 [11:20:20<2672:57:12, 32.21s/it]training loss: 6.515e-03:   0%|          | 1220/300001 [11:20:52<2671:46:59, 32.19s/it]training loss: 5.834e-03:   0%|          | 1220/300001 [11:21:25<2671:46:59, 32.19s/it]training loss: 5.834e-03:   0%|          | 1221/300001 [11:21:25<2701:43:33, 32.55s/it]training loss: 5.834e-03:   0%|          | 1222/300001 [11:21:58<2688:26:06, 32.39s/it]training loss: 5.834e-03:   0%|          | 1223/300001 [11:22:30<2687:52:53, 32.39s/it]training loss: 5.834e-03:   0%|          | 1224/300001 [11:23:02<2687:14:14, 32.38s/it]training loss: 5.834e-03:   0%|          | 1225/300001 [11:23:36<2709:48:54, 32.65s/it]training loss: 5.834e-03:   0%|          | 1226/300001 [11:24:09<2720:52:04, 32.78s/it]training loss: 5.834e-03:   0%|          | 1227/300001 [11:24:41<2703:17:59, 32.57s/it]training loss: 5.834e-03:   0%|          | 1228/300001 [11:25:13<2706:27:38, 32.61s/it]training loss: 5.834e-03:   0%|          | 1229/300001 [11:25:45<2687:23:40, 32.38s/it]training loss: 5.834e-03:   0%|          | 1230/300001 [11:26:18<2702:54:05, 32.57s/it]training loss: 5.834e-03:   0%|          | 1231/300001 [11:26:50<2692:36:07, 32.44s/it]training loss: 5.834e-03:   0%|          | 1232/300001 [11:27:24<2715:06:18, 32.72s/it]training loss: 5.834e-03:   0%|          | 1233/300001 [11:27:56<2696:13:28, 32.49s/it]training loss: 5.834e-03:   0%|          | 1234/300001 [11:28:28<2686:46:17, 32.37s/it]training loss: 5.834e-03:   0%|          | 1235/300001 [11:29:00<2673:32:43, 32.22s/it]training loss: 5.834e-03:   0%|          | 1236/300001 [11:29:32<2679:15:14, 32.28s/it]training loss: 5.834e-03:   0%|          | 1237/300001 [11:30:04<2664:14:16, 32.10s/it]training loss: 5.834e-03:   0%|          | 1238/300001 [11:30:37<2687:47:09, 32.39s/it]training loss: 5.834e-03:   0%|          | 1239/300001 [11:31:09<2676:37:17, 32.25s/it]training loss: 5.834e-03:   0%|          | 1240/300001 [11:31:41<2688:04:47, 32.39s/it]training loss: 7.140e-03:   0%|          | 1240/300001 [11:32:14<2688:04:47, 32.39s/it]training loss: 7.140e-03:   0%|          | 1241/300001 [11:32:14<2684:37:16, 32.35s/it]training loss: 7.140e-03:   0%|          | 1242/300001 [11:32:46<2670:35:16, 32.18s/it]training loss: 7.140e-03:   0%|          | 1243/300001 [11:33:19<2697:46:09, 32.51s/it]training loss: 7.140e-03:   0%|          | 1244/300001 [11:33:51<2695:06:10, 32.48s/it]training loss: 7.140e-03:   0%|          | 1245/300001 [11:34:23<2672:27:37, 32.20s/it]training loss: 7.140e-03:   0%|          | 1246/300001 [11:34:55<2674:48:07, 32.23s/it]training loss: 7.140e-03:   0%|          | 1247/300001 [11:35:28<2694:33:28, 32.47s/it]training loss: 7.140e-03:   0%|          | 1248/300001 [11:36:01<2701:55:15, 32.56s/it]training loss: 7.140e-03:   0%|          | 1249/300001 [11:36:35<2740:57:07, 33.03s/it]training loss: 7.140e-03:   0%|          | 1250/300001 [11:37:06<2688:35:18, 32.40s/it]training loss: 7.140e-03:   0%|          | 1251/300001 [11:37:39<2711:46:19, 32.68s/it]training loss: 7.140e-03:   0%|          | 1252/300001 [11:38:13<2730:47:17, 32.91s/it]training loss: 7.140e-03:   0%|          | 1253/300001 [11:38:45<2718:59:18, 32.76s/it]training loss: 7.140e-03:   0%|          | 1254/300001 [11:39:18<2722:07:05, 32.80s/it]training loss: 7.140e-03:   0%|          | 1255/300001 [11:39:50<2707:22:04, 32.62s/it]training loss: 7.140e-03:   0%|          | 1256/300001 [11:40:13<2455:43:45, 29.59s/it]training loss: 7.140e-03:   0%|          | 1257/300001 [11:40:45<2529:08:25, 30.48s/it]training loss: 7.140e-03:   0%|          | 1258/300001 [11:41:18<2582:09:39, 31.12s/it]training loss: 7.140e-03:   0%|          | 1259/300001 [11:41:51<2629:48:40, 31.69s/it]training loss: 7.140e-03:   0%|          | 1260/300001 [11:42:23<2637:47:04, 31.79s/it]training loss: 7.163e-03:   0%|          | 1260/300001 [11:42:56<2637:47:04, 31.79s/it]training loss: 7.163e-03:   0%|          | 1261/300001 [11:42:56<2675:43:25, 32.24s/it]training loss: 7.163e-03:   0%|          | 1262/300001 [11:43:27<2646:48:10, 31.90s/it]training loss: 7.163e-03:   0%|          | 1263/300001 [11:43:59<2650:26:49, 31.94s/it]training loss: 7.163e-03:   0%|          | 1264/300001 [11:44:31<2655:15:25, 32.00s/it]training loss: 7.163e-03:   0%|          | 1265/300001 [11:45:04<2672:09:42, 32.20s/it]training loss: 7.163e-03:   0%|          | 1266/300001 [11:45:37<2677:38:32, 32.27s/it]training loss: 7.163e-03:   0%|          | 1267/300001 [11:46:09<2679:51:12, 32.29s/it]training loss: 7.163e-03:   0%|          | 1268/300001 [11:46:42<2706:40:34, 32.62s/it]training loss: 7.163e-03:   0%|          | 1269/300001 [11:47:15<2708:24:49, 32.64s/it]training loss: 7.163e-03:   0%|          | 1270/300001 [11:47:48<2707:29:31, 32.63s/it]training loss: 7.163e-03:   0%|          | 1271/300001 [11:48:20<2699:38:34, 32.53s/it]training loss: 7.163e-03:   0%|          | 1272/300001 [11:48:53<2716:54:39, 32.74s/it]training loss: 7.163e-03:   0%|          | 1273/300001 [11:49:27<2739:52:27, 33.02s/it]training loss: 7.163e-03:   0%|          | 1274/300001 [11:49:58<2703:24:59, 32.58s/it]training loss: 7.163e-03:   0%|          | 1275/300001 [11:50:32<2729:06:32, 32.89s/it]training loss: 7.163e-03:   0%|          | 1276/300001 [11:51:04<2706:49:37, 32.62s/it]training loss: 7.163e-03:   0%|          | 1277/300001 [11:51:36<2698:07:29, 32.52s/it]training loss: 7.163e-03:   0%|          | 1278/300001 [11:52:09<2715:34:52, 32.73s/it]training loss: 7.163e-03:   0%|          | 1279/300001 [11:52:42<2715:09:00, 32.72s/it]training loss: 7.163e-03:   0%|          | 1280/300001 [11:53:14<2705:06:39, 32.60s/it]training loss: 6.475e-03:   0%|          | 1280/300001 [11:53:46<2705:06:39, 32.60s/it]training loss: 6.475e-03:   0%|          | 1281/300001 [11:53:46<2685:16:21, 32.36s/it]training loss: 6.475e-03:   0%|          | 1282/300001 [11:54:19<2685:19:47, 32.36s/it]training loss: 6.475e-03:   0%|          | 1283/300001 [11:54:50<2667:18:14, 32.15s/it]training loss: 6.475e-03:   0%|          | 1284/300001 [11:55:23<2671:42:19, 32.20s/it]training loss: 6.475e-03:   0%|          | 1285/300001 [11:55:54<2652:51:28, 31.97s/it]training loss: 6.475e-03:   0%|          | 1286/300001 [11:56:28<2689:38:30, 32.41s/it]training loss: 6.475e-03:   0%|          | 1287/300001 [11:57:00<2689:33:35, 32.41s/it]training loss: 6.475e-03:   0%|          | 1288/300001 [11:57:33<2713:28:56, 32.70s/it]training loss: 6.475e-03:   0%|          | 1289/300001 [11:58:06<2704:42:59, 32.60s/it]training loss: 6.475e-03:   0%|          | 1290/300001 [11:58:38<2692:55:43, 32.45s/it]training loss: 6.475e-03:   0%|          | 1291/300001 [11:59:10<2676:52:05, 32.26s/it]training loss: 6.475e-03:   0%|          | 1292/300001 [11:59:41<2663:22:26, 32.10s/it]training loss: 6.475e-03:   0%|          | 1293/300001 [12:00:15<2699:44:43, 32.54s/it]training loss: 6.475e-03:   0%|          | 1294/300001 [12:00:48<2721:59:12, 32.81s/it]training loss: 6.475e-03:   0%|          | 1295/300001 [12:01:21<2725:09:11, 32.84s/it]training loss: 6.475e-03:   0%|          | 1296/300001 [12:01:53<2706:28:23, 32.62s/it]training loss: 6.475e-03:   0%|          | 1297/300001 [12:02:26<2701:52:32, 32.56s/it]training loss: 6.475e-03:   0%|          | 1298/300001 [12:02:58<2694:20:29, 32.47s/it]training loss: 6.475e-03:   0%|          | 1299/300001 [12:03:30<2686:09:41, 32.37s/it]training loss: 6.475e-03:   0%|          | 1300/300001 [12:04:02<2680:25:44, 32.31s/it]training loss: 6.811e-03:   0%|          | 1300/300001 [12:04:35<2680:25:44, 32.31s/it]training loss: 6.811e-03:   0%|          | 1301/300001 [12:04:35<2685:28:16, 32.37s/it]training loss: 6.811e-03:   0%|          | 1302/300001 [12:05:07<2679:55:29, 32.30s/it]training loss: 6.811e-03:   0%|          | 1303/300001 [12:05:40<2706:50:04, 32.62s/it]training loss: 6.811e-03:   0%|          | 1304/300001 [12:06:13<2719:11:21, 32.77s/it]training loss: 6.811e-03:   0%|          | 1305/300001 [12:06:45<2691:36:09, 32.44s/it]training loss: 6.811e-03:   0%|          | 1306/300001 [12:07:18<2694:38:42, 32.48s/it]training loss: 6.811e-03:   0%|          | 1307/300001 [12:07:49<2675:09:43, 32.24s/it]training loss: 6.811e-03:   0%|          | 1308/300001 [12:08:22<2675:18:46, 32.24s/it]training loss: 6.811e-03:   0%|          | 1309/300001 [12:08:55<2707:20:07, 32.63s/it]training loss: 6.811e-03:   0%|          | 1310/300001 [12:09:27<2693:08:31, 32.46s/it]training loss: 6.811e-03:   0%|          | 1311/300001 [12:10:01<2719:59:17, 32.78s/it]training loss: 6.811e-03:   0%|          | 1312/300001 [12:10:33<2714:25:38, 32.72s/it]training loss: 6.811e-03:   0%|          | 1313/300001 [12:11:05<2696:11:30, 32.50s/it]training loss: 6.811e-03:   0%|          | 1314/300001 [12:11:38<2712:17:24, 32.69s/it]training loss: 6.811e-03:   0%|          | 1315/300001 [12:12:12<2723:49:59, 32.83s/it]training loss: 6.811e-03:   0%|          | 1316/300001 [12:12:44<2722:15:17, 32.81s/it]training loss: 6.811e-03:   0%|          | 1317/300001 [12:13:16<2700:54:51, 32.55s/it]training loss: 6.811e-03:   0%|          | 1318/300001 [12:13:49<2712:56:32, 32.70s/it]training loss: 6.811e-03:   0%|          | 1319/300001 [12:14:21<2679:29:48, 32.30s/it]training loss: 6.811e-03:   0%|          | 1320/300001 [12:14:53<2689:26:35, 32.42s/it]training loss: 6.714e-03:   0%|          | 1320/300001 [12:15:25<2689:26:35, 32.42s/it]training loss: 6.714e-03:   0%|          | 1321/300001 [12:15:25<2675:02:44, 32.24s/it]training loss: 6.714e-03:   0%|          | 1322/300001 [12:15:58<2686:46:10, 32.38s/it]training loss: 6.714e-03:   0%|          | 1323/300001 [12:16:30<2685:45:32, 32.37s/it]training loss: 6.714e-03:   0%|          | 1324/300001 [12:17:04<2722:34:01, 32.82s/it]training loss: 6.714e-03:   0%|          | 1325/300001 [12:17:36<2699:42:00, 32.54s/it]training loss: 6.714e-03:   0%|          | 1326/300001 [12:18:08<2695:38:17, 32.49s/it]training loss: 6.714e-03:   0%|          | 1327/300001 [12:18:42<2717:09:35, 32.75s/it]training loss: 6.714e-03:   0%|          | 1328/300001 [12:19:15<2719:58:17, 32.78s/it]training loss: 6.714e-03:   0%|          | 1329/300001 [12:19:46<2686:47:48, 32.38s/it]training loss: 6.714e-03:   0%|          | 1330/300001 [12:20:20<2714:42:34, 32.72s/it]training loss: 6.714e-03:   0%|          | 1331/300001 [12:20:52<2706:48:17, 32.63s/it]training loss: 6.714e-03:   0%|          | 1332/300001 [12:21:23<2675:32:16, 32.25s/it]training loss: 6.714e-03:   0%|          | 1333/300001 [12:21:56<2688:33:24, 32.41s/it]training loss: 6.714e-03:   0%|          | 1334/300001 [12:22:28<2673:59:14, 32.23s/it]training loss: 6.714e-03:   0%|          | 1335/300001 [12:23:00<2667:45:30, 32.16s/it]training loss: 6.714e-03:   0%|          | 1336/300001 [12:23:32<2668:49:30, 32.17s/it]training loss: 6.714e-03:   0%|          | 1337/300001 [12:24:03<2646:21:23, 31.90s/it]training loss: 6.714e-03:   0%|          | 1338/300001 [12:24:37<2682:44:49, 32.34s/it]training loss: 6.714e-03:   0%|          | 1339/300001 [12:25:08<2661:37:41, 32.08s/it]training loss: 6.714e-03:   0%|          | 1340/300001 [12:25:40<2660:25:52, 32.07s/it]training loss: 6.691e-03:   0%|          | 1340/300001 [12:26:13<2660:25:52, 32.07s/it]training loss: 6.691e-03:   0%|          | 1341/300001 [12:26:13<2681:32:46, 32.32s/it]training loss: 6.691e-03:   0%|          | 1342/300001 [12:26:47<2716:15:49, 32.74s/it]training loss: 6.691e-03:   0%|          | 1343/300001 [12:27:20<2726:50:46, 32.87s/it]training loss: 6.691e-03:   0%|          | 1344/300001 [12:27:54<2744:27:20, 33.08s/it]training loss: 6.691e-03:   0%|          | 1345/300001 [12:28:27<2738:55:12, 33.01s/it]training loss: 6.691e-03:   0%|          | 1346/300001 [12:28:59<2736:41:33, 32.99s/it]training loss: 6.691e-03:   0%|          | 1347/300001 [12:29:32<2725:56:08, 32.86s/it]training loss: 6.691e-03:   0%|          | 1348/300001 [12:30:04<2705:21:42, 32.61s/it]training loss: 6.691e-03:   0%|          | 1349/300001 [12:30:37<2701:42:49, 32.57s/it]training loss: 6.691e-03:   0%|          | 1350/300001 [12:31:10<2735:25:27, 32.97s/it]training loss: 6.691e-03:   0%|          | 1351/300001 [12:31:43<2729:51:18, 32.91s/it]training loss: 6.691e-03:   0%|          | 1352/300001 [12:32:16<2716:02:20, 32.74s/it]training loss: 6.691e-03:   0%|          | 1353/300001 [12:32:48<2717:00:02, 32.75s/it]training loss: 6.691e-03:   0%|          | 1354/300001 [12:33:21<2715:06:12, 32.73s/it]training loss: 6.691e-03:   0%|          | 1355/300001 [12:33:53<2695:46:55, 32.50s/it]training loss: 6.691e-03:   0%|          | 1356/300001 [12:34:27<2725:44:20, 32.86s/it]training loss: 6.691e-03:   0%|          | 1357/300001 [12:34:59<2706:04:40, 32.62s/it]training loss: 6.691e-03:   0%|          | 1358/300001 [12:35:31<2706:37:17, 32.63s/it]training loss: 6.691e-03:   0%|          | 1359/300001 [12:36:04<2703:22:32, 32.59s/it]training loss: 6.691e-03:   0%|          | 1360/300001 [12:36:36<2686:22:00, 32.38s/it]training loss: 7.604e-03:   0%|          | 1360/300001 [12:37:08<2686:22:00, 32.38s/it]training loss: 7.604e-03:   0%|          | 1361/300001 [12:37:08<2694:27:22, 32.48s/it]training loss: 7.604e-03:   0%|          | 1362/300001 [12:37:41<2705:22:02, 32.61s/it]training loss: 7.604e-03:   0%|          | 1363/300001 [12:38:14<2705:58:20, 32.62s/it]training loss: 7.604e-03:   0%|          | 1364/300001 [12:38:47<2702:18:36, 32.58s/it]training loss: 7.604e-03:   0%|          | 1365/300001 [12:39:19<2692:17:31, 32.46s/it]training loss: 7.604e-03:   0%|          | 1366/300001 [12:39:51<2695:45:06, 32.50s/it]training loss: 7.604e-03:   0%|          | 1367/300001 [12:40:24<2691:07:49, 32.44s/it]training loss: 7.604e-03:   0%|          | 1368/300001 [12:40:56<2701:41:24, 32.57s/it]training loss: 7.604e-03:   0%|          | 1369/300001 [12:41:29<2690:49:30, 32.44s/it]training loss: 7.604e-03:   0%|          | 1370/300001 [12:42:01<2679:35:33, 32.30s/it]training loss: 7.604e-03:   0%|          | 1371/300001 [12:42:34<2698:24:26, 32.53s/it]training loss: 7.604e-03:   0%|          | 1372/300001 [12:43:05<2673:12:04, 32.23s/it]training loss: 7.604e-03:   0%|          | 1373/300001 [12:43:37<2668:23:51, 32.17s/it]training loss: 7.604e-03:   0%|          | 1374/300001 [12:44:10<2688:19:08, 32.41s/it]training loss: 7.604e-03:   0%|          | 1375/300001 [12:44:42<2677:56:50, 32.28s/it]training loss: 7.604e-03:   0%|          | 1376/300001 [12:45:15<2690:33:06, 32.44s/it]training loss: 7.604e-03:   0%|          | 1377/300001 [12:45:47<2689:39:49, 32.42s/it]training loss: 7.604e-03:   0%|          | 1378/300001 [12:46:20<2699:20:26, 32.54s/it]training loss: 7.604e-03:   0%|          | 1379/300001 [12:46:53<2696:05:44, 32.50s/it]training loss: 7.604e-03:   0%|          | 1380/300001 [12:47:26<2715:10:11, 32.73s/it]training loss: 6.313e-03:   0%|          | 1380/300001 [12:47:58<2715:10:11, 32.73s/it]training loss: 6.313e-03:   0%|          | 1381/300001 [12:47:58<2703:26:57, 32.59s/it]training loss: 6.313e-03:   0%|          | 1382/300001 [12:48:29<2662:53:45, 32.10s/it]training loss: 6.313e-03:   0%|          | 1383/300001 [12:49:01<2654:26:50, 32.00s/it]training loss: 6.313e-03:   0%|          | 1384/300001 [12:49:34<2674:59:01, 32.25s/it]training loss: 6.313e-03:   0%|          | 1385/300001 [12:50:06<2673:57:11, 32.24s/it]training loss: 6.313e-03:   0%|          | 1386/300001 [12:50:39<2686:40:10, 32.39s/it]training loss: 6.313e-03:   0%|          | 1387/300001 [12:51:11<2681:54:09, 32.33s/it]training loss: 6.313e-03:   0%|          | 1388/300001 [12:51:43<2689:59:46, 32.43s/it]training loss: 6.313e-03:   0%|          | 1389/300001 [12:52:16<2680:45:50, 32.32s/it]training loss: 6.313e-03:   0%|          | 1390/300001 [12:52:47<2663:33:19, 32.11s/it]training loss: 6.313e-03:   0%|          | 1391/300001 [12:53:19<2658:00:31, 32.04s/it]training loss: 6.313e-03:   0%|          | 1392/300001 [12:53:52<2692:16:57, 32.46s/it]training loss: 6.313e-03:   0%|          | 1393/300001 [12:54:23<2654:14:52, 32.00s/it]training loss: 6.313e-03:   0%|          | 1394/300001 [12:54:55<2656:51:21, 32.03s/it]training loss: 6.313e-03:   0%|          | 1395/300001 [12:55:29<2684:47:30, 32.37s/it]training loss: 6.313e-03:   0%|          | 1396/300001 [12:56:01<2686:16:05, 32.39s/it]training loss: 6.313e-03:   0%|          | 1397/300001 [12:56:34<2707:50:11, 32.65s/it]training loss: 6.313e-03:   0%|          | 1398/300001 [12:57:07<2711:07:18, 32.69s/it]training loss: 6.313e-03:   0%|          | 1399/300001 [12:57:39<2691:28:49, 32.45s/it]training loss: 6.313e-03:   0%|          | 1400/300001 [12:58:13<2718:26:16, 32.77s/it]training loss: 5.844e-03:   0%|          | 1400/300001 [12:58:44<2718:26:16, 32.77s/it]training loss: 5.844e-03:   0%|          | 1401/300001 [12:58:45<2698:53:27, 32.54s/it]training loss: 5.844e-03:   0%|          | 1402/300001 [12:59:16<2684:36:25, 32.37s/it]training loss: 5.844e-03:   0%|          | 1403/300001 [12:59:49<2678:59:56, 32.30s/it]training loss: 5.844e-03:   0%|          | 1404/300001 [13:00:20<2662:22:56, 32.10s/it]training loss: 5.844e-03:   0%|          | 1405/300001 [13:00:53<2683:20:02, 32.35s/it]training loss: 5.844e-03:   0%|          | 1406/300001 [13:01:25<2668:10:16, 32.17s/it]training loss: 5.844e-03:   0%|          | 1407/300001 [13:01:57<2660:08:00, 32.07s/it]training loss: 5.844e-03:   0%|          | 1408/300001 [13:02:29<2668:56:15, 32.18s/it]training loss: 5.844e-03:   0%|          | 1409/300001 [13:03:02<2680:22:09, 32.32s/it]training loss: 5.844e-03:   0%|          | 1410/300001 [13:03:34<2673:43:26, 32.24s/it]training loss: 5.844e-03:   0%|          | 1411/300001 [13:04:07<2705:37:59, 32.62s/it]training loss: 5.844e-03:   0%|          | 1412/300001 [13:04:40<2705:49:52, 32.62s/it]training loss: 5.844e-03:   0%|          | 1413/300001 [13:05:02<2446:21:19, 29.50s/it]training loss: 5.844e-03:   0%|          | 1414/300001 [13:05:35<2531:44:30, 30.52s/it]training loss: 5.844e-03:   0%|          | 1415/300001 [13:06:08<2591:39:40, 31.25s/it]training loss: 5.844e-03:   0%|          | 1416/300001 [13:06:41<2634:45:38, 31.77s/it]training loss: 5.844e-03:   0%|          | 1417/300001 [13:07:13<2647:55:15, 31.93s/it]training loss: 5.844e-03:   0%|          | 1418/300001 [13:07:44<2612:46:33, 31.50s/it]training loss: 5.844e-03:   0%|          | 1419/300001 [13:08:17<2651:33:34, 31.97s/it]training loss: 5.844e-03:   0%|          | 1420/300001 [13:08:50<2666:09:27, 32.15s/it]training loss: 6.296e-03:   0%|          | 1420/300001 [13:09:21<2666:09:27, 32.15s/it]training loss: 6.296e-03:   0%|          | 1421/300001 [13:09:22<2667:16:41, 32.16s/it]training loss: 6.296e-03:   0%|          | 1422/300001 [13:09:53<2643:22:52, 31.87s/it]training loss: 6.296e-03:   0%|          | 1423/300001 [13:10:25<2657:51:53, 32.05s/it]training loss: 6.296e-03:   0%|          | 1424/300001 [13:10:58<2664:46:48, 32.13s/it]training loss: 6.296e-03:   0%|          | 1425/300001 [13:11:30<2665:54:46, 32.14s/it]training loss: 6.296e-03:   0%|          | 1426/300001 [13:12:03<2686:08:21, 32.39s/it]training loss: 6.296e-03:   0%|          | 1427/300001 [13:12:33<2635:38:40, 31.78s/it]training loss: 6.296e-03:   0%|          | 1428/300001 [13:13:05<2648:57:06, 31.94s/it]training loss: 6.296e-03:   0%|          | 1429/300001 [13:13:37<2627:10:02, 31.68s/it]training loss: 6.296e-03:   0%|          | 1430/300001 [13:14:10<2658:52:44, 32.06s/it]training loss: 6.296e-03:   0%|          | 1431/300001 [13:14:42<2679:56:07, 32.31s/it]training loss: 6.296e-03:   0%|          | 1432/300001 [13:15:14<2659:39:47, 32.07s/it]training loss: 6.296e-03:   0%|          | 1433/300001 [13:15:46<2649:39:19, 31.95s/it]training loss: 6.296e-03:   0%|          | 1434/300001 [13:16:17<2641:01:09, 31.84s/it]training loss: 6.296e-03:   0%|          | 1435/300001 [13:16:49<2630:48:47, 31.72s/it]training loss: 6.296e-03:   0%|          | 1436/300001 [13:17:21<2653:23:28, 31.99s/it]training loss: 6.296e-03:   0%|          | 1437/300001 [13:17:53<2636:45:16, 31.79s/it]training loss: 6.296e-03:   0%|          | 1438/300001 [13:18:25<2659:32:16, 32.07s/it]training loss: 6.296e-03:   0%|          | 1439/300001 [13:18:59<2694:38:27, 32.49s/it]training loss: 6.296e-03:   0%|          | 1440/300001 [13:19:31<2692:13:48, 32.46s/it]training loss: 6.822e-03:   0%|          | 1440/300001 [13:20:03<2692:13:48, 32.46s/it]training loss: 6.822e-03:   0%|          | 1441/300001 [13:20:03<2688:48:34, 32.42s/it]training loss: 6.822e-03:   0%|          | 1442/300001 [13:20:36<2701:40:00, 32.58s/it]training loss: 6.822e-03:   0%|          | 1443/300001 [13:21:08<2669:28:15, 32.19s/it]training loss: 6.822e-03:   0%|          | 1444/300001 [13:21:41<2692:28:20, 32.47s/it]training loss: 6.822e-03:   0%|          | 1445/300001 [13:22:13<2687:31:36, 32.41s/it]training loss: 6.822e-03:   0%|          | 1446/300001 [13:22:46<2693:37:19, 32.48s/it]training loss: 6.822e-03:   0%|          | 1447/300001 [13:23:18<2697:32:09, 32.53s/it]training loss: 6.822e-03:   0%|          | 1448/300001 [13:23:52<2724:13:07, 32.85s/it]training loss: 6.822e-03:   0%|          | 1449/300001 [13:24:24<2696:24:32, 32.51s/it]training loss: 6.822e-03:   0%|          | 1450/300001 [13:24:56<2684:21:13, 32.37s/it]training loss: 6.822e-03:   0%|          | 1451/300001 [13:25:29<2696:38:53, 32.52s/it]training loss: 6.822e-03:   0%|          | 1452/300001 [13:26:02<2710:19:21, 32.68s/it]training loss: 6.822e-03:   0%|          | 1453/300001 [13:26:34<2693:33:19, 32.48s/it]training loss: 6.822e-03:   0%|          | 1454/300001 [13:27:06<2685:35:08, 32.38s/it]training loss: 6.822e-03:   0%|          | 1455/300001 [13:27:38<2681:50:40, 32.34s/it]training loss: 6.822e-03:   0%|          | 1456/300001 [13:28:11<2687:19:55, 32.41s/it]training loss: 6.822e-03:   0%|          | 1457/300001 [13:28:44<2700:50:03, 32.57s/it]training loss: 6.822e-03:   0%|          | 1458/300001 [13:29:16<2699:22:02, 32.55s/it]training loss: 6.822e-03:   0%|          | 1459/300001 [13:29:49<2713:23:48, 32.72s/it]training loss: 6.822e-03:   0%|          | 1460/300001 [13:30:21<2694:18:39, 32.49s/it]training loss: 5.644e-03:   0%|          | 1460/300001 [13:30:53<2694:18:39, 32.49s/it]training loss: 5.644e-03:   0%|          | 1461/300001 [13:30:53<2681:01:27, 32.33s/it]training loss: 5.644e-03:   0%|          | 1462/300001 [13:31:27<2708:07:07, 32.66s/it]training loss: 5.644e-03:   0%|          | 1463/300001 [13:32:00<2726:02:29, 32.87s/it]training loss: 5.644e-03:   0%|          | 1464/300001 [13:32:32<2705:06:40, 32.62s/it]training loss: 5.644e-03:   0%|          | 1465/300001 [13:33:05<2706:53:23, 32.64s/it]training loss: 5.644e-03:   0%|          | 1466/300001 [13:33:37<2691:21:50, 32.45s/it]training loss: 5.644e-03:   0%|          | 1467/300001 [13:34:09<2701:28:21, 32.58s/it]training loss: 5.644e-03:   0%|          | 1468/300001 [13:34:42<2694:18:17, 32.49s/it]training loss: 5.644e-03:   0%|          | 1469/300001 [13:35:16<2728:31:20, 32.90s/it]training loss: 5.644e-03:   0%|          | 1470/300001 [13:35:48<2719:11:05, 32.79s/it]training loss: 5.644e-03:   0%|          | 1471/300001 [13:36:21<2709:18:16, 32.67s/it]training loss: 5.644e-03:   0%|          | 1472/300001 [13:36:52<2679:42:12, 32.31s/it]training loss: 5.644e-03:   0%|          | 1473/300001 [13:37:25<2694:22:54, 32.49s/it]training loss: 5.644e-03:   0%|          | 1474/300001 [13:37:56<2664:58:21, 32.14s/it]training loss: 5.644e-03:   0%|          | 1475/300001 [13:38:29<2670:14:45, 32.20s/it]training loss: 5.644e-03:   0%|          | 1476/300001 [13:38:59<2637:11:06, 31.80s/it]training loss: 5.644e-03:   0%|          | 1477/300001 [13:39:37<2767:34:46, 33.38s/it]training loss: 5.644e-03:   0%|          | 1478/300001 [13:40:07<2701:35:03, 32.58s/it]training loss: 5.644e-03:   0%|          | 1479/300001 [13:40:40<2712:14:28, 32.71s/it]training loss: 5.644e-03:   0%|          | 1480/300001 [13:41:12<2697:47:12, 32.53s/it]training loss: 6.769e-03:   0%|          | 1480/300001 [13:41:45<2697:47:12, 32.53s/it]training loss: 6.769e-03:   0%|          | 1481/300001 [13:41:45<2705:42:19, 32.63s/it]training loss: 6.769e-03:   0%|          | 1482/300001 [13:42:18<2700:44:20, 32.57s/it]training loss: 6.769e-03:   0%|          | 1483/300001 [13:42:51<2724:17:46, 32.85s/it]training loss: 6.769e-03:   0%|          | 1484/300001 [13:43:24<2717:26:36, 32.77s/it]training loss: 6.769e-03:   0%|          | 1485/300001 [13:43:55<2689:48:35, 32.44s/it]training loss: 6.769e-03:   0%|          | 1486/300001 [13:44:28<2694:15:47, 32.49s/it]training loss: 6.769e-03:   0%|          | 1487/300001 [13:45:01<2695:46:59, 32.51s/it]training loss: 6.769e-03:   0%|          | 1488/300001 [13:45:33<2694:39:09, 32.50s/it]training loss: 6.769e-03:   0%|          | 1489/300001 [13:46:06<2703:54:55, 32.61s/it]training loss: 6.769e-03:   0%|          | 1490/300001 [13:46:38<2689:43:34, 32.44s/it]training loss: 6.769e-03:   0%|          | 1491/300001 [13:47:11<2701:28:30, 32.58s/it]training loss: 6.769e-03:   0%|          | 1492/300001 [13:47:42<2668:13:43, 32.18s/it]training loss: 6.769e-03:   0%|          | 1493/300001 [13:48:14<2648:29:07, 31.94s/it]training loss: 6.769e-03:   0%|          | 1494/300001 [13:48:46<2658:55:20, 32.07s/it]training loss: 6.769e-03:   0%|          | 1495/300001 [13:49:18<2652:47:22, 31.99s/it]training loss: 6.769e-03:   0%|          | 1496/300001 [13:49:51<2679:19:30, 32.31s/it]training loss: 6.769e-03:   0%|          | 1497/300001 [13:50:22<2664:13:02, 32.13s/it]training loss: 6.769e-03:   0%|          | 1498/300001 [13:50:56<2692:25:30, 32.47s/it]training loss: 6.769e-03:   0%|          | 1499/300001 [13:51:29<2706:41:57, 32.64s/it]training loss: 6.769e-03:   0%|          | 1500/300001 [13:52:01<2701:10:51, 32.58s/it]training loss: 6.362e-03:   0%|          | 1500/300001 [13:52:34<2701:10:51, 32.58s/it]training loss: 6.362e-03:   1%|          | 1501/300001 [13:52:38<2803:15:48, 33.81s/it]training loss: 6.362e-03:   1%|          | 1502/300001 [13:53:11<2793:25:40, 33.69s/it]training loss: 6.362e-03:   1%|          | 1503/300001 [13:53:45<2784:02:09, 33.58s/it]training loss: 6.362e-03:   1%|          | 1504/300001 [13:54:16<2739:34:05, 33.04s/it]training loss: 6.362e-03:   1%|          | 1505/300001 [13:54:49<2730:54:13, 32.94s/it]training loss: 6.362e-03:   1%|          | 1506/300001 [13:55:22<2731:54:54, 32.95s/it]training loss: 6.362e-03:   1%|          | 1507/300001 [13:55:55<2741:17:47, 33.06s/it]training loss: 6.362e-03:   1%|          | 1508/300001 [13:56:28<2721:33:29, 32.82s/it]training loss: 6.362e-03:   1%|          | 1509/300001 [13:57:00<2704:06:15, 32.61s/it]training loss: 6.362e-03:   1%|          | 1510/300001 [13:57:32<2703:12:29, 32.60s/it]training loss: 6.362e-03:   1%|          | 1511/300001 [13:58:04<2687:31:47, 32.41s/it]training loss: 6.362e-03:   1%|          | 1512/300001 [13:58:38<2715:02:15, 32.75s/it]training loss: 6.362e-03:   1%|          | 1513/300001 [13:59:10<2707:02:37, 32.65s/it]training loss: 6.362e-03:   1%|          | 1514/300001 [13:59:44<2724:59:45, 32.87s/it]training loss: 6.362e-03:   1%|          | 1515/300001 [14:00:17<2731:46:36, 32.95s/it]training loss: 6.362e-03:   1%|          | 1516/300001 [14:00:50<2746:41:04, 33.13s/it]training loss: 6.362e-03:   1%|          | 1517/300001 [14:01:22<2707:36:23, 32.66s/it]training loss: 6.362e-03:   1%|          | 1518/300001 [14:01:54<2682:55:42, 32.36s/it]training loss: 6.362e-03:   1%|          | 1519/300001 [14:02:26<2691:52:25, 32.47s/it]training loss: 6.362e-03:   1%|          | 1520/300001 [14:02:58<2666:59:26, 32.17s/it]training loss: 6.393e-03:   1%|          | 1520/300001 [14:03:30<2666:59:26, 32.17s/it]training loss: 6.393e-03:   1%|          | 1521/300001 [14:03:30<2661:55:30, 32.11s/it]training loss: 6.393e-03:   1%|          | 1522/300001 [14:04:03<2685:40:19, 32.39s/it]training loss: 6.393e-03:   1%|          | 1523/300001 [14:04:35<2693:18:40, 32.48s/it]training loss: 6.393e-03:   1%|          | 1524/300001 [14:05:08<2686:22:59, 32.40s/it]training loss: 6.393e-03:   1%|          | 1525/300001 [14:05:40<2679:45:38, 32.32s/it]training loss: 6.393e-03:   1%|          | 1526/300001 [14:06:12<2668:38:31, 32.19s/it]training loss: 6.393e-03:   1%|          | 1527/300001 [14:06:45<2689:07:11, 32.43s/it]training loss: 6.393e-03:   1%|          | 1528/300001 [14:07:17<2696:24:04, 32.52s/it]training loss: 6.393e-03:   1%|          | 1529/300001 [14:07:50<2706:35:38, 32.65s/it]training loss: 6.393e-03:   1%|          | 1530/300001 [14:08:22<2694:05:33, 32.49s/it]training loss: 6.393e-03:   1%|          | 1531/300001 [14:08:55<2696:30:17, 32.52s/it]training loss: 6.393e-03:   1%|          | 1532/300001 [14:09:28<2697:58:03, 32.54s/it]training loss: 6.393e-03:   1%|          | 1533/300001 [14:10:00<2691:51:12, 32.47s/it]training loss: 6.393e-03:   1%|          | 1534/300001 [14:10:33<2717:51:09, 32.78s/it]training loss: 6.393e-03:   1%|          | 1535/300001 [14:11:05<2691:18:40, 32.46s/it]training loss: 6.393e-03:   1%|          | 1536/300001 [14:11:37<2678:34:19, 32.31s/it]training loss: 6.393e-03:   1%|          | 1537/300001 [14:12:08<2650:16:14, 31.97s/it]training loss: 6.393e-03:   1%|          | 1538/300001 [14:12:41<2679:30:20, 32.32s/it]training loss: 6.393e-03:   1%|          | 1539/300001 [14:13:13<2669:26:09, 32.20s/it]training loss: 6.393e-03:   1%|          | 1540/300001 [14:13:45<2664:22:54, 32.14s/it]training loss: 6.439e-03:   1%|          | 1540/300001 [14:14:16<2664:22:54, 32.14s/it]training loss: 6.439e-03:   1%|          | 1541/300001 [14:14:16<2637:08:04, 31.81s/it]training loss: 6.439e-03:   1%|          | 1542/300001 [14:14:48<2620:22:16, 31.61s/it]training loss: 6.439e-03:   1%|          | 1543/300001 [14:15:20<2631:41:10, 31.74s/it]training loss: 6.439e-03:   1%|          | 1544/300001 [14:15:52<2649:50:35, 31.96s/it]training loss: 6.439e-03:   1%|          | 1545/300001 [14:16:24<2656:29:10, 32.04s/it]training loss: 6.439e-03:   1%|          | 1546/300001 [14:16:58<2692:32:26, 32.48s/it]training loss: 6.439e-03:   1%|          | 1547/300001 [14:17:29<2671:29:47, 32.22s/it]training loss: 6.439e-03:   1%|          | 1548/300001 [14:18:02<2674:20:16, 32.26s/it]training loss: 6.439e-03:   1%|          | 1549/300001 [14:18:34<2669:56:36, 32.21s/it]training loss: 6.439e-03:   1%|          | 1550/300001 [14:19:07<2702:10:38, 32.59s/it]training loss: 6.439e-03:   1%|          | 1551/300001 [14:19:40<2702:26:51, 32.60s/it]training loss: 6.439e-03:   1%|          | 1552/300001 [14:20:12<2692:30:21, 32.48s/it]training loss: 6.439e-03:   1%|          | 1553/300001 [14:20:46<2714:19:58, 32.74s/it]training loss: 6.439e-03:   1%|          | 1554/300001 [14:21:18<2712:27:47, 32.72s/it]training loss: 6.439e-03:   1%|          | 1555/300001 [14:21:51<2726:57:21, 32.89s/it]training loss: 6.439e-03:   1%|          | 1556/300001 [14:22:25<2732:27:55, 32.96s/it]training loss: 6.439e-03:   1%|          | 1557/300001 [14:22:57<2727:44:34, 32.90s/it]training loss: 6.439e-03:   1%|          | 1558/300001 [14:23:29<2707:36:25, 32.66s/it]training loss: 6.439e-03:   1%|          | 1559/300001 [14:24:02<2702:39:53, 32.60s/it]training loss: 6.439e-03:   1%|          | 1560/300001 [14:24:35<2714:09:43, 32.74s/it]training loss: 6.638e-03:   1%|          | 1560/300001 [14:25:07<2714:09:43, 32.74s/it]training loss: 6.638e-03:   1%|          | 1561/300001 [14:25:07<2707:37:10, 32.66s/it]training loss: 6.638e-03:   1%|          | 1562/300001 [14:25:39<2681:38:49, 32.35s/it]training loss: 6.638e-03:   1%|          | 1563/300001 [14:26:12<2686:23:35, 32.41s/it]training loss: 6.638e-03:   1%|          | 1564/300001 [14:26:43<2672:26:12, 32.24s/it]training loss: 6.638e-03:   1%|          | 1565/300001 [14:27:16<2684:57:19, 32.39s/it]training loss: 6.638e-03:   1%|          | 1566/300001 [14:27:48<2665:39:15, 32.16s/it]training loss: 6.638e-03:   1%|          | 1567/300001 [14:28:20<2662:27:30, 32.12s/it]training loss: 6.638e-03:   1%|          | 1568/300001 [14:28:52<2661:33:43, 32.11s/it]training loss: 6.638e-03:   1%|          | 1569/300001 [14:29:23<2635:05:48, 31.79s/it]training loss: 6.638e-03:   1%|          | 1570/300001 [14:29:46<2408:51:23, 29.06s/it]training loss: 6.638e-03:   1%|          | 1571/300001 [14:30:17<2467:04:01, 29.76s/it]training loss: 6.638e-03:   1%|          | 1572/300001 [14:30:50<2546:55:27, 30.72s/it]training loss: 6.638e-03:   1%|          | 1573/300001 [14:31:22<2574:13:17, 31.05s/it]training loss: 6.638e-03:   1%|          | 1574/300001 [14:31:53<2587:54:53, 31.22s/it]training loss: 6.638e-03:   1%|          | 1575/300001 [14:32:27<2641:48:15, 31.87s/it]training loss: 6.638e-03:   1%|          | 1576/300001 [14:32:59<2660:55:45, 32.10s/it]training loss: 6.638e-03:   1%|          | 1577/300001 [14:33:32<2673:24:38, 32.25s/it]training loss: 6.638e-03:   1%|          | 1578/300001 [14:34:04<2675:46:29, 32.28s/it]training loss: 6.638e-03:   1%|          | 1579/300001 [14:34:36<2662:54:32, 32.12s/it]training loss: 6.638e-03:   1%|          | 1580/300001 [14:35:08<2661:29:56, 32.11s/it]training loss: 5.934e-03:   1%|          | 1580/300001 [14:35:40<2661:29:56, 32.11s/it]training loss: 5.934e-03:   1%|          | 1581/300001 [14:35:40<2657:18:07, 32.06s/it]training loss: 5.934e-03:   1%|          | 1582/300001 [14:36:12<2658:01:56, 32.07s/it]training loss: 5.934e-03:   1%|          | 1583/300001 [14:36:44<2651:35:12, 31.99s/it]training loss: 5.934e-03:   1%|          | 1584/300001 [14:37:17<2676:53:02, 32.29s/it]training loss: 5.934e-03:   1%|          | 1585/300001 [14:37:49<2665:30:40, 32.16s/it]training loss: 5.934e-03:   1%|          | 1586/300001 [14:38:21<2662:37:55, 32.12s/it]training loss: 5.934e-03:   1%|          | 1587/300001 [14:38:53<2668:37:26, 32.19s/it]training loss: 5.934e-03:   1%|          | 1588/300001 [14:39:26<2668:16:01, 32.19s/it]training loss: 5.934e-03:   1%|          | 1589/300001 [14:39:57<2650:21:35, 31.97s/it]training loss: 5.934e-03:   1%|          | 1590/300001 [14:40:30<2683:34:15, 32.37s/it]training loss: 5.934e-03:   1%|          | 1591/300001 [14:41:03<2680:32:38, 32.34s/it]training loss: 5.934e-03:   1%|          | 1592/300001 [14:41:34<2668:40:31, 32.19s/it]training loss: 5.934e-03:   1%|          | 1593/300001 [14:42:06<2660:59:36, 32.10s/it]training loss: 5.934e-03:   1%|          | 1594/300001 [14:42:40<2698:39:39, 32.56s/it]training loss: 5.934e-03:   1%|          | 1595/300001 [14:43:12<2691:23:20, 32.47s/it]training loss: 5.934e-03:   1%|          | 1596/300001 [14:43:44<2664:45:56, 32.15s/it]training loss: 5.934e-03:   1%|          | 1597/300001 [14:44:15<2658:00:51, 32.07s/it]training loss: 5.934e-03:   1%|          | 1598/300001 [14:44:50<2707:04:34, 32.66s/it]training loss: 5.934e-03:   1%|          | 1599/300001 [14:45:21<2683:46:45, 32.38s/it]training loss: 5.934e-03:   1%|          | 1600/300001 [14:45:53<2668:17:41, 32.19s/it]training loss: 6.752e-03:   1%|          | 1600/300001 [14:46:25<2668:17:41, 32.19s/it]training loss: 6.752e-03:   1%|          | 1601/300001 [14:46:25<2664:48:18, 32.15s/it]training loss: 6.752e-03:   1%|          | 1602/300001 [14:46:57<2655:10:54, 32.03s/it]training loss: 6.752e-03:   1%|          | 1603/300001 [14:47:30<2680:24:52, 32.34s/it]training loss: 6.752e-03:   1%|          | 1604/300001 [14:48:01<2641:56:28, 31.87s/it]training loss: 6.752e-03:   1%|          | 1605/300001 [14:48:32<2635:15:09, 31.79s/it]training loss: 6.752e-03:   1%|          | 1606/300001 [14:49:05<2658:13:19, 32.07s/it]training loss: 6.752e-03:   1%|          | 1607/300001 [14:49:37<2652:15:22, 32.00s/it]training loss: 6.752e-03:   1%|          | 1608/300001 [14:50:10<2670:41:17, 32.22s/it]training loss: 6.752e-03:   1%|          | 1609/300001 [14:50:42<2681:52:24, 32.36s/it]training loss: 6.752e-03:   1%|          | 1610/300001 [14:51:16<2706:39:27, 32.66s/it]training loss: 6.752e-03:   1%|          | 1611/300001 [14:51:47<2678:33:46, 32.32s/it]training loss: 6.752e-03:   1%|          | 1612/300001 [14:52:20<2683:31:37, 32.38s/it]training loss: 6.752e-03:   1%|          | 1613/300001 [14:52:51<2668:55:58, 32.20s/it]training loss: 6.752e-03:   1%|          | 1614/300001 [14:53:23<2654:34:00, 32.03s/it]training loss: 6.752e-03:   1%|          | 1615/300001 [14:53:56<2680:15:06, 32.34s/it]training loss: 6.752e-03:   1%|          | 1616/300001 [14:54:29<2705:33:29, 32.64s/it]training loss: 6.752e-03:   1%|          | 1617/300001 [14:55:02<2706:46:56, 32.66s/it]training loss: 6.752e-03:   1%|          | 1618/300001 [14:55:35<2719:16:54, 32.81s/it]training loss: 6.752e-03:   1%|          | 1619/300001 [14:56:07<2702:34:00, 32.61s/it]training loss: 6.752e-03:   1%|          | 1620/300001 [14:56:40<2701:37:56, 32.60s/it]training loss: 6.198e-03:   1%|          | 1620/300001 [14:57:12<2701:37:56, 32.60s/it]training loss: 6.198e-03:   1%|          | 1621/300001 [14:57:12<2694:10:36, 32.51s/it]training loss: 6.198e-03:   1%|          | 1622/300001 [14:57:44<2685:58:58, 32.41s/it]training loss: 6.198e-03:   1%|          | 1623/300001 [14:58:17<2696:58:12, 32.54s/it]training loss: 6.198e-03:   1%|          | 1624/300001 [14:58:49<2684:24:54, 32.39s/it]training loss: 6.198e-03:   1%|          | 1625/300001 [14:59:23<2725:39:25, 32.89s/it]training loss: 6.198e-03:   1%|          | 1626/300001 [14:59:56<2722:16:34, 32.85s/it]training loss: 6.198e-03:   1%|          | 1627/300001 [15:00:29<2732:58:39, 32.97s/it]training loss: 6.198e-03:   1%|          | 1628/300001 [15:01:03<2739:02:42, 33.05s/it]training loss: 6.198e-03:   1%|          | 1629/300001 [15:01:34<2699:45:22, 32.57s/it]training loss: 6.198e-03:   1%|          | 1630/300001 [15:02:06<2685:35:13, 32.40s/it]training loss: 6.198e-03:   1%|          | 1631/300001 [15:02:38<2673:17:06, 32.25s/it]training loss: 6.198e-03:   1%|          | 1632/300001 [15:03:10<2665:51:27, 32.17s/it]training loss: 6.198e-03:   1%|          | 1633/300001 [15:03:43<2681:18:22, 32.35s/it]training loss: 6.198e-03:   1%|          | 1634/300001 [15:04:15<2679:45:39, 32.33s/it]training loss: 6.198e-03:   1%|          | 1635/300001 [15:04:48<2693:50:02, 32.50s/it]training loss: 6.198e-03:   1%|          | 1636/300001 [15:05:21<2705:24:48, 32.64s/it]training loss: 6.198e-03:   1%|          | 1637/300001 [15:05:54<2720:07:34, 32.82s/it]training loss: 6.198e-03:   1%|          | 1638/300001 [15:06:27<2711:16:55, 32.71s/it]training loss: 6.198e-03:   1%|          | 1639/300001 [15:06:59<2699:37:04, 32.57s/it]training loss: 6.198e-03:   1%|          | 1640/300001 [15:07:33<2738:05:40, 33.04s/it]training loss: 6.128e-03:   1%|          | 1640/300001 [15:08:05<2738:05:40, 33.04s/it]training loss: 6.128e-03:   1%|          | 1641/300001 [15:08:05<2711:57:46, 32.72s/it]training loss: 6.128e-03:   1%|          | 1642/300001 [15:08:37<2700:36:14, 32.59s/it]training loss: 6.128e-03:   1%|          | 1643/300001 [15:09:08<2662:40:05, 32.13s/it]training loss: 6.128e-03:   1%|          | 1644/300001 [15:09:41<2665:03:37, 32.16s/it]training loss: 6.128e-03:   1%|          | 1645/300001 [15:10:13<2683:38:24, 32.38s/it]training loss: 6.128e-03:   1%|          | 1646/300001 [15:10:47<2706:27:27, 32.66s/it]training loss: 6.128e-03:   1%|          | 1647/300001 [15:11:21<2749:47:00, 33.18s/it]training loss: 6.128e-03:   1%|          | 1648/300001 [15:11:54<2749:25:19, 33.18s/it]training loss: 6.128e-03:   1%|          | 1649/300001 [15:12:26<2707:09:07, 32.67s/it]training loss: 6.128e-03:   1%|          | 1650/300001 [15:12:58<2706:41:31, 32.66s/it]training loss: 6.128e-03:   1%|          | 1651/300001 [15:13:31<2706:18:05, 32.66s/it]training loss: 6.128e-03:   1%|          | 1652/300001 [15:14:02<2665:38:07, 32.16s/it]training loss: 6.128e-03:   1%|          | 1653/300001 [15:14:35<2685:01:25, 32.40s/it]training loss: 6.128e-03:   1%|          | 1654/300001 [15:15:07<2668:54:51, 32.20s/it]training loss: 6.128e-03:   1%|          | 1655/300001 [15:15:38<2648:04:20, 31.95s/it]training loss: 6.128e-03:   1%|          | 1656/300001 [15:16:10<2643:34:34, 31.90s/it]training loss: 6.128e-03:   1%|          | 1657/300001 [15:16:44<2686:38:48, 32.42s/it]training loss: 6.128e-03:   1%|          | 1658/300001 [15:17:15<2669:26:21, 32.21s/it]training loss: 6.128e-03:   1%|          | 1659/300001 [15:17:47<2666:36:32, 32.18s/it]training loss: 6.128e-03:   1%|          | 1660/300001 [15:18:20<2678:58:52, 32.33s/it]training loss: 6.565e-03:   1%|          | 1660/300001 [15:18:52<2678:58:52, 32.33s/it]training loss: 6.565e-03:   1%|          | 1661/300001 [15:18:52<2670:00:15, 32.22s/it]training loss: 6.565e-03:   1%|          | 1662/300001 [15:19:25<2678:08:33, 32.32s/it]training loss: 6.565e-03:   1%|          | 1663/300001 [15:19:57<2683:17:04, 32.38s/it]training loss: 6.565e-03:   1%|          | 1664/300001 [15:20:29<2666:24:42, 32.18s/it]training loss: 6.565e-03:   1%|          | 1665/300001 [15:21:00<2652:22:35, 32.01s/it]training loss: 6.565e-03:   1%|          | 1666/300001 [15:21:32<2649:10:20, 31.97s/it]training loss: 6.565e-03:   1%|          | 1667/300001 [15:22:04<2649:33:14, 31.97s/it]training loss: 6.565e-03:   1%|          | 1668/300001 [15:22:37<2667:53:59, 32.19s/it]training loss: 6.565e-03:   1%|          | 1669/300001 [15:23:09<2665:13:36, 32.16s/it]training loss: 6.565e-03:   1%|          | 1670/300001 [15:23:42<2685:59:39, 32.41s/it]training loss: 6.565e-03:   1%|          | 1671/300001 [15:24:14<2680:58:39, 32.35s/it]training loss: 6.565e-03:   1%|          | 1672/300001 [15:24:47<2686:19:13, 32.42s/it]training loss: 6.565e-03:   1%|          | 1673/300001 [15:25:19<2674:18:04, 32.27s/it]training loss: 6.565e-03:   1%|          | 1674/300001 [15:25:52<2706:53:12, 32.66s/it]training loss: 6.565e-03:   1%|          | 1675/300001 [15:26:25<2703:25:08, 32.62s/it]training loss: 6.565e-03:   1%|          | 1676/300001 [15:26:56<2672:57:32, 32.26s/it]training loss: 6.565e-03:   1%|          | 1677/300001 [15:27:29<2673:02:39, 32.26s/it]training loss: 6.565e-03:   1%|          | 1678/300001 [15:28:01<2670:31:56, 32.23s/it]training loss: 6.565e-03:   1%|          | 1679/300001 [15:28:33<2681:07:42, 32.35s/it]training loss: 6.565e-03:   1%|          | 1680/300001 [15:29:06<2701:02:40, 32.59s/it]training loss: 6.493e-03:   1%|          | 1680/300001 [15:29:40<2701:02:40, 32.59s/it]training loss: 6.493e-03:   1%|          | 1681/300001 [15:29:40<2724:30:30, 32.88s/it]training loss: 6.493e-03:   1%|          | 1682/300001 [15:30:13<2717:10:01, 32.79s/it]training loss: 6.493e-03:   1%|          | 1683/300001 [15:30:45<2712:39:19, 32.74s/it]training loss: 6.493e-03:   1%|          | 1684/300001 [15:31:20<2751:39:08, 33.21s/it]training loss: 6.493e-03:   1%|          | 1685/300001 [15:31:53<2751:57:44, 33.21s/it]training loss: 6.493e-03:   1%|          | 1686/300001 [15:32:25<2733:41:28, 32.99s/it]training loss: 6.493e-03:   1%|          | 1687/300001 [15:32:58<2724:26:12, 32.88s/it]training loss: 6.493e-03:   1%|          | 1688/300001 [15:33:29<2679:31:40, 32.34s/it]training loss: 6.493e-03:   1%|          | 1689/300001 [15:34:02<2688:22:21, 32.44s/it]training loss: 6.493e-03:   1%|          | 1690/300001 [15:34:33<2658:47:13, 32.09s/it]training loss: 6.493e-03:   1%|          | 1691/300001 [15:35:05<2652:56:59, 32.02s/it]training loss: 6.493e-03:   1%|          | 1692/300001 [15:35:37<2661:38:35, 32.12s/it]training loss: 6.493e-03:   1%|          | 1693/300001 [15:36:10<2681:33:40, 32.36s/it]training loss: 6.493e-03:   1%|          | 1694/300001 [15:36:42<2684:31:34, 32.40s/it]training loss: 6.493e-03:   1%|          | 1695/300001 [15:37:14<2659:34:43, 32.10s/it]training loss: 6.493e-03:   1%|          | 1696/300001 [15:37:47<2686:19:52, 32.42s/it]training loss: 6.493e-03:   1%|          | 1697/300001 [15:38:19<2679:41:25, 32.34s/it]training loss: 6.493e-03:   1%|          | 1698/300001 [15:38:51<2660:53:14, 32.11s/it]training loss: 6.493e-03:   1%|          | 1699/300001 [15:39:23<2655:41:13, 32.05s/it]training loss: 6.493e-03:   1%|          | 1700/300001 [15:39:56<2676:53:11, 32.31s/it]training loss: 5.503e-03:   1%|          | 1700/300001 [15:40:29<2676:53:11, 32.31s/it]training loss: 5.503e-03:   1%|          | 1701/300001 [15:40:29<2702:02:27, 32.61s/it]training loss: 5.503e-03:   1%|          | 1702/300001 [15:41:01<2694:36:10, 32.52s/it]training loss: 5.503e-03:   1%|          | 1703/300001 [15:41:33<2685:10:18, 32.41s/it]training loss: 5.503e-03:   1%|          | 1704/300001 [15:42:05<2675:24:48, 32.29s/it]training loss: 5.503e-03:   1%|          | 1705/300001 [15:42:38<2683:51:30, 32.39s/it]training loss: 5.503e-03:   1%|          | 1706/300001 [15:43:10<2678:37:14, 32.33s/it]training loss: 5.503e-03:   1%|          | 1707/300001 [15:43:42<2670:17:22, 32.23s/it]training loss: 5.503e-03:   1%|          | 1708/300001 [15:44:15<2674:39:37, 32.28s/it]training loss: 5.503e-03:   1%|          | 1709/300001 [15:44:45<2633:15:34, 31.78s/it]training loss: 5.503e-03:   1%|          | 1710/300001 [15:45:17<2629:16:23, 31.73s/it]training loss: 5.503e-03:   1%|          | 1711/300001 [15:45:51<2691:57:29, 32.49s/it]training loss: 5.503e-03:   1%|          | 1712/300001 [15:46:23<2680:39:34, 32.35s/it]training loss: 5.503e-03:   1%|          | 1713/300001 [15:46:56<2692:14:47, 32.49s/it]training loss: 5.503e-03:   1%|          | 1714/300001 [15:47:28<2689:23:12, 32.46s/it]training loss: 5.503e-03:   1%|          | 1715/300001 [15:48:00<2676:52:51, 32.31s/it]training loss: 5.503e-03:   1%|          | 1716/300001 [15:48:32<2674:15:33, 32.28s/it]training loss: 5.503e-03:   1%|          | 1717/300001 [15:49:04<2667:40:18, 32.20s/it]training loss: 5.503e-03:   1%|          | 1718/300001 [15:49:37<2666:53:21, 32.19s/it]training loss: 5.503e-03:   1%|          | 1719/300001 [15:50:10<2693:45:13, 32.51s/it]training loss: 5.503e-03:   1%|          | 1720/300001 [15:50:43<2709:00:36, 32.70s/it]training loss: 7.025e-03:   1%|          | 1720/300001 [15:51:16<2709:00:36, 32.70s/it]training loss: 7.025e-03:   1%|          | 1721/300001 [15:51:16<2709:15:15, 32.70s/it]training loss: 7.025e-03:   1%|          | 1722/300001 [15:51:48<2708:42:13, 32.69s/it]training loss: 7.025e-03:   1%|          | 1723/300001 [15:52:21<2715:51:17, 32.78s/it]training loss: 7.025e-03:   1%|          | 1724/300001 [15:52:53<2696:41:29, 32.55s/it]training loss: 7.025e-03:   1%|          | 1725/300001 [15:53:26<2697:26:05, 32.56s/it]training loss: 7.025e-03:   1%|          | 1726/300001 [15:53:58<2683:19:59, 32.39s/it]training loss: 7.025e-03:   1%|          | 1727/300001 [15:54:22<2464:12:48, 29.74s/it]training loss: 7.025e-03:   1%|          | 1728/300001 [15:54:53<2505:57:53, 30.25s/it]training loss: 7.025e-03:   1%|          | 1729/300001 [15:55:25<2555:25:41, 30.84s/it]training loss: 7.025e-03:   1%|          | 1730/300001 [15:55:59<2627:37:04, 31.71s/it]training loss: 7.025e-03:   1%|          | 1731/300001 [15:56:31<2632:17:01, 31.77s/it]training loss: 7.025e-03:   1%|          | 1732/300001 [15:57:03<2652:20:56, 32.01s/it]training loss: 7.025e-03:   1%|          | 1733/300001 [15:57:36<2655:59:24, 32.06s/it]training loss: 7.025e-03:   1%|          | 1734/300001 [15:58:08<2669:58:57, 32.23s/it]training loss: 7.025e-03:   1%|          | 1735/300001 [15:58:40<2670:17:47, 32.23s/it]training loss: 7.025e-03:   1%|          | 1736/300001 [15:59:13<2668:49:09, 32.21s/it]training loss: 7.025e-03:   1%|          | 1737/300001 [15:59:45<2676:44:07, 32.31s/it]training loss: 7.025e-03:   1%|          | 1738/300001 [16:00:19<2708:23:58, 32.69s/it]training loss: 7.025e-03:   1%|          | 1739/300001 [16:00:50<2685:20:16, 32.41s/it]training loss: 7.025e-03:   1%|          | 1740/300001 [16:01:23<2689:11:52, 32.46s/it]training loss: 5.643e-03:   1%|          | 1740/300001 [16:01:56<2689:11:52, 32.46s/it]training loss: 5.643e-03:   1%|          | 1741/300001 [16:01:56<2700:04:10, 32.59s/it]training loss: 5.643e-03:   1%|          | 1742/300001 [16:02:29<2703:29:42, 32.63s/it]training loss: 5.643e-03:   1%|          | 1743/300001 [16:03:01<2691:08:24, 32.48s/it]training loss: 5.643e-03:   1%|          | 1744/300001 [16:03:33<2690:19:53, 32.47s/it]training loss: 5.643e-03:   1%|          | 1745/300001 [16:04:05<2673:35:46, 32.27s/it]training loss: 5.643e-03:   1%|          | 1746/300001 [16:04:37<2663:06:40, 32.14s/it]training loss: 5.643e-03:   1%|          | 1747/300001 [16:05:09<2654:06:28, 32.04s/it]training loss: 5.643e-03:   1%|          | 1748/300001 [16:05:42<2674:44:02, 32.28s/it]training loss: 5.643e-03:   1%|          | 1749/300001 [16:06:14<2686:36:14, 32.43s/it]training loss: 5.643e-03:   1%|          | 1750/300001 [16:06:47<2681:56:56, 32.37s/it]training loss: 5.643e-03:   1%|          | 1751/300001 [16:07:19<2676:54:34, 32.31s/it]training loss: 5.643e-03:   1%|          | 1752/300001 [16:07:51<2668:59:54, 32.22s/it]training loss: 5.643e-03:   1%|          | 1753/300001 [16:08:23<2667:45:18, 32.20s/it]training loss: 5.643e-03:   1%|          | 1754/300001 [16:08:55<2668:47:34, 32.21s/it]training loss: 5.643e-03:   1%|          | 1755/300001 [16:09:28<2675:28:00, 32.29s/it]training loss: 5.643e-03:   1%|          | 1756/300001 [16:09:59<2657:25:43, 32.08s/it]training loss: 5.643e-03:   1%|          | 1757/300001 [16:10:31<2656:28:47, 32.07s/it]training loss: 5.643e-03:   1%|          | 1758/300001 [16:11:05<2710:25:01, 32.72s/it]training loss: 5.643e-03:   1%|          | 1759/300001 [16:11:38<2715:40:09, 32.78s/it]training loss: 5.643e-03:   1%|          | 1760/300001 [16:12:10<2696:56:43, 32.55s/it]training loss: 6.215e-03:   1%|          | 1760/300001 [16:12:44<2696:56:43, 32.55s/it]training loss: 6.215e-03:   1%|          | 1761/300001 [16:12:44<2715:42:35, 32.78s/it]training loss: 6.215e-03:   1%|          | 1762/300001 [16:13:16<2707:29:28, 32.68s/it]training loss: 6.215e-03:   1%|          | 1763/300001 [16:13:49<2714:49:13, 32.77s/it]training loss: 6.215e-03:   1%|          | 1764/300001 [16:14:21<2695:54:27, 32.54s/it]training loss: 6.215e-03:   1%|          | 1765/300001 [16:14:54<2702:41:23, 32.62s/it]training loss: 6.215e-03:   1%|          | 1766/300001 [16:15:26<2692:53:22, 32.51s/it]training loss: 6.215e-03:   1%|          | 1767/300001 [16:15:58<2672:42:28, 32.26s/it]training loss: 6.215e-03:   1%|          | 1768/300001 [16:16:30<2669:59:18, 32.23s/it]training loss: 6.215e-03:   1%|          | 1769/300001 [16:17:03<2679:51:53, 32.35s/it]training loss: 6.215e-03:   1%|          | 1770/300001 [16:17:35<2677:29:40, 32.32s/it]training loss: 6.215e-03:   1%|          | 1771/300001 [16:18:08<2686:41:59, 32.43s/it]training loss: 6.215e-03:   1%|          | 1772/300001 [16:18:40<2684:10:55, 32.40s/it]training loss: 6.215e-03:   1%|          | 1773/300001 [16:19:13<2708:14:55, 32.69s/it]training loss: 6.215e-03:   1%|          | 1774/300001 [16:19:45<2690:44:32, 32.48s/it]training loss: 6.215e-03:   1%|          | 1775/300001 [16:20:18<2702:21:45, 32.62s/it]training loss: 6.215e-03:   1%|          | 1776/300001 [16:20:51<2713:38:41, 32.76s/it]training loss: 6.215e-03:   1%|          | 1777/300001 [16:21:25<2730:54:51, 32.97s/it]training loss: 6.215e-03:   1%|          | 1778/300001 [16:21:59<2752:52:03, 33.23s/it]training loss: 6.215e-03:   1%|          | 1779/300001 [16:22:29<2684:54:01, 32.41s/it]training loss: 6.215e-03:   1%|          | 1780/300001 [16:23:02<2695:42:19, 32.54s/it]training loss: 6.240e-03:   1%|          | 1780/300001 [16:23:34<2695:42:19, 32.54s/it]training loss: 6.240e-03:   1%|          | 1781/300001 [16:23:34<2687:37:22, 32.44s/it]training loss: 6.240e-03:   1%|          | 1782/300001 [16:24:07<2697:26:23, 32.56s/it]training loss: 6.240e-03:   1%|          | 1783/300001 [16:24:39<2686:50:10, 32.43s/it]training loss: 6.240e-03:   1%|          | 1784/300001 [16:25:11<2667:57:32, 32.21s/it]training loss: 6.240e-03:   1%|          | 1785/300001 [16:25:45<2709:09:59, 32.70s/it]training loss: 6.240e-03:   1%|          | 1786/300001 [16:26:17<2705:01:56, 32.65s/it]training loss: 6.240e-03:   1%|          | 1787/300001 [16:26:49<2691:02:52, 32.49s/it]training loss: 6.240e-03:   1%|          | 1788/300001 [16:27:22<2705:27:03, 32.66s/it]training loss: 6.240e-03:   1%|          | 1789/300001 [16:27:55<2694:14:33, 32.52s/it]training loss: 6.240e-03:   1%|          | 1790/300001 [16:28:27<2698:31:46, 32.58s/it]training loss: 6.240e-03:   1%|          | 1791/300001 [16:29:00<2706:00:34, 32.67s/it]training loss: 6.240e-03:   1%|          | 1792/300001 [16:29:34<2723:20:36, 32.88s/it]training loss: 6.240e-03:   1%|          | 1793/300001 [16:30:06<2709:06:54, 32.70s/it]training loss: 6.240e-03:   1%|          | 1794/300001 [16:30:37<2681:46:43, 32.37s/it]training loss: 6.240e-03:   1%|          | 1795/300001 [16:31:10<2681:39:53, 32.37s/it]training loss: 6.240e-03:   1%|          | 1796/300001 [16:31:42<2680:41:00, 32.36s/it]training loss: 6.240e-03:   1%|          | 1797/300001 [16:32:15<2699:36:11, 32.59s/it]training loss: 6.240e-03:   1%|          | 1798/300001 [16:32:47<2667:35:21, 32.20s/it]training loss: 6.240e-03:   1%|          | 1799/300001 [16:33:18<2659:13:58, 32.10s/it]training loss: 6.240e-03:   1%|          | 1800/300001 [16:33:50<2649:45:18, 31.99s/it]training loss: 5.854e-03:   1%|          | 1800/300001 [16:34:22<2649:45:18, 31.99s/it]training loss: 5.854e-03:   1%|          | 1801/300001 [16:34:22<2656:01:28, 32.06s/it]training loss: 5.854e-03:   1%|          | 1802/300001 [16:34:54<2648:43:31, 31.98s/it]training loss: 5.854e-03:   1%|          | 1803/300001 [16:35:26<2646:48:40, 31.95s/it]training loss: 5.854e-03:   1%|          | 1804/300001 [16:36:00<2696:16:02, 32.55s/it]training loss: 5.854e-03:   1%|          | 1805/300001 [16:36:33<2709:51:40, 32.72s/it]training loss: 5.854e-03:   1%|          | 1806/300001 [16:37:05<2692:59:21, 32.51s/it]training loss: 5.854e-03:   1%|          | 1807/300001 [16:37:38<2695:11:19, 32.54s/it]training loss: 5.854e-03:   1%|          | 1808/300001 [16:38:11<2713:48:38, 32.76s/it]training loss: 5.854e-03:   1%|          | 1809/300001 [16:38:43<2687:01:18, 32.44s/it]training loss: 5.854e-03:   1%|          | 1810/300001 [16:39:16<2701:22:38, 32.61s/it]training loss: 5.854e-03:   1%|          | 1811/300001 [16:39:48<2684:06:31, 32.40s/it]training loss: 5.854e-03:   1%|          | 1812/300001 [16:40:21<2701:20:12, 32.61s/it]training loss: 5.854e-03:   1%|          | 1813/300001 [16:40:54<2707:43:28, 32.69s/it]training loss: 5.854e-03:   1%|          | 1814/300001 [16:41:25<2679:00:18, 32.34s/it]training loss: 5.854e-03:   1%|          | 1815/300001 [16:41:57<2677:57:38, 32.33s/it]training loss: 5.854e-03:   1%|          | 1816/300001 [16:42:31<2699:23:39, 32.59s/it]training loss: 5.854e-03:   1%|          | 1817/300001 [16:43:03<2687:18:06, 32.44s/it]training loss: 5.854e-03:   1%|          | 1818/300001 [16:43:36<2698:21:09, 32.58s/it]training loss: 5.854e-03:   1%|          | 1819/300001 [16:44:09<2717:06:55, 32.80s/it]training loss: 5.854e-03:   1%|          | 1820/300001 [16:44:42<2729:34:37, 32.95s/it]training loss: 7.059e-03:   1%|          | 1820/300001 [16:45:15<2729:34:37, 32.95s/it]training loss: 7.059e-03:   1%|          | 1821/300001 [16:45:15<2721:27:56, 32.86s/it]training loss: 7.059e-03:   1%|          | 1822/300001 [16:45:47<2703:12:31, 32.64s/it]training loss: 7.059e-03:   1%|          | 1823/300001 [16:46:20<2709:37:50, 32.71s/it]training loss: 7.059e-03:   1%|          | 1824/300001 [16:46:53<2723:40:31, 32.88s/it]training loss: 7.059e-03:   1%|          | 1825/300001 [16:47:26<2718:49:22, 32.83s/it]training loss: 7.059e-03:   1%|          | 1826/300001 [16:47:58<2701:13:47, 32.61s/it]training loss: 7.059e-03:   1%|          | 1827/300001 [16:48:31<2709:47:48, 32.72s/it]training loss: 7.059e-03:   1%|          | 1828/300001 [16:49:03<2689:06:24, 32.47s/it]training loss: 7.059e-03:   1%|          | 1829/300001 [16:49:34<2665:19:36, 32.18s/it]training loss: 7.059e-03:   1%|          | 1830/300001 [16:50:06<2653:38:49, 32.04s/it]training loss: 7.059e-03:   1%|          | 1831/300001 [16:50:39<2678:16:30, 32.34s/it]training loss: 7.059e-03:   1%|          | 1832/300001 [16:51:10<2647:57:48, 31.97s/it]training loss: 7.059e-03:   1%|          | 1833/300001 [16:51:42<2645:22:49, 31.94s/it]training loss: 7.059e-03:   1%|          | 1834/300001 [16:52:15<2677:01:33, 32.32s/it]training loss: 7.059e-03:   1%|          | 1835/300001 [16:52:49<2722:07:13, 32.87s/it]training loss: 7.059e-03:   1%|          | 1836/300001 [16:53:22<2702:12:02, 32.63s/it]training loss: 7.059e-03:   1%|          | 1837/300001 [16:53:54<2693:05:01, 32.52s/it]training loss: 7.059e-03:   1%|          | 1838/300001 [16:54:27<2700:14:24, 32.60s/it]training loss: 7.059e-03:   1%|          | 1839/300001 [16:54:59<2707:17:39, 32.69s/it]training loss: 7.059e-03:   1%|          | 1840/300001 [16:55:31<2678:39:13, 32.34s/it]training loss: 5.940e-03:   1%|          | 1840/300001 [16:56:03<2678:39:13, 32.34s/it]training loss: 5.940e-03:   1%|          | 1841/300001 [16:56:04<2683:30:34, 32.40s/it]training loss: 5.940e-03:   1%|          | 1842/300001 [16:56:36<2685:04:43, 32.42s/it]training loss: 5.940e-03:   1%|          | 1843/300001 [16:57:08<2681:16:55, 32.37s/it]training loss: 5.940e-03:   1%|          | 1844/300001 [16:57:41<2690:36:27, 32.49s/it]training loss: 5.940e-03:   1%|          | 1845/300001 [16:58:15<2717:09:02, 32.81s/it]training loss: 5.940e-03:   1%|          | 1846/300001 [16:58:47<2706:16:30, 32.68s/it]training loss: 5.940e-03:   1%|          | 1847/300001 [16:59:18<2673:40:36, 32.28s/it]training loss: 5.940e-03:   1%|          | 1848/300001 [16:59:51<2689:37:44, 32.48s/it]training loss: 5.940e-03:   1%|          | 1849/300001 [17:00:24<2687:34:53, 32.45s/it]training loss: 5.940e-03:   1%|          | 1850/300001 [17:00:57<2716:12:23, 32.80s/it]training loss: 5.940e-03:   1%|          | 1851/300001 [17:01:30<2717:07:37, 32.81s/it]training loss: 5.940e-03:   1%|          | 1852/300001 [17:02:03<2713:57:47, 32.77s/it]training loss: 5.940e-03:   1%|          | 1853/300001 [17:02:37<2742:01:53, 33.11s/it]training loss: 5.940e-03:   1%|          | 1854/300001 [17:03:10<2752:13:39, 33.23s/it]training loss: 5.940e-03:   1%|          | 1855/300001 [17:03:43<2741:02:27, 33.10s/it]training loss: 5.940e-03:   1%|          | 1856/300001 [17:04:14<2689:35:41, 32.48s/it]training loss: 5.940e-03:   1%|          | 1857/300001 [17:04:46<2671:29:14, 32.26s/it]training loss: 5.940e-03:   1%|          | 1858/300001 [17:05:18<2664:09:32, 32.17s/it]training loss: 5.940e-03:   1%|          | 1859/300001 [17:05:50<2673:33:44, 32.28s/it]training loss: 5.940e-03:   1%|          | 1860/300001 [17:06:23<2676:37:55, 32.32s/it]training loss: 6.189e-03:   1%|          | 1860/300001 [17:06:56<2676:37:55, 32.32s/it]training loss: 6.189e-03:   1%|          | 1861/300001 [17:06:56<2703:08:38, 32.64s/it]training loss: 6.189e-03:   1%|          | 1862/300001 [17:07:28<2675:14:14, 32.30s/it]training loss: 6.189e-03:   1%|          | 1863/300001 [17:08:00<2677:02:50, 32.33s/it]training loss: 6.189e-03:   1%|          | 1864/300001 [17:08:33<2707:14:32, 32.69s/it]training loss: 6.189e-03:   1%|          | 1865/300001 [17:09:06<2698:02:56, 32.58s/it]training loss: 6.189e-03:   1%|          | 1866/300001 [17:09:39<2702:16:35, 32.63s/it]training loss: 6.189e-03:   1%|          | 1867/300001 [17:10:11<2698:04:04, 32.58s/it]training loss: 6.189e-03:   1%|          | 1868/300001 [17:10:44<2699:52:38, 32.60s/it]training loss: 6.189e-03:   1%|          | 1869/300001 [17:11:15<2677:48:16, 32.33s/it]training loss: 6.189e-03:   1%|          | 1870/300001 [17:11:48<2677:19:09, 32.33s/it]training loss: 6.189e-03:   1%|          | 1871/300001 [17:12:20<2680:38:25, 32.37s/it]training loss: 6.189e-03:   1%|          | 1872/300001 [17:12:52<2679:26:23, 32.36s/it]training loss: 6.189e-03:   1%|          | 1873/300001 [17:13:24<2661:45:48, 32.14s/it]training loss: 6.189e-03:   1%|          | 1874/300001 [17:13:58<2695:58:09, 32.55s/it]training loss: 6.189e-03:   1%|          | 1875/300001 [17:14:30<2687:25:15, 32.45s/it]training loss: 6.189e-03:   1%|          | 1876/300001 [17:15:02<2673:25:18, 32.28s/it]training loss: 6.189e-03:   1%|          | 1877/300001 [17:15:34<2674:41:20, 32.30s/it]training loss: 6.189e-03:   1%|          | 1878/300001 [17:16:06<2664:28:57, 32.18s/it]training loss: 6.189e-03:   1%|          | 1879/300001 [17:16:38<2668:11:25, 32.22s/it]training loss: 6.189e-03:   1%|          | 1880/300001 [17:17:10<2661:30:16, 32.14s/it]training loss: 6.091e-03:   1%|          | 1880/300001 [17:17:44<2661:30:16, 32.14s/it]training loss: 6.091e-03:   1%|          | 1881/300001 [17:17:44<2711:09:11, 32.74s/it]training loss: 6.091e-03:   1%|          | 1882/300001 [17:18:17<2712:19:12, 32.75s/it]training loss: 6.091e-03:   1%|          | 1883/300001 [17:18:48<2675:05:35, 32.30s/it]training loss: 6.091e-03:   1%|          | 1884/300001 [17:19:12<2451:52:28, 29.61s/it]training loss: 6.091e-03:   1%|          | 1885/300001 [17:19:44<2511:42:17, 30.33s/it]training loss: 6.091e-03:   1%|          | 1886/300001 [17:20:14<2514:09:43, 30.36s/it]training loss: 6.091e-03:   1%|          | 1887/300001 [17:20:48<2589:10:30, 31.27s/it]training loss: 6.091e-03:   1%|          | 1888/300001 [17:21:19<2605:01:30, 31.46s/it]training loss: 6.091e-03:   1%|          | 1889/300001 [17:21:51<2603:32:04, 31.44s/it]training loss: 6.091e-03:   1%|          | 1890/300001 [17:22:24<2638:16:55, 31.86s/it]training loss: 6.091e-03:   1%|          | 1891/300001 [17:22:58<2688:49:11, 32.47s/it]training loss: 6.091e-03:   1%|          | 1892/300001 [17:23:31<2717:35:20, 32.82s/it]training loss: 6.091e-03:   1%|          | 1893/300001 [17:24:04<2721:45:46, 32.87s/it]training loss: 6.091e-03:   1%|          | 1894/300001 [17:24:37<2727:36:45, 32.94s/it]training loss: 6.091e-03:   1%|          | 1895/300001 [17:25:10<2714:06:15, 32.78s/it]training loss: 6.091e-03:   1%|          | 1896/300001 [17:25:42<2699:48:56, 32.60s/it]training loss: 6.091e-03:   1%|          | 1897/300001 [17:26:15<2699:27:37, 32.60s/it]training loss: 6.091e-03:   1%|          | 1898/300001 [17:26:48<2723:05:48, 32.89s/it]training loss: 6.091e-03:   1%|          | 1899/300001 [17:27:20<2698:33:11, 32.59s/it]training loss: 6.091e-03:   1%|          | 1900/300001 [17:27:52<2681:22:08, 32.38s/it]training loss: 6.106e-03:   1%|          | 1900/300001 [17:28:26<2681:22:08, 32.38s/it]training loss: 6.106e-03:   1%|          | 1901/300001 [17:28:26<2723:41:46, 32.89s/it]training loss: 6.106e-03:   1%|          | 1902/300001 [17:28:58<2694:34:21, 32.54s/it]training loss: 6.106e-03:   1%|          | 1903/300001 [17:29:30<2699:50:58, 32.60s/it]training loss: 6.106e-03:   1%|          | 1904/300001 [17:30:03<2691:26:51, 32.50s/it]training loss: 6.106e-03:   1%|          | 1905/300001 [17:30:34<2659:21:51, 32.12s/it]training loss: 6.106e-03:   1%|          | 1906/300001 [17:31:07<2683:42:58, 32.41s/it]training loss: 6.106e-03:   1%|          | 1907/300001 [17:31:39<2669:58:06, 32.24s/it]training loss: 6.106e-03:   1%|          | 1908/300001 [17:32:11<2662:24:28, 32.15s/it]training loss: 6.106e-03:   1%|          | 1909/300001 [17:32:43<2671:28:22, 32.26s/it]training loss: 6.106e-03:   1%|          | 1910/300001 [17:33:16<2670:02:17, 32.25s/it]training loss: 6.106e-03:   1%|          | 1911/300001 [17:33:48<2679:46:28, 32.36s/it]training loss: 6.106e-03:   1%|          | 1912/300001 [17:34:21<2679:29:04, 32.36s/it]training loss: 6.106e-03:   1%|          | 1913/300001 [17:34:54<2713:34:39, 32.77s/it]training loss: 6.106e-03:   1%|          | 1914/300001 [17:35:27<2704:30:23, 32.66s/it]training loss: 6.106e-03:   1%|          | 1915/300001 [17:35:58<2664:54:28, 32.18s/it]training loss: 6.106e-03:   1%|          | 1916/300001 [17:36:28<2623:36:38, 31.69s/it]training loss: 6.106e-03:   1%|          | 1917/300001 [17:37:01<2656:23:46, 32.08s/it]training loss: 6.106e-03:   1%|          | 1918/300001 [17:37:34<2673:38:15, 32.29s/it]training loss: 6.106e-03:   1%|          | 1919/300001 [17:38:06<2669:06:30, 32.24s/it]training loss: 6.106e-03:   1%|          | 1920/300001 [17:38:38<2657:34:08, 32.10s/it]training loss: 7.258e-03:   1%|          | 1920/300001 [17:39:11<2657:34:08, 32.10s/it]training loss: 7.258e-03:   1%|          | 1921/300001 [17:39:12<2695:39:12, 32.56s/it]training loss: 7.258e-03:   1%|          | 1922/300001 [17:39:44<2692:01:04, 32.51s/it]training loss: 7.258e-03:   1%|          | 1923/300001 [17:40:16<2686:21:19, 32.44s/it]training loss: 7.258e-03:   1%|          | 1924/300001 [17:40:48<2676:08:43, 32.32s/it]training loss: 7.258e-03:   1%|          | 1925/300001 [17:41:21<2688:14:31, 32.47s/it]training loss: 7.258e-03:   1%|          | 1926/300001 [17:41:54<2695:47:31, 32.56s/it]training loss: 7.258e-03:   1%|          | 1927/300001 [17:42:25<2667:23:53, 32.22s/it]training loss: 7.258e-03:   1%|          | 1928/300001 [17:42:58<2681:47:29, 32.39s/it]training loss: 7.258e-03:   1%|          | 1929/300001 [17:43:31<2700:02:11, 32.61s/it]training loss: 7.258e-03:   1%|          | 1930/300001 [17:44:04<2711:12:30, 32.75s/it]training loss: 7.258e-03:   1%|          | 1931/300001 [17:44:37<2719:35:53, 32.85s/it]training loss: 7.258e-03:   1%|          | 1932/300001 [17:45:10<2703:02:50, 32.65s/it]training loss: 7.258e-03:   1%|          | 1933/300001 [17:45:43<2724:54:44, 32.91s/it]training loss: 7.258e-03:   1%|          | 1934/300001 [17:46:17<2739:17:41, 33.08s/it]training loss: 7.258e-03:   1%|          | 1935/300001 [17:46:48<2711:28:11, 32.75s/it]training loss: 7.258e-03:   1%|          | 1936/300001 [17:47:20<2678:05:26, 32.35s/it]training loss: 7.258e-03:   1%|          | 1937/300001 [17:47:53<2693:17:19, 32.53s/it]training loss: 7.258e-03:   1%|          | 1938/300001 [17:48:25<2688:07:06, 32.47s/it]training loss: 7.258e-03:   1%|          | 1939/300001 [17:48:57<2677:52:55, 32.34s/it]training loss: 7.258e-03:   1%|          | 1940/300001 [17:49:29<2668:40:06, 32.23s/it]training loss: 6.406e-03:   1%|          | 1940/300001 [17:50:01<2668:40:06, 32.23s/it]training loss: 6.406e-03:   1%|          | 1941/300001 [17:50:01<2656:55:24, 32.09s/it]training loss: 6.406e-03:   1%|          | 1942/300001 [17:50:34<2672:18:51, 32.28s/it]training loss: 6.406e-03:   1%|          | 1943/300001 [17:51:05<2639:59:26, 31.89s/it]training loss: 6.406e-03:   1%|          | 1944/300001 [17:51:37<2651:00:54, 32.02s/it]training loss: 6.406e-03:   1%|          | 1945/300001 [17:52:10<2674:12:41, 32.30s/it]training loss: 6.406e-03:   1%|          | 1946/300001 [17:52:42<2666:41:27, 32.21s/it]training loss: 6.406e-03:   1%|          | 1947/300001 [17:53:14<2663:11:25, 32.17s/it]training loss: 6.406e-03:   1%|          | 1948/300001 [17:53:46<2654:10:02, 32.06s/it]training loss: 6.406e-03:   1%|          | 1949/300001 [17:54:18<2654:10:44, 32.06s/it]training loss: 6.406e-03:   1%|          | 1950/300001 [17:54:50<2657:33:43, 32.10s/it]training loss: 6.406e-03:   1%|          | 1951/300001 [17:55:23<2677:16:52, 32.34s/it]training loss: 6.406e-03:   1%|          | 1952/300001 [17:55:55<2667:21:11, 32.22s/it]training loss: 6.406e-03:   1%|          | 1953/300001 [17:56:27<2668:23:42, 32.23s/it]training loss: 6.406e-03:   1%|          | 1954/300001 [17:56:59<2661:18:16, 32.14s/it]training loss: 6.406e-03:   1%|          | 1955/300001 [17:57:32<2674:59:19, 32.31s/it]training loss: 6.406e-03:   1%|          | 1956/300001 [17:58:04<2671:08:34, 32.26s/it]training loss: 6.406e-03:   1%|          | 1957/300001 [17:58:37<2678:32:15, 32.35s/it]training loss: 6.406e-03:   1%|          | 1958/300001 [17:59:09<2692:05:40, 32.52s/it]training loss: 6.406e-03:   1%|          | 1959/300001 [17:59:41<2676:31:00, 32.33s/it]training loss: 6.406e-03:   1%|          | 1960/300001 [18:00:14<2695:46:54, 32.56s/it]training loss: 5.800e-03:   1%|          | 1960/300001 [18:00:47<2695:46:54, 32.56s/it]training loss: 5.800e-03:   1%|          | 1961/300001 [18:00:47<2689:25:00, 32.49s/it]training loss: 5.800e-03:   1%|          | 1962/300001 [18:01:19<2682:30:27, 32.40s/it]training loss: 5.800e-03:   1%|          | 1963/300001 [18:01:50<2654:44:01, 32.07s/it]training loss: 5.800e-03:   1%|          | 1964/300001 [18:02:23<2683:45:34, 32.42s/it]training loss: 5.800e-03:   1%|          | 1965/300001 [18:02:57<2703:09:51, 32.65s/it]training loss: 5.800e-03:   1%|          | 1966/300001 [18:03:30<2710:33:27, 32.74s/it]training loss: 5.800e-03:   1%|          | 1967/300001 [18:04:01<2684:44:37, 32.43s/it]training loss: 5.800e-03:   1%|          | 1968/300001 [18:04:33<2672:24:04, 32.28s/it]training loss: 5.800e-03:   1%|          | 1969/300001 [18:05:06<2680:17:31, 32.38s/it]training loss: 5.800e-03:   1%|          | 1970/300001 [18:05:38<2671:24:54, 32.27s/it]training loss: 5.800e-03:   1%|          | 1971/300001 [18:06:10<2678:52:32, 32.36s/it]training loss: 5.800e-03:   1%|          | 1972/300001 [18:06:44<2704:54:48, 32.67s/it]training loss: 5.800e-03:   1%|          | 1973/300001 [18:07:16<2682:45:23, 32.41s/it]training loss: 5.800e-03:   1%|          | 1974/300001 [18:07:49<2707:31:19, 32.71s/it]training loss: 5.800e-03:   1%|          | 1975/300001 [18:08:21<2690:34:42, 32.50s/it]training loss: 5.800e-03:   1%|          | 1976/300001 [18:08:54<2691:20:48, 32.51s/it]training loss: 5.800e-03:   1%|          | 1977/300001 [18:09:25<2655:59:48, 32.08s/it]training loss: 5.800e-03:   1%|          | 1978/300001 [18:09:57<2650:45:37, 32.02s/it]training loss: 5.800e-03:   1%|          | 1979/300001 [18:10:28<2648:45:38, 32.00s/it]training loss: 5.800e-03:   1%|          | 1980/300001 [18:11:00<2648:52:20, 32.00s/it]training loss: 6.414e-03:   1%|          | 1980/300001 [18:11:32<2648:52:20, 32.00s/it]training loss: 6.414e-03:   1%|          | 1981/300001 [18:11:32<2645:28:06, 31.96s/it]training loss: 6.414e-03:   1%|          | 1982/300001 [18:12:04<2638:02:29, 31.87s/it]training loss: 6.414e-03:   1%|          | 1983/300001 [18:12:36<2653:03:33, 32.05s/it]training loss: 6.414e-03:   1%|          | 1984/300001 [18:13:08<2641:52:58, 31.91s/it]training loss: 6.414e-03:   1%|          | 1985/300001 [18:13:39<2621:18:58, 31.67s/it]training loss: 6.414e-03:   1%|          | 1986/300001 [18:14:13<2667:57:50, 32.23s/it]training loss: 6.414e-03:   1%|          | 1987/300001 [18:14:45<2677:09:28, 32.34s/it]training loss: 6.414e-03:   1%|          | 1988/300001 [18:15:18<2696:39:31, 32.58s/it]training loss: 6.414e-03:   1%|          | 1989/300001 [18:15:51<2692:32:51, 32.53s/it]training loss: 6.414e-03:   1%|          | 1990/300001 [18:16:24<2720:17:51, 32.86s/it]training loss: 6.414e-03:   1%|          | 1991/300001 [18:16:57<2724:13:26, 32.91s/it]training loss: 6.414e-03:   1%|          | 1992/300001 [18:17:30<2703:40:15, 32.66s/it]training loss: 6.414e-03:   1%|          | 1993/300001 [18:18:03<2717:46:32, 32.83s/it]training loss: 6.414e-03:   1%|          | 1994/300001 [18:18:35<2709:59:43, 32.74s/it]training loss: 6.414e-03:   1%|          | 1995/300001 [18:19:08<2702:59:52, 32.65s/it]training loss: 6.414e-03:   1%|          | 1996/300001 [18:19:39<2659:31:34, 32.13s/it]training loss: 6.414e-03:   1%|          | 1997/300001 [18:20:11<2669:29:28, 32.25s/it]training loss: 6.414e-03:   1%|          | 1998/300001 [18:20:43<2666:17:57, 32.21s/it]training loss: 6.414e-03:   1%|          | 1999/300001 [18:21:15<2663:23:49, 32.18s/it]training loss: 6.414e-03:   1%|          | 2000/300001 [18:21:49<2696:13:08, 32.57s/it]training loss: 6.062e-03:   1%|          | 2000/300001 [18:22:22<2696:13:08, 32.57s/it]training loss: 6.062e-03:   1%|          | 2001/300001 [18:22:25<2789:59:09, 33.70s/it]training loss: 6.062e-03:   1%|          | 2002/300001 [18:22:57<2750:24:50, 33.23s/it]training loss: 6.062e-03:   1%|          | 2003/300001 [18:23:30<2736:40:33, 33.06s/it]training loss: 6.062e-03:   1%|          | 2004/300001 [18:24:03<2722:38:30, 32.89s/it]training loss: 6.062e-03:   1%|          | 2005/300001 [18:24:35<2720:24:24, 32.86s/it]training loss: 6.062e-03:   1%|          | 2006/300001 [18:25:08<2724:38:00, 32.92s/it]training loss: 6.062e-03:   1%|          | 2007/300001 [18:25:42<2735:41:45, 33.05s/it]training loss: 6.062e-03:   1%|          | 2008/300001 [18:26:13<2696:35:20, 32.58s/it]training loss: 6.062e-03:   1%|          | 2009/300001 [18:26:44<2650:57:49, 32.03s/it]training loss: 6.062e-03:   1%|          | 2010/300001 [18:27:15<2633:07:54, 31.81s/it]training loss: 6.062e-03:   1%|          | 2011/300001 [18:27:47<2641:43:28, 31.91s/it]training loss: 6.062e-03:   1%|          | 2012/300001 [18:28:20<2660:22:18, 32.14s/it]training loss: 6.062e-03:   1%|          | 2013/300001 [18:28:53<2679:44:10, 32.37s/it]training loss: 6.062e-03:   1%|          | 2014/300001 [18:29:24<2657:05:36, 32.10s/it]training loss: 6.062e-03:   1%|          | 2015/300001 [18:29:58<2684:39:24, 32.43s/it]training loss: 6.062e-03:   1%|          | 2016/300001 [18:30:29<2658:53:01, 32.12s/it]training loss: 6.062e-03:   1%|          | 2017/300001 [18:31:01<2659:04:05, 32.12s/it]training loss: 6.062e-03:   1%|          | 2018/300001 [18:31:33<2639:53:01, 31.89s/it]training loss: 6.062e-03:   1%|          | 2019/300001 [18:32:05<2655:35:43, 32.08s/it]training loss: 6.062e-03:   1%|          | 2020/300001 [18:32:36<2628:03:50, 31.75s/it]training loss: 6.122e-03:   1%|          | 2020/300001 [18:33:09<2628:03:50, 31.75s/it]training loss: 6.122e-03:   1%|          | 2021/300001 [18:33:09<2653:41:02, 32.06s/it]training loss: 6.122e-03:   1%|          | 2022/300001 [18:33:41<2668:34:39, 32.24s/it]training loss: 6.122e-03:   1%|          | 2023/300001 [18:34:13<2653:35:12, 32.06s/it]training loss: 6.122e-03:   1%|          | 2024/300001 [18:34:46<2668:23:44, 32.24s/it]training loss: 6.122e-03:   1%|          | 2025/300001 [18:35:18<2663:43:46, 32.18s/it]training loss: 6.122e-03:   1%|          | 2026/300001 [18:35:51<2696:58:08, 32.58s/it]training loss: 6.122e-03:   1%|          | 2027/300001 [18:36:23<2685:07:17, 32.44s/it]training loss: 6.122e-03:   1%|          | 2028/300001 [18:36:57<2708:11:54, 32.72s/it]training loss: 6.122e-03:   1%|          | 2029/300001 [18:37:30<2728:13:58, 32.96s/it]training loss: 6.122e-03:   1%|          | 2030/300001 [18:38:04<2737:13:07, 33.07s/it]training loss: 6.122e-03:   1%|          | 2031/300001 [18:38:36<2730:49:47, 32.99s/it]training loss: 6.122e-03:   1%|          | 2032/300001 [18:39:09<2719:21:34, 32.85s/it]training loss: 6.122e-03:   1%|          | 2033/300001 [18:39:42<2711:38:54, 32.76s/it]training loss: 6.122e-03:   1%|          | 2034/300001 [18:40:13<2675:09:54, 32.32s/it]training loss: 6.122e-03:   1%|          | 2035/300001 [18:40:45<2680:06:10, 32.38s/it]training loss: 6.122e-03:   1%|          | 2036/300001 [18:41:18<2676:23:32, 32.34s/it]training loss: 6.122e-03:   1%|          | 2037/300001 [18:41:51<2701:20:57, 32.64s/it]training loss: 6.122e-03:   1%|          | 2038/300001 [18:42:22<2667:34:03, 32.23s/it]training loss: 6.122e-03:   1%|          | 2039/300001 [18:42:53<2634:54:19, 31.84s/it]training loss: 6.122e-03:   1%|          | 2040/300001 [18:43:25<2630:28:04, 31.78s/it]training loss: 6.607e-03:   1%|          | 2040/300001 [18:43:48<2630:28:04, 31.78s/it]training loss: 6.607e-03:   1%|          | 2041/300001 [18:43:48<2407:36:48, 29.09s/it]training loss: 6.607e-03:   1%|          | 2042/300001 [18:44:19<2468:17:44, 29.82s/it]training loss: 6.607e-03:   1%|          | 2043/300001 [18:44:52<2545:52:13, 30.76s/it]training loss: 6.607e-03:   1%|          | 2044/300001 [18:45:23<2547:33:15, 30.78s/it]training loss: 6.607e-03:   1%|          | 2045/300001 [18:45:55<2589:59:44, 31.29s/it]training loss: 6.607e-03:   1%|          | 2046/300001 [18:46:29<2636:15:13, 31.85s/it]training loss: 6.607e-03:   1%|          | 2047/300001 [18:47:01<2656:47:54, 32.10s/it]training loss: 6.607e-03:   1%|          | 2048/300001 [18:47:34<2674:19:01, 32.31s/it]training loss: 6.607e-03:   1%|          | 2049/300001 [18:48:07<2682:48:39, 32.42s/it]training loss: 6.607e-03:   1%|          | 2050/300001 [18:48:38<2665:08:19, 32.20s/it]training loss: 6.607e-03:   1%|          | 2051/300001 [18:49:11<2667:00:38, 32.22s/it]training loss: 6.607e-03:   1%|          | 2052/300001 [18:49:43<2669:12:47, 32.25s/it]training loss: 6.607e-03:   1%|          | 2053/300001 [18:50:15<2673:51:36, 32.31s/it]training loss: 6.607e-03:   1%|          | 2054/300001 [18:50:48<2690:30:03, 32.51s/it]training loss: 6.607e-03:   1%|          | 2055/300001 [18:51:21<2703:37:06, 32.67s/it]training loss: 6.607e-03:   1%|          | 2056/300001 [18:51:55<2719:55:17, 32.86s/it]training loss: 6.607e-03:   1%|          | 2057/300001 [18:52:27<2702:37:42, 32.66s/it]training loss: 6.607e-03:   1%|          | 2058/300001 [18:53:00<2722:06:17, 32.89s/it]training loss: 6.607e-03:   1%|          | 2059/300001 [18:53:34<2728:39:40, 32.97s/it]training loss: 6.607e-03:   1%|          | 2060/300001 [18:54:05<2699:51:56, 32.62s/it]training loss: 6.460e-03:   1%|          | 2060/300001 [18:54:38<2699:51:56, 32.62s/it]training loss: 6.460e-03:   1%|          | 2061/300001 [18:54:38<2699:01:23, 32.61s/it]training loss: 6.460e-03:   1%|          | 2062/300001 [18:55:10<2678:41:42, 32.37s/it]training loss: 6.460e-03:   1%|          | 2063/300001 [18:55:42<2676:39:41, 32.34s/it]training loss: 6.460e-03:   1%|          | 2064/300001 [18:56:13<2651:25:37, 32.04s/it]training loss: 6.460e-03:   1%|          | 2065/300001 [18:56:46<2660:28:52, 32.15s/it]training loss: 6.460e-03:   1%|          | 2066/300001 [18:57:18<2663:12:57, 32.18s/it]training loss: 6.460e-03:   1%|          | 2067/300001 [18:57:50<2659:49:27, 32.14s/it]training loss: 6.460e-03:   1%|          | 2068/300001 [18:58:22<2664:21:23, 32.19s/it]training loss: 6.460e-03:   1%|          | 2069/300001 [18:58:55<2665:07:34, 32.20s/it]training loss: 6.460e-03:   1%|          | 2070/300001 [18:59:28<2687:01:52, 32.47s/it]training loss: 6.460e-03:   1%|          | 2071/300001 [19:00:00<2671:48:21, 32.28s/it]training loss: 6.460e-03:   1%|          | 2072/300001 [19:00:33<2696:12:20, 32.58s/it]training loss: 6.460e-03:   1%|          | 2073/300001 [19:01:04<2673:01:35, 32.30s/it]training loss: 6.460e-03:   1%|          | 2074/300001 [19:01:38<2701:28:18, 32.64s/it]training loss: 6.460e-03:   1%|          | 2075/300001 [19:02:11<2706:45:47, 32.71s/it]training loss: 6.460e-03:   1%|          | 2076/300001 [19:02:43<2702:34:38, 32.66s/it]training loss: 6.460e-03:   1%|          | 2077/300001 [19:03:16<2714:18:19, 32.80s/it]training loss: 6.460e-03:   1%|          | 2078/300001 [19:03:49<2718:23:38, 32.85s/it]training loss: 6.460e-03:   1%|          | 2079/300001 [19:04:20<2667:34:28, 32.23s/it]training loss: 6.460e-03:   1%|          | 2080/300001 [19:04:53<2678:16:01, 32.36s/it]training loss: 6.204e-03:   1%|          | 2080/300001 [19:05:26<2678:16:01, 32.36s/it]training loss: 6.204e-03:   1%|          | 2081/300001 [19:05:26<2702:29:26, 32.66s/it]training loss: 6.204e-03:   1%|          | 2082/300001 [19:05:59<2712:49:38, 32.78s/it]training loss: 6.204e-03:   1%|          | 2083/300001 [19:06:30<2668:14:07, 32.24s/it]training loss: 6.204e-03:   1%|          | 2084/300001 [19:07:04<2701:29:34, 32.64s/it]training loss: 6.204e-03:   1%|          | 2085/300001 [19:07:36<2679:08:27, 32.37s/it]training loss: 6.204e-03:   1%|          | 2086/300001 [19:08:08<2686:37:48, 32.47s/it]training loss: 6.204e-03:   1%|          | 2087/300001 [19:08:41<2698:23:33, 32.61s/it]training loss: 6.204e-03:   1%|          | 2088/300001 [19:09:14<2697:21:59, 32.60s/it]training loss: 6.204e-03:   1%|          | 2089/300001 [19:09:46<2676:45:37, 32.35s/it]training loss: 6.204e-03:   1%|          | 2090/300001 [19:10:17<2644:08:30, 31.95s/it]training loss: 6.204e-03:   1%|          | 2091/300001 [19:10:48<2628:38:06, 31.76s/it]training loss: 6.204e-03:   1%|          | 2092/300001 [19:11:20<2643:01:15, 31.94s/it]training loss: 6.204e-03:   1%|          | 2093/300001 [19:11:52<2641:38:27, 31.92s/it]training loss: 6.204e-03:   1%|          | 2094/300001 [19:12:23<2621:55:39, 31.68s/it]training loss: 6.204e-03:   1%|          | 2095/300001 [19:12:57<2663:58:44, 32.19s/it]training loss: 6.204e-03:   1%|          | 2096/300001 [19:13:29<2677:25:27, 32.36s/it]training loss: 6.204e-03:   1%|          | 2097/300001 [19:14:01<2666:26:57, 32.22s/it]training loss: 6.204e-03:   1%|          | 2098/300001 [19:14:34<2672:21:43, 32.29s/it]training loss: 6.204e-03:   1%|          | 2099/300001 [19:15:05<2652:41:19, 32.06s/it]training loss: 6.204e-03:   1%|          | 2100/300001 [19:15:37<2649:58:39, 32.02s/it]training loss: 5.775e-03:   1%|          | 2100/300001 [19:16:08<2649:58:39, 32.02s/it]training loss: 5.775e-03:   1%|          | 2101/300001 [19:16:09<2634:21:32, 31.84s/it]training loss: 5.775e-03:   1%|          | 2102/300001 [19:16:41<2650:18:34, 32.03s/it]training loss: 5.775e-03:   1%|          | 2103/300001 [19:17:14<2670:03:16, 32.27s/it]training loss: 5.775e-03:   1%|          | 2104/300001 [19:17:47<2679:45:59, 32.38s/it]training loss: 5.775e-03:   1%|          | 2105/300001 [19:18:20<2694:14:35, 32.56s/it]training loss: 5.775e-03:   1%|          | 2106/300001 [19:18:52<2681:56:53, 32.41s/it]training loss: 5.775e-03:   1%|          | 2107/300001 [19:19:23<2658:12:36, 32.12s/it]training loss: 5.775e-03:   1%|          | 2108/300001 [19:19:54<2642:02:58, 31.93s/it]training loss: 5.775e-03:   1%|          | 2109/300001 [19:20:27<2653:40:04, 32.07s/it]training loss: 5.775e-03:   1%|          | 2110/300001 [19:20:59<2655:10:49, 32.09s/it]training loss: 5.775e-03:   1%|          | 2111/300001 [19:21:31<2647:15:04, 31.99s/it]training loss: 5.775e-03:   1%|          | 2112/300001 [19:22:04<2676:00:55, 32.34s/it]training loss: 5.775e-03:   1%|          | 2113/300001 [19:22:35<2644:54:48, 31.96s/it]training loss: 5.775e-03:   1%|          | 2114/300001 [19:23:07<2640:59:33, 31.92s/it]training loss: 5.775e-03:   1%|          | 2115/300001 [19:23:39<2649:29:11, 32.02s/it]training loss: 5.775e-03:   1%|          | 2116/300001 [19:24:11<2648:21:07, 32.01s/it]training loss: 5.775e-03:   1%|          | 2117/300001 [19:24:43<2657:31:46, 32.12s/it]training loss: 5.775e-03:   1%|          | 2118/300001 [19:25:16<2677:26:23, 32.36s/it]training loss: 5.775e-03:   1%|          | 2119/300001 [19:25:49<2694:01:43, 32.56s/it]training loss: 5.775e-03:   1%|          | 2120/300001 [19:26:23<2719:36:11, 32.87s/it]training loss: 5.881e-03:   1%|          | 2120/300001 [19:26:55<2719:36:11, 32.87s/it]training loss: 5.881e-03:   1%|          | 2121/300001 [19:26:55<2691:15:41, 32.52s/it]training loss: 5.881e-03:   1%|          | 2122/300001 [19:27:28<2711:50:43, 32.77s/it]training loss: 5.881e-03:   1%|          | 2123/300001 [19:28:01<2715:30:40, 32.82s/it]training loss: 5.881e-03:   1%|          | 2124/300001 [19:28:34<2731:21:54, 33.01s/it]training loss: 5.881e-03:   1%|          | 2125/300001 [19:29:06<2700:23:28, 32.64s/it]training loss: 5.881e-03:   1%|          | 2126/300001 [19:29:39<2712:16:06, 32.78s/it]training loss: 5.881e-03:   1%|          | 2127/300001 [19:30:13<2723:39:40, 32.92s/it]training loss: 5.881e-03:   1%|          | 2128/300001 [19:30:45<2723:44:09, 32.92s/it]training loss: 5.881e-03:   1%|          | 2129/300001 [19:31:18<2716:52:01, 32.84s/it]training loss: 5.881e-03:   1%|          | 2130/300001 [19:31:51<2711:43:44, 32.77s/it]training loss: 5.881e-03:   1%|          | 2131/300001 [19:32:23<2710:27:35, 32.76s/it]training loss: 5.881e-03:   1%|          | 2132/300001 [19:32:55<2687:51:49, 32.49s/it]training loss: 5.881e-03:   1%|          | 2133/300001 [19:33:28<2693:53:05, 32.56s/it]training loss: 5.881e-03:   1%|          | 2134/300001 [19:34:00<2681:15:06, 32.41s/it]training loss: 5.881e-03:   1%|          | 2135/300001 [19:34:32<2668:15:45, 32.25s/it]training loss: 5.881e-03:   1%|          | 2136/300001 [19:35:04<2667:57:45, 32.25s/it]training loss: 5.881e-03:   1%|          | 2137/300001 [19:35:37<2684:03:56, 32.44s/it]training loss: 5.881e-03:   1%|          | 2138/300001 [19:36:09<2675:26:24, 32.34s/it]training loss: 5.881e-03:   1%|          | 2139/300001 [19:36:42<2681:22:48, 32.41s/it]training loss: 5.881e-03:   1%|          | 2140/300001 [19:37:14<2670:30:13, 32.28s/it]training loss: 5.752e-03:   1%|          | 2140/300001 [19:37:46<2670:30:13, 32.28s/it]training loss: 5.752e-03:   1%|          | 2141/300001 [19:37:46<2662:11:57, 32.18s/it]training loss: 5.752e-03:   1%|          | 2142/300001 [19:38:17<2647:37:03, 32.00s/it]training loss: 5.752e-03:   1%|          | 2143/300001 [19:38:49<2650:46:27, 32.04s/it]training loss: 5.752e-03:   1%|          | 2144/300001 [19:39:23<2694:51:55, 32.57s/it]training loss: 5.752e-03:   1%|          | 2145/300001 [19:39:55<2675:01:46, 32.33s/it]training loss: 5.752e-03:   1%|          | 2146/300001 [19:40:28<2680:09:18, 32.39s/it]training loss: 5.752e-03:   1%|          | 2147/300001 [19:41:00<2678:21:02, 32.37s/it]training loss: 5.752e-03:   1%|          | 2148/300001 [19:41:34<2717:12:31, 32.84s/it]training loss: 5.752e-03:   1%|          | 2149/300001 [19:42:06<2690:34:25, 32.52s/it]training loss: 5.752e-03:   1%|          | 2150/300001 [19:42:38<2682:27:33, 32.42s/it]training loss: 5.752e-03:   1%|          | 2151/300001 [19:43:09<2661:27:57, 32.17s/it]training loss: 5.752e-03:   1%|          | 2152/300001 [19:43:41<2660:49:31, 32.16s/it]training loss: 5.752e-03:   1%|          | 2153/300001 [19:44:14<2674:32:57, 32.33s/it]training loss: 5.752e-03:   1%|          | 2154/300001 [19:44:46<2661:00:41, 32.16s/it]training loss: 5.752e-03:   1%|          | 2155/300001 [19:45:19<2685:44:00, 32.46s/it]training loss: 5.752e-03:   1%|          | 2156/300001 [19:45:53<2710:46:01, 32.76s/it]training loss: 5.752e-03:   1%|          | 2157/300001 [19:46:25<2693:12:23, 32.55s/it]training loss: 5.752e-03:   1%|          | 2158/300001 [19:46:58<2702:08:23, 32.66s/it]training loss: 5.752e-03:   1%|          | 2159/300001 [19:47:29<2661:45:08, 32.17s/it]training loss: 5.752e-03:   1%|          | 2160/300001 [19:48:00<2642:34:26, 31.94s/it]training loss: 5.455e-03:   1%|          | 2160/300001 [19:48:33<2642:34:26, 31.94s/it]training loss: 5.455e-03:   1%|          | 2161/300001 [19:48:33<2664:02:09, 32.20s/it]training loss: 5.455e-03:   1%|          | 2162/300001 [19:49:04<2643:56:17, 31.96s/it]training loss: 5.455e-03:   1%|          | 2163/300001 [19:49:37<2662:38:39, 32.18s/it]training loss: 5.455e-03:   1%|          | 2164/300001 [19:50:10<2681:06:44, 32.41s/it]training loss: 5.455e-03:   1%|          | 2165/300001 [19:50:41<2660:58:43, 32.16s/it]training loss: 5.455e-03:   1%|          | 2166/300001 [19:51:14<2660:31:10, 32.16s/it]training loss: 5.455e-03:   1%|          | 2167/300001 [19:51:47<2691:28:42, 32.53s/it]training loss: 5.455e-03:   1%|          | 2168/300001 [19:52:19<2677:10:43, 32.36s/it]training loss: 5.455e-03:   1%|          | 2169/300001 [19:52:51<2667:22:02, 32.24s/it]training loss: 5.455e-03:   1%|          | 2170/300001 [19:53:23<2663:51:21, 32.20s/it]training loss: 5.455e-03:   1%|          | 2171/300001 [19:53:55<2646:27:37, 31.99s/it]training loss: 5.455e-03:   1%|          | 2172/300001 [19:54:26<2637:33:40, 31.88s/it]training loss: 5.455e-03:   1%|          | 2173/300001 [19:54:59<2664:40:38, 32.21s/it]training loss: 5.455e-03:   1%|          | 2174/300001 [19:55:33<2703:49:59, 32.68s/it]training loss: 5.455e-03:   1%|          | 2175/300001 [19:56:05<2691:59:39, 32.54s/it]training loss: 5.455e-03:   1%|          | 2176/300001 [19:56:37<2679:54:24, 32.39s/it]training loss: 5.455e-03:   1%|          | 2177/300001 [19:57:10<2690:21:23, 32.52s/it]training loss: 5.455e-03:   1%|          | 2178/300001 [19:57:41<2662:28:36, 32.18s/it]training loss: 5.455e-03:   1%|          | 2179/300001 [19:58:13<2652:01:51, 32.06s/it]training loss: 5.455e-03:   1%|          | 2180/300001 [19:58:46<2667:35:23, 32.25s/it]training loss: 6.315e-03:   1%|          | 2180/300001 [19:59:18<2667:35:23, 32.25s/it]training loss: 6.315e-03:   1%|          | 2181/300001 [19:59:18<2665:54:24, 32.23s/it]training loss: 6.315e-03:   1%|          | 2182/300001 [19:59:49<2645:39:36, 31.98s/it]training loss: 6.315e-03:   1%|          | 2183/300001 [20:00:22<2659:21:27, 32.15s/it]training loss: 6.315e-03:   1%|          | 2184/300001 [20:00:55<2684:09:50, 32.45s/it]training loss: 6.315e-03:   1%|          | 2185/300001 [20:01:29<2717:50:52, 32.85s/it]training loss: 6.315e-03:   1%|          | 2186/300001 [20:02:01<2700:40:45, 32.65s/it]training loss: 6.315e-03:   1%|          | 2187/300001 [20:02:33<2682:25:11, 32.43s/it]training loss: 6.315e-03:   1%|          | 2188/300001 [20:03:05<2661:38:50, 32.17s/it]training loss: 6.315e-03:   1%|          | 2189/300001 [20:03:36<2654:07:06, 32.08s/it]training loss: 6.315e-03:   1%|          | 2190/300001 [20:04:11<2706:46:49, 32.72s/it]training loss: 6.315e-03:   1%|          | 2191/300001 [20:04:43<2709:23:25, 32.75s/it]training loss: 6.315e-03:   1%|          | 2192/300001 [20:05:16<2710:27:53, 32.76s/it]training loss: 6.315e-03:   1%|          | 2193/300001 [20:05:50<2737:30:36, 33.09s/it]training loss: 6.315e-03:   1%|          | 2194/300001 [20:06:23<2744:26:55, 33.18s/it]training loss: 6.315e-03:   1%|          | 2195/300001 [20:06:58<2766:08:04, 33.44s/it]training loss: 6.315e-03:   1%|          | 2196/300001 [20:07:30<2735:08:40, 33.06s/it]training loss: 6.315e-03:   1%|          | 2197/300001 [20:08:03<2739:48:51, 33.12s/it]training loss: 6.315e-03:   1%|          | 2198/300001 [20:08:26<2494:35:12, 30.16s/it]training loss: 6.315e-03:   1%|          | 2199/300001 [20:08:59<2560:02:10, 30.95s/it]training loss: 6.315e-03:   1%|          | 2200/300001 [20:09:33<2638:57:20, 31.90s/it]training loss: 8.075e-03:   1%|          | 2200/300001 [20:10:06<2638:57:20, 31.90s/it]training loss: 8.075e-03:   1%|          | 2201/300001 [20:10:06<2670:10:23, 32.28s/it]training loss: 8.075e-03:   1%|          | 2202/300001 [20:10:38<2666:47:52, 32.24s/it]training loss: 8.075e-03:   1%|          | 2203/300001 [20:11:12<2688:43:08, 32.50s/it]training loss: 8.075e-03:   1%|          | 2204/300001 [20:11:45<2705:02:13, 32.70s/it]training loss: 8.075e-03:   1%|          | 2205/300001 [20:12:16<2671:11:28, 32.29s/it]training loss: 8.075e-03:   1%|          | 2206/300001 [20:12:49<2678:49:23, 32.38s/it]training loss: 8.075e-03:   1%|          | 2207/300001 [20:13:21<2680:59:51, 32.41s/it]training loss: 8.075e-03:   1%|          | 2208/300001 [20:13:52<2649:42:04, 32.03s/it]training loss: 8.075e-03:   1%|          | 2209/300001 [20:14:24<2637:32:37, 31.89s/it]training loss: 8.075e-03:   1%|          | 2210/300001 [20:14:57<2660:47:27, 32.17s/it]training loss: 8.075e-03:   1%|          | 2211/300001 [20:15:29<2671:00:57, 32.29s/it]training loss: 8.075e-03:   1%|          | 2212/300001 [20:16:02<2683:05:05, 32.44s/it]training loss: 8.075e-03:   1%|          | 2213/300001 [20:16:35<2701:02:34, 32.65s/it]training loss: 8.075e-03:   1%|          | 2214/300001 [20:17:09<2720:16:02, 32.89s/it]training loss: 8.075e-03:   1%|          | 2215/300001 [20:17:41<2713:49:43, 32.81s/it]training loss: 8.075e-03:   1%|          | 2216/300001 [20:18:13<2679:19:25, 32.39s/it]training loss: 8.075e-03:   1%|          | 2217/300001 [20:18:45<2679:28:19, 32.39s/it]training loss: 8.075e-03:   1%|          | 2218/300001 [20:19:18<2683:11:20, 32.44s/it]training loss: 8.075e-03:   1%|          | 2219/300001 [20:19:49<2667:29:32, 32.25s/it]training loss: 8.075e-03:   1%|          | 2220/300001 [20:20:22<2678:23:34, 32.38s/it]training loss: 6.981e-03:   1%|          | 2220/300001 [20:20:54<2678:23:34, 32.38s/it]training loss: 6.981e-03:   1%|          | 2221/300001 [20:20:54<2670:04:52, 32.28s/it]training loss: 6.981e-03:   1%|          | 2222/300001 [20:21:27<2678:32:54, 32.38s/it]training loss: 6.981e-03:   1%|          | 2223/300001 [20:21:59<2671:19:01, 32.30s/it]training loss: 6.981e-03:   1%|          | 2224/300001 [20:22:31<2675:09:42, 32.34s/it]training loss: 6.981e-03:   1%|          | 2225/300001 [20:23:02<2643:58:31, 31.96s/it]training loss: 6.981e-03:   1%|          | 2226/300001 [20:23:35<2663:31:11, 32.20s/it]training loss: 6.981e-03:   1%|          | 2227/300001 [20:24:08<2674:34:17, 32.33s/it]training loss: 6.981e-03:   1%|          | 2228/300001 [20:24:40<2660:09:13, 32.16s/it]training loss: 6.981e-03:   1%|          | 2229/300001 [20:25:13<2693:58:39, 32.57s/it]training loss: 6.981e-03:   1%|          | 2230/300001 [20:25:46<2709:35:59, 32.76s/it]training loss: 6.981e-03:   1%|          | 2231/300001 [20:26:19<2712:41:48, 32.80s/it]training loss: 6.981e-03:   1%|          | 2232/300001 [20:26:52<2703:07:22, 32.68s/it]training loss: 6.981e-03:   1%|          | 2233/300001 [20:27:25<2717:19:52, 32.85s/it]training loss: 6.981e-03:   1%|          | 2234/300001 [20:27:56<2687:00:13, 32.49s/it]training loss: 6.981e-03:   1%|          | 2235/300001 [20:28:29<2683:09:50, 32.44s/it]training loss: 6.981e-03:   1%|          | 2236/300001 [20:29:00<2652:07:49, 32.06s/it]training loss: 6.981e-03:   1%|          | 2237/300001 [20:29:33<2671:11:48, 32.30s/it]training loss: 6.981e-03:   1%|          | 2238/300001 [20:30:05<2677:11:58, 32.37s/it]training loss: 6.981e-03:   1%|          | 2239/300001 [20:30:39<2698:14:32, 32.62s/it]training loss: 6.981e-03:   1%|          | 2240/300001 [20:31:10<2667:49:42, 32.25s/it]training loss: 8.543e-03:   1%|          | 2240/300001 [20:31:42<2667:49:42, 32.25s/it]training loss: 8.543e-03:   1%|          | 2241/300001 [20:31:42<2663:34:30, 32.20s/it]training loss: 8.543e-03:   1%|          | 2242/300001 [20:32:15<2680:38:08, 32.41s/it]training loss: 8.543e-03:   1%|          | 2243/300001 [20:32:49<2712:52:49, 32.80s/it]training loss: 8.543e-03:   1%|          | 2244/300001 [20:33:22<2720:35:05, 32.89s/it]training loss: 8.543e-03:   1%|          | 2245/300001 [20:33:54<2715:50:55, 32.84s/it]training loss: 8.543e-03:   1%|          | 2246/300001 [20:34:27<2715:30:22, 32.83s/it]training loss: 8.543e-03:   1%|          | 2247/300001 [20:35:00<2720:24:29, 32.89s/it]training loss: 8.543e-03:   1%|          | 2248/300001 [20:35:34<2730:33:30, 33.01s/it]training loss: 8.543e-03:   1%|          | 2249/300001 [20:36:06<2726:28:37, 32.96s/it]training loss: 8.543e-03:   1%|          | 2250/300001 [20:36:38<2700:57:39, 32.66s/it]training loss: 8.543e-03:   1%|          | 2251/300001 [20:37:11<2705:30:16, 32.71s/it]training loss: 8.543e-03:   1%|          | 2252/300001 [20:37:45<2727:12:00, 32.97s/it]training loss: 8.543e-03:   1%|          | 2253/300001 [20:38:17<2705:33:04, 32.71s/it]training loss: 8.543e-03:   1%|          | 2254/300001 [20:38:50<2710:57:49, 32.78s/it]training loss: 8.543e-03:   1%|          | 2255/300001 [20:39:24<2737:34:15, 33.10s/it]training loss: 8.543e-03:   1%|          | 2256/300001 [20:39:56<2729:05:30, 33.00s/it]training loss: 8.543e-03:   1%|          | 2257/300001 [20:40:28<2696:36:31, 32.60s/it]training loss: 8.543e-03:   1%|          | 2258/300001 [20:41:01<2696:30:59, 32.60s/it]training loss: 8.543e-03:   1%|          | 2259/300001 [20:41:33<2691:36:28, 32.54s/it]training loss: 8.543e-03:   1%|          | 2260/300001 [20:42:06<2705:24:36, 32.71s/it]training loss: 7.698e-03:   1%|          | 2260/300001 [20:42:38<2705:24:36, 32.71s/it]training loss: 7.698e-03:   1%|          | 2261/300001 [20:42:38<2691:49:22, 32.55s/it]training loss: 7.698e-03:   1%|          | 2262/300001 [20:43:11<2705:23:17, 32.71s/it]training loss: 7.698e-03:   1%|          | 2263/300001 [20:43:43<2686:34:14, 32.48s/it]training loss: 7.698e-03:   1%|          | 2264/300001 [20:44:15<2676:10:34, 32.36s/it]training loss: 7.698e-03:   1%|          | 2265/300001 [20:44:48<2674:31:42, 32.34s/it]training loss: 7.698e-03:   1%|          | 2266/300001 [20:45:20<2674:23:36, 32.34s/it]training loss: 7.698e-03:   1%|          | 2267/300001 [20:45:53<2691:18:44, 32.54s/it]training loss: 7.698e-03:   1%|          | 2268/300001 [20:46:26<2691:17:11, 32.54s/it]training loss: 7.698e-03:   1%|          | 2269/300001 [20:46:58<2687:08:39, 32.49s/it]training loss: 7.698e-03:   1%|          | 2270/300001 [20:47:31<2689:23:03, 32.52s/it]training loss: 7.698e-03:   1%|          | 2271/300001 [20:48:02<2662:21:29, 32.19s/it]training loss: 7.698e-03:   1%|          | 2272/300001 [20:48:35<2692:58:39, 32.56s/it]training loss: 7.698e-03:   1%|          | 2273/300001 [20:49:07<2662:42:31, 32.20s/it]training loss: 7.698e-03:   1%|          | 2274/300001 [20:49:39<2665:23:49, 32.23s/it]training loss: 7.698e-03:   1%|          | 2275/300001 [20:50:12<2674:02:24, 32.33s/it]training loss: 7.698e-03:   1%|          | 2276/300001 [20:50:44<2682:31:38, 32.44s/it]training loss: 7.698e-03:   1%|          | 2277/300001 [20:51:16<2663:31:41, 32.21s/it]training loss: 7.698e-03:   1%|          | 2278/300001 [20:51:49<2670:12:21, 32.29s/it]training loss: 7.698e-03:   1%|          | 2279/300001 [20:52:21<2666:14:27, 32.24s/it]training loss: 7.698e-03:   1%|          | 2280/300001 [20:52:53<2664:17:15, 32.22s/it]training loss: 5.841e-03:   1%|          | 2280/300001 [20:53:25<2664:17:15, 32.22s/it]training loss: 5.841e-03:   1%|          | 2281/300001 [20:53:25<2656:23:17, 32.12s/it]training loss: 5.841e-03:   1%|          | 2282/300001 [20:53:56<2637:33:00, 31.89s/it]training loss: 5.841e-03:   1%|          | 2283/300001 [20:54:28<2649:57:21, 32.04s/it]training loss: 5.841e-03:   1%|          | 2284/300001 [20:55:02<2678:16:30, 32.39s/it]training loss: 5.841e-03:   1%|          | 2285/300001 [20:55:34<2685:19:24, 32.47s/it]training loss: 5.841e-03:   1%|          | 2286/300001 [20:56:06<2673:26:22, 32.33s/it]training loss: 5.841e-03:   1%|          | 2287/300001 [20:56:39<2684:35:33, 32.46s/it]training loss: 5.841e-03:   1%|          | 2288/300001 [20:57:12<2683:40:16, 32.45s/it]training loss: 5.841e-03:   1%|          | 2289/300001 [20:57:43<2659:39:56, 32.16s/it]training loss: 5.841e-03:   1%|          | 2290/300001 [20:58:15<2662:46:02, 32.20s/it]training loss: 5.841e-03:   1%|          | 2291/300001 [20:58:48<2671:51:44, 32.31s/it]training loss: 5.841e-03:   1%|          | 2292/300001 [20:59:20<2663:26:56, 32.21s/it]training loss: 5.841e-03:   1%|          | 2293/300001 [20:59:52<2664:44:11, 32.22s/it]training loss: 5.841e-03:   1%|          | 2294/300001 [21:00:24<2663:45:22, 32.21s/it]training loss: 5.841e-03:   1%|          | 2295/300001 [21:00:56<2659:52:03, 32.16s/it]training loss: 5.841e-03:   1%|          | 2296/300001 [21:01:28<2649:52:21, 32.04s/it]training loss: 5.841e-03:   1%|          | 2297/300001 [21:02:02<2694:04:30, 32.58s/it]training loss: 5.841e-03:   1%|          | 2298/300001 [21:02:35<2703:03:16, 32.69s/it]training loss: 5.841e-03:   1%|          | 2299/300001 [21:03:06<2668:32:16, 32.27s/it]training loss: 5.841e-03:   1%|          | 2300/300001 [21:03:39<2684:48:42, 32.47s/it]training loss: 5.919e-03:   1%|          | 2300/300001 [21:04:12<2684:48:42, 32.47s/it]training loss: 5.919e-03:   1%|          | 2301/300001 [21:04:12<2701:00:11, 32.66s/it]training loss: 5.919e-03:   1%|          | 2302/300001 [21:04:43<2662:20:39, 32.20s/it]training loss: 5.919e-03:   1%|          | 2303/300001 [21:05:16<2681:04:03, 32.42s/it]training loss: 5.919e-03:   1%|          | 2304/300001 [21:05:49<2689:55:31, 32.53s/it]training loss: 5.919e-03:   1%|          | 2305/300001 [21:06:21<2685:33:01, 32.48s/it]training loss: 5.919e-03:   1%|          | 2306/300001 [21:06:54<2700:49:07, 32.66s/it]training loss: 5.919e-03:   1%|          | 2307/300001 [21:07:26<2665:26:03, 32.23s/it]training loss: 5.919e-03:   1%|          | 2308/300001 [21:07:59<2689:52:03, 32.53s/it]training loss: 5.919e-03:   1%|          | 2309/300001 [21:08:32<2701:38:41, 32.67s/it]training loss: 5.919e-03:   1%|          | 2310/300001 [21:09:04<2675:09:15, 32.35s/it]training loss: 5.919e-03:   1%|          | 2311/300001 [21:09:35<2663:22:01, 32.21s/it]training loss: 5.919e-03:   1%|          | 2312/300001 [21:10:08<2664:04:25, 32.22s/it]training loss: 5.919e-03:   1%|          | 2313/300001 [21:10:40<2660:47:44, 32.18s/it]training loss: 5.919e-03:   1%|          | 2314/300001 [21:11:11<2642:19:59, 31.95s/it]training loss: 5.919e-03:   1%|          | 2315/300001 [21:11:44<2662:12:52, 32.19s/it]training loss: 5.919e-03:   1%|          | 2316/300001 [21:12:16<2656:56:24, 32.13s/it]training loss: 5.919e-03:   1%|          | 2317/300001 [21:12:46<2603:37:19, 31.49s/it]training loss: 5.919e-03:   1%|          | 2318/300001 [21:13:18<2630:48:58, 31.82s/it]training loss: 5.919e-03:   1%|          | 2319/300001 [21:13:51<2643:59:57, 31.98s/it]training loss: 5.919e-03:   1%|          | 2320/300001 [21:14:23<2649:49:43, 32.05s/it]training loss: 6.288e-03:   1%|          | 2320/300001 [21:14:56<2649:49:43, 32.05s/it]training loss: 6.288e-03:   1%|          | 2321/300001 [21:14:56<2669:22:06, 32.28s/it]training loss: 6.288e-03:   1%|          | 2322/300001 [21:15:28<2667:10:20, 32.26s/it]training loss: 6.288e-03:   1%|          | 2323/300001 [21:16:01<2690:55:20, 32.54s/it]training loss: 6.288e-03:   1%|          | 2324/300001 [21:16:34<2688:12:46, 32.51s/it]training loss: 6.288e-03:   1%|          | 2325/300001 [21:17:06<2692:35:13, 32.56s/it]training loss: 6.288e-03:   1%|          | 2326/300001 [21:17:38<2666:01:53, 32.24s/it]training loss: 6.288e-03:   1%|          | 2327/300001 [21:18:11<2687:06:50, 32.50s/it]training loss: 6.288e-03:   1%|          | 2328/300001 [21:18:43<2672:15:49, 32.32s/it]training loss: 6.288e-03:   1%|          | 2329/300001 [21:19:15<2665:02:23, 32.23s/it]training loss: 6.288e-03:   1%|          | 2330/300001 [21:19:47<2668:08:07, 32.27s/it]training loss: 6.288e-03:   1%|          | 2331/300001 [21:20:20<2675:40:26, 32.36s/it]training loss: 6.288e-03:   1%|          | 2332/300001 [21:20:52<2672:31:38, 32.32s/it]training loss: 6.288e-03:   1%|          | 2333/300001 [21:21:25<2688:56:15, 32.52s/it]training loss: 6.288e-03:   1%|          | 2334/300001 [21:21:56<2660:58:46, 32.18s/it]training loss: 6.288e-03:   1%|          | 2335/300001 [21:22:29<2670:09:53, 32.29s/it]training loss: 6.288e-03:   1%|          | 2336/300001 [21:23:01<2653:51:55, 32.10s/it]training loss: 6.288e-03:   1%|          | 2337/300001 [21:23:33<2653:13:59, 32.09s/it]training loss: 6.288e-03:   1%|          | 2338/300001 [21:24:06<2673:59:41, 32.34s/it]training loss: 6.288e-03:   1%|          | 2339/300001 [21:24:37<2638:34:03, 31.91s/it]training loss: 6.288e-03:   1%|          | 2340/300001 [21:25:10<2665:05:28, 32.23s/it]training loss: 5.364e-03:   1%|          | 2340/300001 [21:25:42<2665:05:28, 32.23s/it]training loss: 5.364e-03:   1%|          | 2341/300001 [21:25:42<2662:31:21, 32.20s/it]training loss: 5.364e-03:   1%|          | 2342/300001 [21:26:12<2624:24:48, 31.74s/it]training loss: 5.364e-03:   1%|          | 2343/300001 [21:26:44<2628:25:21, 31.79s/it]training loss: 5.364e-03:   1%|          | 2344/300001 [21:27:17<2664:42:54, 32.23s/it]training loss: 5.364e-03:   1%|          | 2345/300001 [21:27:50<2661:42:18, 32.19s/it]training loss: 5.364e-03:   1%|          | 2346/300001 [21:28:23<2689:20:06, 32.53s/it]training loss: 5.364e-03:   1%|          | 2347/300001 [21:28:57<2719:28:09, 32.89s/it]training loss: 5.364e-03:   1%|          | 2348/300001 [21:29:29<2706:09:55, 32.73s/it]training loss: 5.364e-03:   1%|          | 2349/300001 [21:30:03<2727:26:26, 32.99s/it]training loss: 5.364e-03:   1%|          | 2350/300001 [21:30:36<2730:54:00, 33.03s/it]training loss: 5.364e-03:   1%|          | 2351/300001 [21:31:09<2726:31:09, 32.98s/it]training loss: 5.364e-03:   1%|          | 2352/300001 [21:31:41<2703:35:49, 32.70s/it]training loss: 5.364e-03:   1%|          | 2353/300001 [21:32:12<2678:33:23, 32.40s/it]training loss: 5.364e-03:   1%|          | 2354/300001 [21:32:44<2648:59:24, 32.04s/it]training loss: 5.364e-03:   1%|          | 2355/300001 [21:33:06<2422:36:59, 29.30s/it]training loss: 5.364e-03:   1%|          | 2356/300001 [21:33:39<2513:58:42, 30.41s/it]training loss: 5.364e-03:   1%|          | 2357/300001 [21:34:11<2552:40:44, 30.87s/it]training loss: 5.364e-03:   1%|          | 2358/300001 [21:34:43<2566:03:35, 31.04s/it]training loss: 5.364e-03:   1%|          | 2359/300001 [21:35:16<2628:00:46, 31.79s/it]training loss: 5.364e-03:   1%|          | 2360/300001 [21:35:49<2651:23:25, 32.07s/it]training loss: 5.904e-03:   1%|          | 2360/300001 [21:36:21<2651:23:25, 32.07s/it]training loss: 5.904e-03:   1%|          | 2361/300001 [21:36:21<2650:14:08, 32.05s/it]training loss: 5.904e-03:   1%|          | 2362/300001 [21:36:53<2650:33:24, 32.06s/it]training loss: 5.904e-03:   1%|          | 2363/300001 [21:37:26<2670:20:15, 32.30s/it]training loss: 5.904e-03:   1%|          | 2364/300001 [21:37:59<2696:22:37, 32.61s/it]training loss: 5.904e-03:   1%|          | 2365/300001 [21:38:33<2716:08:39, 32.85s/it]training loss: 5.904e-03:   1%|          | 2366/300001 [21:39:06<2719:58:46, 32.90s/it]training loss: 5.904e-03:   1%|          | 2367/300001 [21:39:39<2722:43:20, 32.93s/it]training loss: 5.904e-03:   1%|          | 2368/300001 [21:40:11<2708:38:15, 32.76s/it]training loss: 5.904e-03:   1%|          | 2369/300001 [21:40:45<2725:20:08, 32.96s/it]training loss: 5.904e-03:   1%|          | 2370/300001 [21:41:18<2742:46:56, 33.18s/it]training loss: 5.904e-03:   1%|          | 2371/300001 [21:41:50<2703:30:01, 32.70s/it]training loss: 5.904e-03:   1%|          | 2372/300001 [21:42:23<2711:56:20, 32.80s/it]training loss: 5.904e-03:   1%|          | 2373/300001 [21:42:54<2676:35:31, 32.38s/it]training loss: 5.904e-03:   1%|          | 2374/300001 [21:43:27<2678:03:14, 32.39s/it]training loss: 5.904e-03:   1%|          | 2375/300001 [21:44:00<2689:51:04, 32.54s/it]training loss: 5.904e-03:   1%|          | 2376/300001 [21:44:31<2660:40:02, 32.18s/it]training loss: 5.904e-03:   1%|          | 2377/300001 [21:45:03<2662:07:50, 32.20s/it]training loss: 5.904e-03:   1%|          | 2378/300001 [21:45:35<2663:57:27, 32.22s/it]training loss: 5.904e-03:   1%|          | 2379/300001 [21:46:08<2673:53:16, 32.34s/it]training loss: 5.904e-03:   1%|          | 2380/300001 [21:46:41<2687:39:34, 32.51s/it]training loss: 6.271e-03:   1%|          | 2380/300001 [21:47:15<2687:39:34, 32.51s/it]training loss: 6.271e-03:   1%|          | 2381/300001 [21:47:15<2732:24:20, 33.05s/it]training loss: 6.271e-03:   1%|          | 2382/300001 [21:47:47<2691:30:11, 32.56s/it]training loss: 6.271e-03:   1%|          | 2383/300001 [21:48:18<2665:53:44, 32.25s/it]training loss: 6.271e-03:   1%|          | 2384/300001 [21:48:50<2660:44:47, 32.18s/it]training loss: 6.271e-03:   1%|          | 2385/300001 [21:49:22<2656:05:26, 32.13s/it]training loss: 6.271e-03:   1%|          | 2386/300001 [21:49:55<2669:15:08, 32.29s/it]training loss: 6.271e-03:   1%|          | 2387/300001 [21:50:27<2673:30:30, 32.34s/it]training loss: 6.271e-03:   1%|          | 2388/300001 [21:50:59<2659:03:16, 32.16s/it]training loss: 6.271e-03:   1%|          | 2389/300001 [21:51:30<2635:20:33, 31.88s/it]training loss: 6.271e-03:   1%|          | 2390/300001 [21:52:03<2652:48:56, 32.09s/it]training loss: 6.271e-03:   1%|          | 2391/300001 [21:52:35<2664:20:56, 32.23s/it]training loss: 6.271e-03:   1%|          | 2392/300001 [21:53:07<2651:08:32, 32.07s/it]training loss: 6.271e-03:   1%|          | 2393/300001 [21:53:40<2660:48:35, 32.19s/it]training loss: 6.271e-03:   1%|          | 2394/300001 [21:54:12<2671:42:48, 32.32s/it]training loss: 6.271e-03:   1%|          | 2395/300001 [21:54:45<2674:36:26, 32.35s/it]training loss: 6.271e-03:   1%|          | 2396/300001 [21:55:17<2677:50:18, 32.39s/it]training loss: 6.271e-03:   1%|          | 2397/300001 [21:55:50<2682:49:52, 32.45s/it]training loss: 6.271e-03:   1%|          | 2398/300001 [21:56:22<2671:38:33, 32.32s/it]training loss: 6.271e-03:   1%|          | 2399/300001 [21:56:54<2673:32:24, 32.34s/it]training loss: 6.271e-03:   1%|          | 2400/300001 [21:57:26<2656:21:13, 32.13s/it]training loss: 5.810e-03:   1%|          | 2400/300001 [21:57:57<2656:21:13, 32.13s/it]training loss: 5.810e-03:   1%|          | 2401/300001 [21:57:57<2642:34:08, 31.97s/it]training loss: 5.810e-03:   1%|          | 2402/300001 [21:58:30<2664:51:31, 32.24s/it]training loss: 5.810e-03:   1%|          | 2403/300001 [21:59:02<2654:26:16, 32.11s/it]training loss: 5.810e-03:   1%|          | 2404/300001 [21:59:35<2673:45:39, 32.34s/it]training loss: 5.810e-03:   1%|          | 2405/300001 [22:00:06<2649:15:15, 32.05s/it]training loss: 5.810e-03:   1%|          | 2406/300001 [22:00:38<2630:55:22, 31.83s/it]training loss: 5.810e-03:   1%|          | 2407/300001 [22:01:10<2647:59:55, 32.03s/it]training loss: 5.810e-03:   1%|          | 2408/300001 [22:01:43<2659:10:14, 32.17s/it]training loss: 5.810e-03:   1%|          | 2409/300001 [22:02:15<2675:41:25, 32.37s/it]training loss: 5.810e-03:   1%|          | 2410/300001 [22:02:48<2685:31:49, 32.49s/it]training loss: 5.810e-03:   1%|          | 2411/300001 [22:03:20<2675:58:15, 32.37s/it]training loss: 5.810e-03:   1%|          | 2412/300001 [22:03:52<2668:20:48, 32.28s/it]training loss: 5.810e-03:   1%|          | 2413/300001 [22:04:25<2673:48:10, 32.35s/it]training loss: 5.810e-03:   1%|          | 2414/300001 [22:04:57<2668:52:56, 32.29s/it]training loss: 5.810e-03:   1%|          | 2415/300001 [22:05:28<2647:22:31, 32.03s/it]training loss: 5.810e-03:   1%|          | 2416/300001 [22:06:01<2649:44:40, 32.05s/it]training loss: 5.810e-03:   1%|          | 2417/300001 [22:06:32<2640:14:29, 31.94s/it]training loss: 5.810e-03:   1%|          | 2418/300001 [22:07:04<2643:32:48, 31.98s/it]training loss: 5.810e-03:   1%|          | 2419/300001 [22:07:36<2644:19:09, 31.99s/it]training loss: 5.810e-03:   1%|          | 2420/300001 [22:08:08<2626:16:33, 31.77s/it]training loss: 6.402e-03:   1%|          | 2420/300001 [22:08:40<2626:16:33, 31.77s/it]training loss: 6.402e-03:   1%|          | 2421/300001 [22:08:40<2651:29:59, 32.08s/it]training loss: 6.402e-03:   1%|          | 2422/300001 [22:09:12<2652:17:42, 32.09s/it]training loss: 6.402e-03:   1%|          | 2423/300001 [22:09:44<2648:23:32, 32.04s/it]training loss: 6.402e-03:   1%|          | 2424/300001 [22:10:17<2651:58:57, 32.08s/it]training loss: 6.402e-03:   1%|          | 2425/300001 [22:10:49<2655:05:10, 32.12s/it]training loss: 6.402e-03:   1%|          | 2426/300001 [22:11:20<2640:38:01, 31.95s/it]training loss: 6.402e-03:   1%|          | 2427/300001 [22:11:53<2649:38:52, 32.05s/it]training loss: 6.402e-03:   1%|          | 2428/300001 [22:12:24<2639:19:30, 31.93s/it]training loss: 6.402e-03:   1%|          | 2429/300001 [22:12:57<2656:17:12, 32.14s/it]training loss: 6.402e-03:   1%|          | 2430/300001 [22:13:28<2642:29:58, 31.97s/it]training loss: 6.402e-03:   1%|          | 2431/300001 [22:14:01<2660:41:59, 32.19s/it]training loss: 6.402e-03:   1%|          | 2432/300001 [22:14:34<2687:08:12, 32.51s/it]training loss: 6.402e-03:   1%|          | 2433/300001 [22:15:06<2662:50:05, 32.22s/it]training loss: 6.402e-03:   1%|          | 2434/300001 [22:15:38<2670:08:43, 32.30s/it]training loss: 6.402e-03:   1%|          | 2435/300001 [22:16:12<2698:55:14, 32.65s/it]training loss: 6.402e-03:   1%|          | 2436/300001 [22:16:44<2689:52:21, 32.54s/it]training loss: 6.402e-03:   1%|          | 2437/300001 [22:17:17<2700:10:07, 32.67s/it]training loss: 6.402e-03:   1%|          | 2438/300001 [22:17:49<2689:59:35, 32.54s/it]training loss: 6.402e-03:   1%|          | 2439/300001 [22:18:21<2671:20:22, 32.32s/it]training loss: 6.402e-03:   1%|          | 2440/300001 [22:18:54<2672:28:52, 32.33s/it]training loss: 6.365e-03:   1%|          | 2440/300001 [22:19:27<2672:28:52, 32.33s/it]training loss: 6.365e-03:   1%|          | 2441/300001 [22:19:27<2710:39:43, 32.79s/it]training loss: 6.365e-03:   1%|          | 2442/300001 [22:20:00<2703:25:34, 32.71s/it]training loss: 6.365e-03:   1%|          | 2443/300001 [22:20:31<2669:36:37, 32.30s/it]training loss: 6.365e-03:   1%|          | 2444/300001 [22:21:04<2679:21:17, 32.42s/it]training loss: 6.365e-03:   1%|          | 2445/300001 [22:21:36<2677:57:45, 32.40s/it]training loss: 6.365e-03:   1%|          | 2446/300001 [22:22:08<2669:00:30, 32.29s/it]training loss: 6.365e-03:   1%|          | 2447/300001 [22:22:41<2679:08:14, 32.41s/it]training loss: 6.365e-03:   1%|          | 2448/300001 [22:23:13<2656:50:24, 32.14s/it]training loss: 6.365e-03:   1%|          | 2449/300001 [22:23:45<2665:37:43, 32.25s/it]training loss: 6.365e-03:   1%|          | 2450/300001 [22:24:17<2663:29:31, 32.22s/it]training loss: 6.365e-03:   1%|          | 2451/300001 [22:24:49<2660:54:42, 32.19s/it]training loss: 6.365e-03:   1%|          | 2452/300001 [22:25:22<2673:02:33, 32.34s/it]training loss: 6.365e-03:   1%|          | 2453/300001 [22:25:54<2653:05:17, 32.10s/it]training loss: 6.365e-03:   1%|          | 2454/300001 [22:26:27<2675:27:04, 32.37s/it]training loss: 6.365e-03:   1%|          | 2455/300001 [22:26:58<2651:45:42, 32.08s/it]training loss: 6.365e-03:   1%|          | 2456/300001 [22:27:30<2645:52:04, 32.01s/it]training loss: 6.365e-03:   1%|          | 2457/300001 [22:28:02<2655:23:52, 32.13s/it]training loss: 6.365e-03:   1%|          | 2458/300001 [22:28:33<2619:39:39, 31.70s/it]training loss: 6.365e-03:   1%|          | 2459/300001 [22:29:04<2614:38:11, 31.63s/it]training loss: 6.365e-03:   1%|          | 2460/300001 [22:29:37<2626:33:13, 31.78s/it]training loss: 5.168e-03:   1%|          | 2460/300001 [22:30:09<2626:33:13, 31.78s/it]training loss: 5.168e-03:   1%|          | 2461/300001 [22:30:10<2655:06:57, 32.12s/it]training loss: 5.168e-03:   1%|          | 2462/300001 [22:30:41<2633:35:01, 31.86s/it]training loss: 5.168e-03:   1%|          | 2463/300001 [22:31:12<2628:43:46, 31.81s/it]training loss: 5.168e-03:   1%|          | 2464/300001 [22:31:45<2638:56:33, 31.93s/it]training loss: 5.168e-03:   1%|          | 2465/300001 [22:32:18<2675:44:54, 32.37s/it]training loss: 5.168e-03:   1%|          | 2466/300001 [22:32:51<2679:40:01, 32.42s/it]training loss: 5.168e-03:   1%|          | 2467/300001 [22:33:23<2676:53:47, 32.39s/it]training loss: 5.168e-03:   1%|          | 2468/300001 [22:33:55<2673:40:13, 32.35s/it]training loss: 5.168e-03:   1%|          | 2469/300001 [22:34:27<2659:16:08, 32.18s/it]training loss: 5.168e-03:   1%|          | 2470/300001 [22:35:00<2688:56:38, 32.54s/it]training loss: 5.168e-03:   1%|          | 2471/300001 [22:35:33<2703:09:03, 32.71s/it]training loss: 5.168e-03:   1%|          | 2472/300001 [22:36:06<2696:43:38, 32.63s/it]training loss: 5.168e-03:   1%|          | 2473/300001 [22:36:38<2690:21:08, 32.55s/it]training loss: 5.168e-03:   1%|          | 2474/300001 [22:37:12<2712:27:02, 32.82s/it]training loss: 5.168e-03:   1%|          | 2475/300001 [22:37:44<2704:39:47, 32.73s/it]training loss: 5.168e-03:   1%|          | 2476/300001 [22:38:18<2719:08:39, 32.90s/it]training loss: 5.168e-03:   1%|          | 2477/300001 [22:38:50<2715:38:52, 32.86s/it]training loss: 5.168e-03:   1%|          | 2478/300001 [22:39:24<2725:32:42, 32.98s/it]training loss: 5.168e-03:   1%|          | 2479/300001 [22:39:57<2725:51:57, 32.98s/it]training loss: 5.168e-03:   1%|          | 2480/300001 [22:40:30<2727:15:50, 33.00s/it]training loss: 5.435e-03:   1%|          | 2480/300001 [22:41:02<2727:15:50, 33.00s/it]training loss: 5.435e-03:   1%|          | 2481/300001 [22:41:02<2706:56:38, 32.75s/it]training loss: 5.435e-03:   1%|          | 2482/300001 [22:41:34<2698:01:13, 32.65s/it]training loss: 5.435e-03:   1%|          | 2483/300001 [22:42:05<2663:58:31, 32.23s/it]training loss: 5.435e-03:   1%|          | 2484/300001 [22:42:39<2691:45:06, 32.57s/it]training loss: 5.435e-03:   1%|          | 2485/300001 [22:43:11<2680:20:54, 32.43s/it]training loss: 5.435e-03:   1%|          | 2486/300001 [22:43:44<2702:46:51, 32.70s/it]training loss: 5.435e-03:   1%|          | 2487/300001 [22:44:17<2714:55:21, 32.85s/it]training loss: 5.435e-03:   1%|          | 2488/300001 [22:44:49<2692:14:16, 32.58s/it]training loss: 5.435e-03:   1%|          | 2489/300001 [22:45:22<2702:28:43, 32.70s/it]training loss: 5.435e-03:   1%|          | 2490/300001 [22:45:54<2669:21:29, 32.30s/it]training loss: 5.435e-03:   1%|          | 2491/300001 [22:46:26<2675:20:46, 32.37s/it]training loss: 5.435e-03:   1%|          | 2492/300001 [22:46:58<2656:10:07, 32.14s/it]training loss: 5.435e-03:   1%|          | 2493/300001 [22:47:30<2661:28:27, 32.21s/it]training loss: 5.435e-03:   1%|          | 2494/300001 [22:48:02<2663:36:02, 32.23s/it]training loss: 5.435e-03:   1%|          | 2495/300001 [22:48:35<2672:58:59, 32.34s/it]training loss: 5.435e-03:   1%|          | 2496/300001 [22:49:08<2675:10:41, 32.37s/it]training loss: 5.435e-03:   1%|          | 2497/300001 [22:49:38<2634:44:45, 31.88s/it]training loss: 5.435e-03:   1%|          | 2498/300001 [22:50:11<2653:38:09, 32.11s/it]training loss: 5.435e-03:   1%|          | 2499/300001 [22:50:44<2675:17:41, 32.37s/it]training loss: 5.435e-03:   1%|          | 2500/300001 [22:51:16<2663:38:36, 32.23s/it]training loss: 5.766e-03:   1%|          | 2500/300001 [22:51:47<2663:38:36, 32.23s/it]training loss: 5.766e-03:   1%|          | 2501/300001 [22:51:52<2756:27:15, 33.36s/it]training loss: 5.766e-03:   1%|          | 2502/300001 [22:52:24<2721:35:50, 32.93s/it]training loss: 5.766e-03:   1%|          | 2503/300001 [22:52:57<2720:02:55, 32.92s/it]training loss: 5.766e-03:   1%|          | 2504/300001 [22:53:29<2701:15:15, 32.69s/it]training loss: 5.766e-03:   1%|          | 2505/300001 [22:54:00<2665:45:48, 32.26s/it]training loss: 5.766e-03:   1%|          | 2506/300001 [22:54:32<2650:13:53, 32.07s/it]training loss: 5.766e-03:   1%|          | 2507/300001 [22:55:03<2632:14:40, 31.85s/it]training loss: 5.766e-03:   1%|          | 2508/300001 [22:55:35<2641:20:58, 31.96s/it]training loss: 5.766e-03:   1%|          | 2509/300001 [22:56:07<2647:31:42, 32.04s/it]training loss: 5.766e-03:   1%|          | 2510/300001 [22:56:39<2625:59:24, 31.78s/it]training loss: 5.766e-03:   1%|          | 2511/300001 [22:57:11<2638:34:31, 31.93s/it]training loss: 5.766e-03:   1%|          | 2512/300001 [22:57:34<2420:27:56, 29.29s/it]training loss: 5.766e-03:   1%|          | 2513/300001 [22:58:07<2511:56:59, 30.40s/it]training loss: 5.766e-03:   1%|          | 2514/300001 [22:58:39<2549:01:25, 30.85s/it]slurmstepd: error: *** JOB 9913564 ON gpu016 CANCELLED AT 2026-05-15T15:34:01 DUE TO TIME LIMIT ***
diff --git a/slurm/logs/pidm_darcy_cocogen_9913564.out b/slurm/logs/pidm_darcy_cocogen_9913564.out
deleted file mode 100644
index 4b80c77..0000000
--- a/slurm/logs/pidm_darcy_cocogen_9913564.out
+++ /dev/null
@@ -1 +0,0 @@
-Number of trainable parameters: 10386482
diff --git a/slurm/logs/pidm_darcy_diffusion_9913375.err b/slurm/logs/pidm_darcy_diffusion_9913375.err
deleted file mode 100644
index d6624e8..0000000
--- a/slurm/logs/pidm_darcy_diffusion_9913375.err
+++ /dev/null
@@ -1,6 +0,0 @@
-  0%|          | 0/300001 [00:00<?, ?it/s]training loss: 3.326e+00:   0%|          | 0/300001 [00:32<?, ?it/s]training loss: 3.326e+00:   0%|          | 1/300001 [03:41<18496:18:51, 221.96s/it]/cm/local/apps/slurm/var/spool/job9913375/slurm_script: line 29: 1984154 Killed                  python -c "
-import os
-code = open('main.py').read().replace(\"name = 'run_1'\", \"name = '\" + os.environ['PIDM_RUN_NAME'] + \"'\")
-exec(compile(code, 'main.py', 'exec'))
-"
-slurmstepd: error: Detected 1 oom-kill event(s) in StepId=9913375.batch. Some of your processes may have been killed by the cgroup out-of-memory handler.
diff --git a/slurm/logs/pidm_darcy_diffusion_9913375.out b/slurm/logs/pidm_darcy_diffusion_9913375.out
deleted file mode 100644
index 4b80c77..0000000
--- a/slurm/logs/pidm_darcy_diffusion_9913375.out
+++ /dev/null
@@ -1 +0,0 @@
-Number of trainable parameters: 10386482
diff --git a/slurm/logs/pidm_darcy_diffusion_9913543.err b/slurm/logs/pidm_darcy_diffusion_9913543.err
deleted file mode 100644
index 6525e7a..0000000
--- a/slurm/logs/pidm_darcy_diffusion_9913543.err
+++ /dev/null
@@ -1 +0,0 @@
-  0%|          | 0/300001 [00:00<?, ?it/s]training loss: 3.473e+00:   0%|          | 0/300001 [00:32<?, ?it/s]training loss: 3.473e+00:   0%|          | 1/300001 [02:54<14573:13:51, 174.88s/it]training loss: 3.473e+00:   0%|          | 2/300001 [03:27<7596:57:35, 91.16s/it]  training loss: 3.473e+00:   0%|          | 3/300001 [04:00<5378:56:40, 64.55s/it]training loss: 3.473e+00:   0%|          | 4/300001 [04:33<4333:37:26, 52.00s/it]training loss: 3.473e+00:   0%|          | 5/300001 [05:05<3756:21:21, 45.08s/it]training loss: 3.473e+00:   0%|          | 6/300001 [05:38<3399:59:20, 40.80s/it]training loss: 3.473e+00:   0%|          | 7/300001 [06:10<3162:58:36, 37.96s/it]training loss: 3.473e+00:   0%|          | 8/300001 [06:42<3013:07:15, 36.16s/it]training loss: 3.473e+00:   0%|          | 9/300001 [07:15<2929:17:03, 35.15s/it]training loss: 3.473e+00:   0%|          | 10/300001 [07:49<2888:02:46, 34.66s/it]training loss: 3.473e+00:   0%|          | 11/300001 [08:22<2844:46:33, 34.14s/it]training loss: 3.473e+00:   0%|          | 12/300001 [08:56<2837:44:46, 34.05s/it]training loss: 3.473e+00:   0%|          | 13/300001 [09:29<2814:37:50, 33.78s/it]training loss: 3.473e+00:   0%|          | 14/300001 [10:02<2794:26:25, 33.53s/it]training loss: 3.473e+00:   0%|          | 15/300001 [10:34<2762:06:16, 33.15s/it]training loss: 3.473e+00:   0%|          | 16/300001 [11:06<2746:25:29, 32.96s/it]training loss: 3.473e+00:   0%|          | 17/300001 [11:39<2737:32:28, 32.85s/it]training loss: 3.473e+00:   0%|          | 18/300001 [12:12<2741:40:47, 32.90s/it]training loss: 3.473e+00:   0%|          | 19/300001 [12:44<2709:24:28, 32.51s/it]training loss: 3.473e+00:   0%|          | 20/300001 [13:16<2709:05:20, 32.51s/it]training loss: 1.847e-01:   0%|          | 20/300001 [13:48<2709:05:20, 32.51s/it]training loss: 1.847e-01:   0%|          | 21/300001 [13:48<2682:52:05, 32.20s/it]training loss: 1.847e-01:   0%|          | 22/300001 [14:19<2670:02:07, 32.04s/it]training loss: 1.847e-01:   0%|          | 23/300001 [14:51<2669:26:21, 32.04s/it]training loss: 1.847e-01:   0%|          | 24/300001 [15:23<2656:22:09, 31.88s/it]training loss: 1.847e-01:   0%|          | 25/300001 [15:57<2699:37:03, 32.40s/it]training loss: 1.847e-01:   0%|          | 26/300001 [16:29<2707:58:53, 32.50s/it]training loss: 1.847e-01:   0%|          | 27/300001 [17:02<2715:54:55, 32.59s/it]training loss: 1.847e-01:   0%|          | 28/300001 [17:34<2697:27:16, 32.37s/it]training loss: 1.847e-01:   0%|          | 29/300001 [18:05<2659:45:17, 31.92s/it]training loss: 1.847e-01:   0%|          | 30/300001 [18:38<2701:53:45, 32.43s/it]training loss: 1.847e-01:   0%|          | 31/300001 [19:09<2658:04:31, 31.90s/it]training loss: 1.847e-01:   0%|          | 32/300001 [19:41<2651:48:09, 31.82s/it]training loss: 1.847e-01:   0%|          | 33/300001 [20:13<2665:55:38, 31.99s/it]training loss: 1.847e-01:   0%|          | 34/300001 [20:45<2654:52:18, 31.86s/it]training loss: 1.847e-01:   0%|          | 35/300001 [21:17<2659:48:52, 31.92s/it]training loss: 1.847e-01:   0%|          | 36/300001 [21:50<2690:08:33, 32.29s/it]training loss: 1.847e-01:   0%|          | 37/300001 [22:23<2699:25:28, 32.40s/it]training loss: 1.847e-01:   0%|          | 38/300001 [22:54<2679:20:05, 32.16s/it]training loss: 1.847e-01:   0%|          | 39/300001 [23:27<2695:37:09, 32.35s/it]training loss: 1.847e-01:   0%|          | 40/300001 [24:00<2715:27:35, 32.59s/it]training loss: 7.231e-02:   0%|          | 40/300001 [24:31<2715:27:35, 32.59s/it]training loss: 7.231e-02:   0%|          | 41/300001 [24:32<2687:29:23, 32.25s/it]training loss: 7.231e-02:   0%|          | 42/300001 [25:03<2671:08:39, 32.06s/it]training loss: 7.231e-02:   0%|          | 43/300001 [25:36<2687:23:53, 32.25s/it]training loss: 7.231e-02:   0%|          | 44/300001 [26:08<2692:31:28, 32.31s/it]training loss: 7.231e-02:   0%|          | 45/300001 [26:42<2725:08:17, 32.71s/it]training loss: 7.231e-02:   0%|          | 46/300001 [27:14<2709:38:37, 32.52s/it]training loss: 7.231e-02:   0%|          | 47/300001 [27:46<2701:47:22, 32.43s/it]training loss: 7.231e-02:   0%|          | 48/300001 [28:19<2700:07:56, 32.41s/it]training loss: 7.231e-02:   0%|          | 49/300001 [28:52<2721:34:47, 32.66s/it]training loss: 7.231e-02:   0%|          | 50/300001 [29:25<2725:55:06, 32.72s/it]training loss: 7.231e-02:   0%|          | 51/300001 [29:58<2751:22:54, 33.02s/it]training loss: 7.231e-02:   0%|          | 52/300001 [30:31<2741:51:16, 32.91s/it]training loss: 7.231e-02:   0%|          | 53/300001 [31:02<2694:38:15, 32.34s/it]training loss: 7.231e-02:   0%|          | 54/300001 [31:34<2688:59:58, 32.27s/it]training loss: 7.231e-02:   0%|          | 55/300001 [32:07<2698:17:20, 32.39s/it]training loss: 7.231e-02:   0%|          | 56/300001 [32:40<2710:38:33, 32.53s/it]training loss: 7.231e-02:   0%|          | 57/300001 [33:11<2690:49:20, 32.30s/it]training loss: 7.231e-02:   0%|          | 58/300001 [33:45<2713:56:40, 32.57s/it]training loss: 7.231e-02:   0%|          | 59/300001 [34:18<2724:05:38, 32.70s/it]training loss: 7.231e-02:   0%|          | 60/300001 [34:51<2739:29:02, 32.88s/it]training loss: 3.937e-02:   0%|          | 60/300001 [35:22<2739:29:02, 32.88s/it]training loss: 3.937e-02:   0%|          | 61/300001 [35:22<2705:13:16, 32.47s/it]training loss: 3.937e-02:   0%|          | 62/300001 [35:53<2668:13:20, 32.03s/it]training loss: 3.937e-02:   0%|          | 63/300001 [36:25<2659:54:44, 31.93s/it]training loss: 3.937e-02:   0%|          | 64/300001 [36:58<2693:49:38, 32.33s/it]training loss: 3.937e-02:   0%|          | 65/300001 [37:31<2700:10:58, 32.41s/it]training loss: 3.937e-02:   0%|          | 66/300001 [38:04<2711:19:46, 32.54s/it]training loss: 3.937e-02:   0%|          | 67/300001 [38:37<2736:52:43, 32.85s/it]training loss: 3.937e-02:   0%|          | 68/300001 [39:10<2736:20:42, 32.84s/it]training loss: 3.937e-02:   0%|          | 69/300001 [39:44<2747:33:03, 32.98s/it]training loss: 3.937e-02:   0%|          | 70/300001 [40:16<2724:01:35, 32.70s/it]training loss: 3.937e-02:   0%|          | 71/300001 [40:49<2731:56:16, 32.79s/it]training loss: 3.937e-02:   0%|          | 72/300001 [41:21<2732:04:51, 32.79s/it]training loss: 3.937e-02:   0%|          | 73/300001 [41:54<2728:08:29, 32.75s/it]training loss: 3.937e-02:   0%|          | 74/300001 [42:27<2723:44:39, 32.69s/it]training loss: 3.937e-02:   0%|          | 75/300001 [42:58<2696:13:23, 32.36s/it]training loss: 3.937e-02:   0%|          | 76/300001 [43:31<2712:31:25, 32.56s/it]training loss: 3.937e-02:   0%|          | 77/300001 [44:04<2722:48:21, 32.68s/it]training loss: 3.937e-02:   0%|          | 78/300001 [44:37<2726:58:01, 32.73s/it]training loss: 3.937e-02:   0%|          | 79/300001 [45:09<2701:27:32, 32.43s/it]training loss: 3.937e-02:   0%|          | 80/300001 [45:42<2715:29:21, 32.59s/it]training loss: 3.173e-02:   0%|          | 80/300001 [46:14<2715:29:21, 32.59s/it]training loss: 3.173e-02:   0%|          | 81/300001 [46:14<2709:04:08, 32.52s/it]training loss: 3.173e-02:   0%|          | 82/300001 [46:46<2692:45:48, 32.32s/it]training loss: 3.173e-02:   0%|          | 83/300001 [47:19<2714:19:06, 32.58s/it]training loss: 3.173e-02:   0%|          | 84/300001 [47:52<2716:17:54, 32.60s/it]training loss: 3.173e-02:   0%|          | 85/300001 [48:25<2725:37:01, 32.72s/it]training loss: 3.173e-02:   0%|          | 86/300001 [48:57<2707:51:15, 32.50s/it]training loss: 3.173e-02:   0%|          | 87/300001 [49:28<2675:29:22, 32.12s/it]training loss: 3.173e-02:   0%|          | 88/300001 [50:01<2700:55:01, 32.42s/it]training loss: 3.173e-02:   0%|          | 89/300001 [50:33<2694:01:25, 32.34s/it]training loss: 3.173e-02:   0%|          | 90/300001 [51:06<2695:25:32, 32.35s/it]training loss: 3.173e-02:   0%|          | 91/300001 [51:39<2711:57:55, 32.55s/it]training loss: 3.173e-02:   0%|          | 92/300001 [52:11<2701:30:45, 32.43s/it]training loss: 3.173e-02:   0%|          | 93/300001 [52:43<2686:11:05, 32.24s/it]training loss: 3.173e-02:   0%|          | 94/300001 [53:15<2683:05:45, 32.21s/it]training loss: 3.173e-02:   0%|          | 95/300001 [53:47<2686:51:19, 32.25s/it]training loss: 3.173e-02:   0%|          | 96/300001 [54:20<2700:26:10, 32.42s/it]training loss: 3.173e-02:   0%|          | 97/300001 [54:53<2705:32:12, 32.48s/it]training loss: 3.173e-02:   0%|          | 98/300001 [55:25<2710:16:16, 32.53s/it]training loss: 3.173e-02:   0%|          | 99/300001 [55:58<2716:23:00, 32.61s/it]training loss: 3.173e-02:   0%|          | 100/300001 [56:32<2741:41:02, 32.91s/it]training loss: 2.610e-02:   0%|          | 100/300001 [57:04<2741:41:02, 32.91s/it]training loss: 2.610e-02:   0%|          | 101/300001 [57:04<2727:02:48, 32.74s/it]training loss: 2.610e-02:   0%|          | 102/300001 [57:36<2715:59:55, 32.60s/it]training loss: 2.610e-02:   0%|          | 103/300001 [58:09<2729:58:30, 32.77s/it]training loss: 2.610e-02:   0%|          | 104/300001 [58:42<2734:04:57, 32.82s/it]training loss: 2.610e-02:   0%|          | 105/300001 [59:16<2751:19:03, 33.03s/it]training loss: 2.610e-02:   0%|          | 106/300001 [59:49<2751:17:32, 33.03s/it]training loss: 2.610e-02:   0%|          | 107/300001 [1:00:21<2737:04:57, 32.86s/it]training loss: 2.610e-02:   0%|          | 108/300001 [1:00:54<2727:00:36, 32.74s/it]training loss: 2.610e-02:   0%|          | 109/300001 [1:01:25<2697:58:11, 32.39s/it]training loss: 2.610e-02:   0%|          | 110/300001 [1:01:57<2684:18:41, 32.22s/it]training loss: 2.610e-02:   0%|          | 111/300001 [1:02:29<2686:15:31, 32.25s/it]training loss: 2.610e-02:   0%|          | 112/300001 [1:03:03<2711:47:25, 32.55s/it]training loss: 2.610e-02:   0%|          | 113/300001 [1:03:35<2711:05:32, 32.55s/it]training loss: 2.610e-02:   0%|          | 114/300001 [1:04:07<2692:39:22, 32.32s/it]training loss: 2.610e-02:   0%|          | 115/300001 [1:04:39<2678:34:16, 32.16s/it]training loss: 2.610e-02:   0%|          | 116/300001 [1:05:11<2677:43:08, 32.14s/it]training loss: 2.610e-02:   0%|          | 117/300001 [1:05:43<2675:00:38, 32.11s/it]training loss: 2.610e-02:   0%|          | 118/300001 [1:06:15<2663:50:03, 31.98s/it]training loss: 2.610e-02:   0%|          | 119/300001 [1:06:48<2693:25:48, 32.33s/it]training loss: 2.610e-02:   0%|          | 120/300001 [1:07:19<2672:57:40, 32.09s/it]training loss: 3.199e-02:   0%|          | 120/300001 [1:07:53<2672:57:40, 32.09s/it]training loss: 3.199e-02:   0%|          | 121/300001 [1:07:53<2702:08:30, 32.44s/it]training loss: 3.199e-02:   0%|          | 122/300001 [1:08:25<2706:49:47, 32.50s/it]training loss: 3.199e-02:   0%|          | 123/300001 [1:08:57<2676:41:14, 32.13s/it]training loss: 3.199e-02:   0%|          | 124/300001 [1:09:29<2689:37:21, 32.29s/it]training loss: 3.199e-02:   0%|          | 125/300001 [1:10:03<2733:46:08, 32.82s/it]training loss: 3.199e-02:   0%|          | 126/300001 [1:10:37<2756:07:29, 33.09s/it]training loss: 3.199e-02:   0%|          | 127/300001 [1:11:10<2766:46:29, 33.22s/it]training loss: 3.199e-02:   0%|          | 128/300001 [1:11:43<2751:56:55, 33.04s/it]training loss: 3.199e-02:   0%|          | 129/300001 [1:12:16<2750:30:32, 33.02s/it]training loss: 3.199e-02:   0%|          | 130/300001 [1:12:48<2734:33:45, 32.83s/it]training loss: 3.199e-02:   0%|          | 131/300001 [1:13:21<2724:46:21, 32.71s/it]training loss: 3.199e-02:   0%|          | 132/300001 [1:13:54<2727:06:58, 32.74s/it]training loss: 3.199e-02:   0%|          | 133/300001 [1:14:27<2745:17:49, 32.96s/it]training loss: 3.199e-02:   0%|          | 134/300001 [1:15:00<2747:19:53, 32.98s/it]training loss: 3.199e-02:   0%|          | 135/300001 [1:15:32<2727:37:01, 32.75s/it]training loss: 3.199e-02:   0%|          | 136/300001 [1:16:06<2740:27:22, 32.90s/it]training loss: 3.199e-02:   0%|          | 137/300001 [1:16:39<2740:54:42, 32.91s/it]training loss: 3.199e-02:   0%|          | 138/300001 [1:17:11<2735:56:51, 32.85s/it]training loss: 3.199e-02:   0%|          | 139/300001 [1:17:44<2745:17:04, 32.96s/it]training loss: 3.199e-02:   0%|          | 140/300001 [1:18:17<2739:32:10, 32.89s/it]training loss: 2.469e-02:   0%|          | 140/300001 [1:18:50<2739:32:10, 32.89s/it]training loss: 2.469e-02:   0%|          | 141/300001 [1:18:50<2726:08:18, 32.73s/it]training loss: 2.469e-02:   0%|          | 142/300001 [1:19:23<2742:35:57, 32.93s/it]training loss: 2.469e-02:   0%|          | 143/300001 [1:19:55<2730:34:20, 32.78s/it]training loss: 2.469e-02:   0%|          | 144/300001 [1:20:28<2737:45:47, 32.87s/it]training loss: 2.469e-02:   0%|          | 145/300001 [1:21:02<2743:37:28, 32.94s/it]training loss: 2.469e-02:   0%|          | 146/300001 [1:21:35<2744:42:20, 32.95s/it]training loss: 2.469e-02:   0%|          | 147/300001 [1:22:07<2729:32:02, 32.77s/it]training loss: 2.469e-02:   0%|          | 148/300001 [1:22:39<2718:38:01, 32.64s/it]training loss: 2.469e-02:   0%|          | 149/300001 [1:23:11<2695:53:11, 32.37s/it]training loss: 2.469e-02:   0%|          | 150/300001 [1:23:44<2715:21:50, 32.60s/it]training loss: 2.469e-02:   0%|          | 151/300001 [1:24:17<2717:41:04, 32.63s/it]training loss: 2.469e-02:   0%|          | 152/300001 [1:24:50<2721:59:47, 32.68s/it]training loss: 2.469e-02:   0%|          | 153/300001 [1:25:23<2740:22:04, 32.90s/it]training loss: 2.469e-02:   0%|          | 154/300001 [1:25:55<2719:39:54, 32.65s/it]training loss: 2.469e-02:   0%|          | 155/300001 [1:26:28<2725:20:47, 32.72s/it]training loss: 2.469e-02:   0%|          | 156/300001 [1:27:01<2732:18:22, 32.80s/it]training loss: 2.469e-02:   0%|          | 157/300001 [1:27:25<2518:12:09, 30.23s/it]training loss: 2.469e-02:   0%|          | 158/300001 [1:27:56<2542:30:22, 30.53s/it]training loss: 2.469e-02:   0%|          | 159/300001 [1:28:28<2564:14:38, 30.79s/it]training loss: 2.469e-02:   0%|          | 160/300001 [1:28:59<2584:23:53, 31.03s/it]training loss: 2.083e-02:   0%|          | 160/300001 [1:29:31<2584:23:53, 31.03s/it]training loss: 2.083e-02:   0%|          | 161/300001 [1:29:31<2597:33:40, 31.19s/it]training loss: 2.083e-02:   0%|          | 162/300001 [1:30:03<2621:20:25, 31.47s/it]training loss: 2.083e-02:   0%|          | 163/300001 [1:30:34<2605:49:26, 31.29s/it]training loss: 2.083e-02:   0%|          | 164/300001 [1:31:05<2608:25:17, 31.32s/it]training loss: 2.083e-02:   0%|          | 165/300001 [1:31:37<2621:34:00, 31.48s/it]training loss: 2.083e-02:   0%|          | 166/300001 [1:32:08<2614:02:09, 31.39s/it]training loss: 2.083e-02:   0%|          | 167/300001 [1:32:40<2622:17:36, 31.48s/it]training loss: 2.083e-02:   0%|          | 168/300001 [1:33:11<2598:24:36, 31.20s/it]training loss: 2.083e-02:   0%|          | 169/300001 [1:33:42<2600:09:10, 31.22s/it]training loss: 2.083e-02:   0%|          | 170/300001 [1:34:14<2616:49:55, 31.42s/it]training loss: 2.083e-02:   0%|          | 171/300001 [1:34:46<2642:35:18, 31.73s/it]training loss: 2.083e-02:   0%|          | 172/300001 [1:35:18<2632:05:24, 31.60s/it]training loss: 2.083e-02:   0%|          | 173/300001 [1:35:48<2613:02:02, 31.37s/it]training loss: 2.083e-02:   0%|          | 174/300001 [1:36:20<2617:30:01, 31.43s/it]training loss: 2.083e-02:   0%|          | 175/300001 [1:36:51<2602:53:25, 31.25s/it]training loss: 2.083e-02:   0%|          | 176/300001 [1:37:23<2638:18:49, 31.68s/it]training loss: 2.083e-02:   0%|          | 177/300001 [1:37:56<2656:34:34, 31.90s/it]training loss: 2.083e-02:   0%|          | 178/300001 [1:38:27<2644:11:31, 31.75s/it]training loss: 2.083e-02:   0%|          | 179/300001 [1:38:58<2623:24:27, 31.50s/it]training loss: 2.083e-02:   0%|          | 180/300001 [1:39:29<2609:47:31, 31.34s/it]training loss: 1.744e-02:   0%|          | 180/300001 [1:40:01<2609:47:31, 31.34s/it]training loss: 1.744e-02:   0%|          | 181/300001 [1:40:02<2636:32:25, 31.66s/it]training loss: 1.744e-02:   0%|          | 182/300001 [1:40:35<2688:44:42, 32.28s/it]training loss: 1.744e-02:   0%|          | 183/300001 [1:41:07<2679:13:26, 32.17s/it]training loss: 1.744e-02:   0%|          | 184/300001 [1:41:39<2658:54:37, 31.93s/it]training loss: 1.744e-02:   0%|          | 185/300001 [1:42:09<2634:08:43, 31.63s/it]training loss: 1.744e-02:   0%|          | 186/300001 [1:42:41<2630:49:35, 31.59s/it]training loss: 1.744e-02:   0%|          | 187/300001 [1:43:13<2639:22:26, 31.69s/it]training loss: 1.744e-02:   0%|          | 188/300001 [1:43:44<2631:35:31, 31.60s/it]training loss: 1.744e-02:   0%|          | 189/300001 [1:44:16<2636:31:08, 31.66s/it]training loss: 1.744e-02:   0%|          | 190/300001 [1:44:48<2638:30:15, 31.68s/it]training loss: 1.744e-02:   0%|          | 191/300001 [1:45:19<2633:41:22, 31.62s/it]training loss: 1.744e-02:   0%|          | 192/300001 [1:45:49<2597:15:51, 31.19s/it]training loss: 1.744e-02:   0%|          | 193/300001 [1:46:22<2620:41:53, 31.47s/it]training loss: 1.744e-02:   0%|          | 194/300001 [1:46:53<2620:55:42, 31.47s/it]training loss: 1.744e-02:   0%|          | 195/300001 [1:47:26<2662:25:36, 31.97s/it]training loss: 1.744e-02:   0%|          | 196/300001 [1:47:58<2655:49:36, 31.89s/it]training loss: 1.744e-02:   0%|          | 197/300001 [1:48:29<2638:37:46, 31.68s/it]training loss: 1.744e-02:   0%|          | 198/300001 [1:49:00<2626:25:16, 31.54s/it]training loss: 1.744e-02:   0%|          | 199/300001 [1:49:32<2618:55:53, 31.45s/it]training loss: 1.744e-02:   0%|          | 200/300001 [1:50:03<2621:28:14, 31.48s/it]training loss: 2.077e-02:   0%|          | 200/300001 [1:50:35<2621:28:14, 31.48s/it]training loss: 2.077e-02:   0%|          | 201/300001 [1:50:35<2624:44:21, 31.52s/it]training loss: 2.077e-02:   0%|          | 202/300001 [1:51:06<2617:36:56, 31.43s/it]training loss: 2.077e-02:   0%|          | 203/300001 [1:51:37<2608:02:36, 31.32s/it]training loss: 2.077e-02:   0%|          | 204/300001 [1:52:09<2621:29:14, 31.48s/it]training loss: 2.077e-02:   0%|          | 205/300001 [1:52:41<2640:35:16, 31.71s/it]training loss: 2.077e-02:   0%|          | 206/300001 [1:53:12<2619:31:04, 31.46s/it]training loss: 2.077e-02:   0%|          | 207/300001 [1:53:43<2597:37:43, 31.19s/it]training loss: 2.077e-02:   0%|          | 208/300001 [1:54:14<2614:22:44, 31.39s/it]training loss: 2.077e-02:   0%|          | 209/300001 [1:54:46<2630:58:20, 31.59s/it]training loss: 2.077e-02:   0%|          | 210/300001 [1:55:18<2619:11:53, 31.45s/it]training loss: 2.077e-02:   0%|          | 211/300001 [1:55:49<2612:41:21, 31.37s/it]training loss: 2.077e-02:   0%|          | 212/300001 [1:56:20<2617:17:09, 31.43s/it]training loss: 2.077e-02:   0%|          | 213/300001 [1:56:52<2621:39:53, 31.48s/it]training loss: 2.077e-02:   0%|          | 214/300001 [1:57:24<2623:37:43, 31.51s/it]training loss: 2.077e-02:   0%|          | 215/300001 [1:57:54<2605:23:18, 31.29s/it]training loss: 2.077e-02:   0%|          | 216/300001 [1:58:26<2623:50:56, 31.51s/it]training loss: 2.077e-02:   0%|          | 217/300001 [1:58:58<2637:12:36, 31.67s/it]training loss: 2.077e-02:   0%|          | 218/300001 [1:59:29<2606:26:29, 31.30s/it]training loss: 2.077e-02:   0%|          | 219/300001 [2:00:01<2620:02:26, 31.46s/it]training loss: 2.077e-02:   0%|          | 220/300001 [2:00:32<2618:42:54, 31.45s/it]training loss: 1.572e-02:   0%|          | 220/300001 [2:01:04<2618:42:54, 31.45s/it]training loss: 1.572e-02:   0%|          | 221/300001 [2:01:04<2632:29:36, 31.61s/it]training loss: 1.572e-02:   0%|          | 222/300001 [2:01:35<2618:02:28, 31.44s/it]training loss: 1.572e-02:   0%|          | 223/300001 [2:02:06<2597:27:32, 31.19s/it]training loss: 1.572e-02:   0%|          | 224/300001 [2:02:38<2627:29:00, 31.55s/it]training loss: 1.572e-02:   0%|          | 225/300001 [2:03:09<2617:18:03, 31.43s/it]training loss: 1.572e-02:   0%|          | 226/300001 [2:03:41<2627:37:00, 31.56s/it]training loss: 1.572e-02:   0%|          | 227/300001 [2:04:14<2649:48:44, 31.82s/it]training loss: 1.572e-02:   0%|          | 228/300001 [2:04:46<2673:02:20, 32.10s/it]training loss: 1.572e-02:   0%|          | 229/300001 [2:05:17<2650:46:04, 31.83s/it]training loss: 1.572e-02:   0%|          | 230/300001 [2:05:48<2627:12:49, 31.55s/it]training loss: 1.572e-02:   0%|          | 231/300001 [2:06:19<2603:12:29, 31.26s/it]training loss: 1.572e-02:   0%|          | 232/300001 [2:06:50<2607:02:36, 31.31s/it]training loss: 1.572e-02:   0%|          | 233/300001 [2:07:22<2609:26:52, 31.34s/it]training loss: 1.572e-02:   0%|          | 234/300001 [2:07:54<2624:59:40, 31.52s/it]training loss: 1.572e-02:   0%|          | 235/300001 [2:08:26<2646:47:54, 31.79s/it]training loss: 1.572e-02:   0%|          | 236/300001 [2:08:57<2626:48:56, 31.55s/it]training loss: 1.572e-02:   0%|          | 237/300001 [2:09:29<2626:41:25, 31.55s/it]training loss: 1.572e-02:   0%|          | 238/300001 [2:10:00<2625:52:19, 31.54s/it]training loss: 1.572e-02:   0%|          | 239/300001 [2:10:31<2609:31:30, 31.34s/it]training loss: 1.572e-02:   0%|          | 240/300001 [2:11:03<2620:29:29, 31.47s/it]training loss: 1.589e-02:   0%|          | 240/300001 [2:11:35<2620:29:29, 31.47s/it]training loss: 1.589e-02:   0%|          | 241/300001 [2:11:35<2632:16:29, 31.61s/it]training loss: 1.589e-02:   0%|          | 242/300001 [2:12:07<2648:57:55, 31.81s/it]training loss: 1.589e-02:   0%|          | 243/300001 [2:12:39<2649:28:13, 31.82s/it]training loss: 1.589e-02:   0%|          | 244/300001 [2:13:11<2644:32:46, 31.76s/it]training loss: 1.589e-02:   0%|          | 245/300001 [2:13:42<2636:12:46, 31.66s/it]training loss: 1.589e-02:   0%|          | 246/300001 [2:14:14<2655:27:02, 31.89s/it]training loss: 1.589e-02:   0%|          | 247/300001 [2:14:47<2673:50:51, 32.11s/it]training loss: 1.589e-02:   0%|          | 248/300001 [2:15:19<2662:07:03, 31.97s/it]training loss: 1.589e-02:   0%|          | 249/300001 [2:15:50<2655:00:17, 31.89s/it]training loss: 1.589e-02:   0%|          | 250/300001 [2:16:23<2669:55:36, 32.07s/it]training loss: 1.589e-02:   0%|          | 251/300001 [2:16:55<2668:08:27, 32.04s/it]training loss: 1.589e-02:   0%|          | 252/300001 [2:17:27<2667:17:37, 32.03s/it]training loss: 1.589e-02:   0%|          | 253/300001 [2:17:59<2675:40:29, 32.14s/it]training loss: 1.589e-02:   0%|          | 254/300001 [2:18:31<2667:40:32, 32.04s/it]training loss: 1.589e-02:   0%|          | 255/300001 [2:19:02<2647:47:57, 31.80s/it]training loss: 1.589e-02:   0%|          | 256/300001 [2:19:34<2653:25:35, 31.87s/it]training loss: 1.589e-02:   0%|          | 257/300001 [2:20:07<2665:31:58, 32.01s/it]training loss: 1.589e-02:   0%|          | 258/300001 [2:20:38<2652:06:05, 31.85s/it]training loss: 1.589e-02:   0%|          | 259/300001 [2:21:10<2642:04:41, 31.73s/it]training loss: 1.589e-02:   0%|          | 260/300001 [2:21:42<2647:55:38, 31.80s/it]training loss: 1.375e-02:   0%|          | 260/300001 [2:22:13<2647:55:38, 31.80s/it]training loss: 1.375e-02:   0%|          | 261/300001 [2:22:13<2632:52:27, 31.62s/it]training loss: 1.375e-02:   0%|          | 262/300001 [2:22:45<2641:30:18, 31.73s/it]training loss: 1.375e-02:   0%|          | 263/300001 [2:23:16<2641:21:03, 31.72s/it]training loss: 1.375e-02:   0%|          | 264/300001 [2:23:48<2642:42:13, 31.74s/it]training loss: 1.375e-02:   0%|          | 265/300001 [2:24:20<2654:45:01, 31.89s/it]training loss: 1.375e-02:   0%|          | 266/300001 [2:24:53<2673:21:23, 32.11s/it]training loss: 1.375e-02:   0%|          | 267/300001 [2:25:25<2670:21:49, 32.07s/it]training loss: 1.375e-02:   0%|          | 268/300001 [2:25:56<2641:35:59, 31.73s/it]training loss: 1.375e-02:   0%|          | 269/300001 [2:26:28<2640:26:32, 31.71s/it]training loss: 1.375e-02:   0%|          | 270/300001 [2:26:59<2634:58:30, 31.65s/it]training loss: 1.375e-02:   0%|          | 271/300001 [2:27:31<2633:37:24, 31.63s/it]training loss: 1.375e-02:   0%|          | 272/300001 [2:28:03<2658:09:58, 31.93s/it]training loss: 1.375e-02:   0%|          | 273/300001 [2:28:35<2659:31:39, 31.94s/it]training loss: 1.375e-02:   0%|          | 274/300001 [2:29:08<2670:21:28, 32.07s/it]training loss: 1.375e-02:   0%|          | 275/300001 [2:29:40<2666:41:33, 32.03s/it]training loss: 1.375e-02:   0%|          | 276/300001 [2:30:12<2681:25:12, 32.21s/it]training loss: 1.375e-02:   0%|          | 277/300001 [2:30:44<2671:52:40, 32.09s/it]training loss: 1.375e-02:   0%|          | 278/300001 [2:31:15<2650:35:39, 31.84s/it]training loss: 1.375e-02:   0%|          | 279/300001 [2:31:48<2680:28:20, 32.20s/it]training loss: 1.375e-02:   0%|          | 280/300001 [2:32:21<2703:19:10, 32.47s/it]training loss: 1.149e-02:   0%|          | 280/300001 [2:32:53<2703:19:10, 32.47s/it]training loss: 1.149e-02:   0%|          | 281/300001 [2:32:53<2690:07:23, 32.31s/it]training loss: 1.149e-02:   0%|          | 282/300001 [2:33:25<2667:55:33, 32.05s/it]training loss: 1.149e-02:   0%|          | 283/300001 [2:33:56<2646:01:01, 31.78s/it]training loss: 1.149e-02:   0%|          | 284/300001 [2:34:26<2609:03:23, 31.34s/it]training loss: 1.149e-02:   0%|          | 285/300001 [2:34:58<2617:48:41, 31.44s/it]training loss: 1.149e-02:   0%|          | 286/300001 [2:35:29<2603:26:29, 31.27s/it]training loss: 1.149e-02:   0%|          | 287/300001 [2:36:00<2608:59:45, 31.34s/it]training loss: 1.149e-02:   0%|          | 288/300001 [2:36:32<2605:18:00, 31.29s/it]training loss: 1.149e-02:   0%|          | 289/300001 [2:37:03<2620:32:44, 31.48s/it]training loss: 1.149e-02:   0%|          | 290/300001 [2:37:35<2627:04:10, 31.56s/it]training loss: 1.149e-02:   0%|          | 291/300001 [2:38:07<2629:20:08, 31.58s/it]training loss: 1.149e-02:   0%|          | 292/300001 [2:38:39<2633:47:45, 31.64s/it]training loss: 1.149e-02:   0%|          | 293/300001 [2:39:10<2633:43:40, 31.64s/it]training loss: 1.149e-02:   0%|          | 294/300001 [2:39:42<2627:09:15, 31.56s/it]training loss: 1.149e-02:   0%|          | 295/300001 [2:40:13<2627:54:03, 31.57s/it]training loss: 1.149e-02:   0%|          | 296/300001 [2:40:44<2607:16:25, 31.32s/it]training loss: 1.149e-02:   0%|          | 297/300001 [2:41:15<2603:43:42, 31.28s/it]training loss: 1.149e-02:   0%|          | 298/300001 [2:41:45<2576:28:34, 30.95s/it]training loss: 1.149e-02:   0%|          | 299/300001 [2:42:16<2570:26:54, 30.88s/it]training loss: 1.149e-02:   0%|          | 300/300001 [2:42:48<2602:51:40, 31.27s/it]training loss: 1.128e-02:   0%|          | 300/300001 [2:43:19<2602:51:40, 31.27s/it]training loss: 1.128e-02:   0%|          | 301/300001 [2:43:19<2602:15:27, 31.26s/it]training loss: 1.128e-02:   0%|          | 302/300001 [2:43:50<2593:20:13, 31.15s/it]training loss: 1.128e-02:   0%|          | 303/300001 [2:44:23<2626:57:42, 31.56s/it]training loss: 1.128e-02:   0%|          | 304/300001 [2:44:55<2645:43:58, 31.78s/it]training loss: 1.128e-02:   0%|          | 305/300001 [2:45:27<2643:28:40, 31.75s/it]training loss: 1.128e-02:   0%|          | 306/300001 [2:45:59<2644:00:35, 31.76s/it]training loss: 1.128e-02:   0%|          | 307/300001 [2:46:31<2657:03:02, 31.92s/it]training loss: 1.128e-02:   0%|          | 308/300001 [2:47:02<2628:52:47, 31.58s/it]training loss: 1.128e-02:   0%|          | 309/300001 [2:47:35<2662:25:24, 31.98s/it]training loss: 1.128e-02:   0%|          | 310/300001 [2:48:06<2651:33:06, 31.85s/it]training loss: 1.128e-02:   0%|          | 311/300001 [2:48:37<2635:23:32, 31.66s/it]training loss: 1.128e-02:   0%|          | 312/300001 [2:49:09<2640:31:22, 31.72s/it]training loss: 1.128e-02:   0%|          | 313/300001 [2:49:40<2627:34:18, 31.56s/it]training loss: 1.128e-02:   0%|          | 314/300001 [2:50:03<2398:39:51, 28.81s/it]training loss: 1.128e-02:   0%|          | 315/300001 [2:50:34<2468:07:51, 29.65s/it]training loss: 1.128e-02:   0%|          | 316/300001 [2:51:06<2517:48:59, 30.25s/it]training loss: 1.128e-02:   0%|          | 317/300001 [2:51:37<2545:41:45, 30.58s/it]training loss: 1.128e-02:   0%|          | 318/300001 [2:52:09<2568:12:26, 30.85s/it]training loss: 1.128e-02:   0%|          | 319/300001 [2:52:40<2575:20:37, 30.94s/it]training loss: 1.128e-02:   0%|          | 320/300001 [2:53:12<2596:03:41, 31.19s/it]training loss: 1.060e-02:   0%|          | 320/300001 [2:53:43<2596:03:41, 31.19s/it]training loss: 1.060e-02:   0%|          | 321/300001 [2:53:43<2604:37:02, 31.29s/it]training loss: 1.060e-02:   0%|          | 322/300001 [2:54:15<2613:45:45, 31.40s/it]training loss: 1.060e-02:   0%|          | 323/300001 [2:54:46<2609:31:20, 31.35s/it]training loss: 1.060e-02:   0%|          | 324/300001 [2:55:18<2618:23:58, 31.45s/it]training loss: 1.060e-02:   0%|          | 325/300001 [2:55:50<2625:24:31, 31.54s/it]training loss: 1.060e-02:   0%|          | 326/300001 [2:56:21<2629:27:06, 31.59s/it]training loss: 1.060e-02:   0%|          | 327/300001 [2:56:54<2645:51:26, 31.78s/it]training loss: 1.060e-02:   0%|          | 328/300001 [2:57:25<2625:17:45, 31.54s/it]training loss: 1.060e-02:   0%|          | 329/300001 [2:57:56<2618:01:59, 31.45s/it]training loss: 1.060e-02:   0%|          | 330/300001 [2:58:28<2636:50:20, 31.68s/it]training loss: 1.060e-02:   0%|          | 331/300001 [2:59:00<2636:21:37, 31.67s/it]training loss: 1.060e-02:   0%|          | 332/300001 [2:59:31<2628:48:38, 31.58s/it]training loss: 1.060e-02:   0%|          | 333/300001 [3:00:03<2637:07:50, 31.68s/it]training loss: 1.060e-02:   0%|          | 334/300001 [3:00:34<2619:34:21, 31.47s/it]training loss: 1.060e-02:   0%|          | 335/300001 [3:01:05<2602:47:06, 31.27s/it]training loss: 1.060e-02:   0%|          | 336/300001 [3:01:36<2614:47:32, 31.41s/it]training loss: 1.060e-02:   0%|          | 337/300001 [3:02:08<2622:46:13, 31.51s/it]training loss: 1.060e-02:   0%|          | 338/300001 [3:02:39<2603:33:51, 31.28s/it]training loss: 1.060e-02:   0%|          | 339/300001 [3:03:11<2617:42:46, 31.45s/it]training loss: 1.060e-02:   0%|          | 340/300001 [3:03:43<2630:30:56, 31.60s/it]training loss: 1.229e-02:   0%|          | 340/300001 [3:04:15<2630:30:56, 31.60s/it]training loss: 1.229e-02:   0%|          | 341/300001 [3:04:15<2646:17:32, 31.79s/it]training loss: 1.229e-02:   0%|          | 342/300001 [3:04:47<2648:06:37, 31.81s/it]training loss: 1.229e-02:   0%|          | 343/300001 [3:05:18<2643:09:13, 31.75s/it]training loss: 1.229e-02:   0%|          | 344/300001 [3:05:50<2631:19:15, 31.61s/it]training loss: 1.229e-02:   0%|          | 345/300001 [3:06:21<2620:09:40, 31.48s/it]training loss: 1.229e-02:   0%|          | 346/300001 [3:06:53<2627:42:54, 31.57s/it]training loss: 1.229e-02:   0%|          | 347/300001 [3:07:23<2608:19:13, 31.34s/it]training loss: 1.229e-02:   0%|          | 348/300001 [3:07:54<2597:00:01, 31.20s/it]training loss: 1.229e-02:   0%|          | 349/300001 [3:08:27<2636:16:25, 31.67s/it]training loss: 1.229e-02:   0%|          | 350/300001 [3:08:59<2628:52:43, 31.58s/it]training loss: 1.229e-02:   0%|          | 351/300001 [3:09:30<2617:49:00, 31.45s/it]training loss: 1.229e-02:   0%|          | 352/300001 [3:10:02<2646:12:33, 31.79s/it]training loss: 1.229e-02:   0%|          | 353/300001 [3:10:33<2622:07:09, 31.50s/it]training loss: 1.229e-02:   0%|          | 354/300001 [3:11:03<2588:45:23, 31.10s/it]training loss: 1.229e-02:   0%|          | 355/300001 [3:11:34<2589:26:20, 31.11s/it]training loss: 1.229e-02:   0%|          | 356/300001 [3:12:06<2607:24:35, 31.33s/it]training loss: 1.229e-02:   0%|          | 357/300001 [3:12:38<2627:50:12, 31.57s/it]training loss: 1.229e-02:   0%|          | 358/300001 [3:13:10<2637:23:15, 31.69s/it]training loss: 1.229e-02:   0%|          | 359/300001 [3:13:41<2614:21:44, 31.41s/it]training loss: 1.229e-02:   0%|          | 360/300001 [3:14:12<2602:44:04, 31.27s/it]training loss: 1.166e-02:   0%|          | 360/300001 [3:14:44<2602:44:04, 31.27s/it]training loss: 1.166e-02:   0%|          | 361/300001 [3:14:44<2627:39:00, 31.57s/it]training loss: 1.166e-02:   0%|          | 362/300001 [3:15:16<2623:30:40, 31.52s/it]training loss: 1.166e-02:   0%|          | 363/300001 [3:15:47<2610:24:46, 31.36s/it]training loss: 1.166e-02:   0%|          | 364/300001 [3:16:19<2627:24:10, 31.57s/it]training loss: 1.166e-02:   0%|          | 365/300001 [3:16:51<2638:20:18, 31.70s/it]training loss: 1.166e-02:   0%|          | 366/300001 [3:17:22<2639:38:42, 31.71s/it]training loss: 1.166e-02:   0%|          | 367/300001 [3:17:54<2647:29:44, 31.81s/it]training loss: 1.166e-02:   0%|          | 368/300001 [3:18:27<2662:05:48, 31.98s/it]training loss: 1.166e-02:   0%|          | 369/300001 [3:18:59<2660:48:33, 31.97s/it]training loss: 1.166e-02:   0%|          | 370/300001 [3:19:31<2667:53:46, 32.05s/it]training loss: 1.166e-02:   0%|          | 371/300001 [3:20:04<2693:12:24, 32.36s/it]training loss: 1.166e-02:   0%|          | 372/300001 [3:20:36<2678:24:30, 32.18s/it]training loss: 1.166e-02:   0%|          | 373/300001 [3:21:07<2658:49:33, 31.95s/it]training loss: 1.166e-02:   0%|          | 374/300001 [3:21:39<2643:26:44, 31.76s/it]training loss: 1.166e-02:   0%|          | 375/300001 [3:22:10<2640:17:00, 31.72s/it]training loss: 1.166e-02:   0%|          | 376/300001 [3:22:41<2616:54:51, 31.44s/it]training loss: 1.166e-02:   0%|          | 377/300001 [3:23:13<2624:08:29, 31.53s/it]training loss: 1.166e-02:   0%|          | 378/300001 [3:23:45<2646:52:12, 31.80s/it]training loss: 1.166e-02:   0%|          | 379/300001 [3:24:17<2639:29:01, 31.71s/it]training loss: 1.166e-02:   0%|          | 380/300001 [3:24:49<2640:51:47, 31.73s/it]training loss: 1.080e-02:   0%|          | 380/300001 [3:25:20<2640:51:47, 31.73s/it]training loss: 1.080e-02:   0%|          | 381/300001 [3:25:21<2648:12:14, 31.82s/it]training loss: 1.080e-02:   0%|          | 382/300001 [3:25:52<2644:25:12, 31.77s/it]training loss: 1.080e-02:   0%|          | 383/300001 [3:26:24<2657:13:09, 31.93s/it]training loss: 1.080e-02:   0%|          | 384/300001 [3:26:55<2619:34:10, 31.48s/it]training loss: 1.080e-02:   0%|          | 385/300001 [3:27:26<2615:54:52, 31.43s/it]training loss: 1.080e-02:   0%|          | 386/300001 [3:27:59<2658:46:32, 31.95s/it]training loss: 1.080e-02:   0%|          | 387/300001 [3:28:31<2661:47:34, 31.98s/it]training loss: 1.080e-02:   0%|          | 388/300001 [3:29:03<2653:25:54, 31.88s/it]training loss: 1.080e-02:   0%|          | 389/300001 [3:29:35<2659:17:27, 31.95s/it]training loss: 1.080e-02:   0%|          | 390/300001 [3:30:06<2628:16:23, 31.58s/it]training loss: 1.080e-02:   0%|          | 391/300001 [3:30:38<2632:12:29, 31.63s/it]training loss: 1.080e-02:   0%|          | 392/300001 [3:31:09<2630:25:10, 31.61s/it]training loss: 1.080e-02:   0%|          | 393/300001 [3:31:40<2621:15:07, 31.50s/it]training loss: 1.080e-02:   0%|          | 394/300001 [3:32:13<2637:48:13, 31.70s/it]training loss: 1.080e-02:   0%|          | 395/300001 [3:32:44<2640:45:03, 31.73s/it]training loss: 1.080e-02:   0%|          | 396/300001 [3:33:17<2658:06:04, 31.94s/it]training loss: 1.080e-02:   0%|          | 397/300001 [3:33:48<2644:03:46, 31.77s/it]training loss: 1.080e-02:   0%|          | 398/300001 [3:34:20<2645:57:55, 31.79s/it]training loss: 1.080e-02:   0%|          | 399/300001 [3:34:51<2626:01:00, 31.55s/it]training loss: 1.080e-02:   0%|          | 400/300001 [3:35:23<2644:36:53, 31.78s/it]training loss: 9.901e-03:   0%|          | 400/300001 [3:35:54<2644:36:53, 31.78s/it]training loss: 9.901e-03:   0%|          | 401/300001 [3:35:54<2625:21:52, 31.55s/it]training loss: 9.901e-03:   0%|          | 402/300001 [3:36:26<2620:45:03, 31.49s/it]training loss: 9.901e-03:   0%|          | 403/300001 [3:36:57<2613:49:42, 31.41s/it]training loss: 9.901e-03:   0%|          | 404/300001 [3:37:28<2603:14:33, 31.28s/it]training loss: 9.901e-03:   0%|          | 405/300001 [3:38:00<2619:10:37, 31.47s/it]training loss: 9.901e-03:   0%|          | 406/300001 [3:38:31<2616:41:40, 31.44s/it]training loss: 9.901e-03:   0%|          | 407/300001 [3:39:03<2618:50:30, 31.47s/it]training loss: 9.901e-03:   0%|          | 408/300001 [3:39:35<2625:47:31, 31.55s/it]training loss: 9.901e-03:   0%|          | 409/300001 [3:40:06<2614:38:57, 31.42s/it]training loss: 9.901e-03:   0%|          | 410/300001 [3:40:38<2648:52:45, 31.83s/it]training loss: 9.901e-03:   0%|          | 411/300001 [3:41:11<2663:32:51, 32.01s/it]training loss: 9.901e-03:   0%|          | 412/300001 [3:41:41<2629:02:34, 31.59s/it]training loss: 9.901e-03:   0%|          | 413/300001 [3:42:14<2656:33:01, 31.92s/it]training loss: 9.901e-03:   0%|          | 414/300001 [3:42:46<2644:53:48, 31.78s/it]training loss: 9.901e-03:   0%|          | 415/300001 [3:43:16<2613:26:27, 31.40s/it]training loss: 9.901e-03:   0%|          | 416/300001 [3:43:47<2612:32:32, 31.39s/it]training loss: 9.901e-03:   0%|          | 417/300001 [3:44:20<2652:01:56, 31.87s/it]training loss: 9.901e-03:   0%|          | 418/300001 [3:44:51<2627:37:14, 31.58s/it]training loss: 9.901e-03:   0%|          | 419/300001 [3:45:23<2632:40:17, 31.64s/it]training loss: 9.901e-03:   0%|          | 420/300001 [3:45:55<2645:35:34, 31.79s/it]training loss: 8.819e-03:   0%|          | 420/300001 [3:46:27<2645:35:34, 31.79s/it]training loss: 8.819e-03:   0%|          | 421/300001 [3:46:28<2657:59:06, 31.94s/it]training loss: 8.819e-03:   0%|          | 422/300001 [3:47:00<2659:30:38, 31.96s/it]training loss: 8.819e-03:   0%|          | 423/300001 [3:47:32<2661:04:04, 31.98s/it]training loss: 8.819e-03:   0%|          | 424/300001 [3:48:04<2664:11:40, 32.02s/it]training loss: 8.819e-03:   0%|          | 425/300001 [3:48:35<2650:14:57, 31.85s/it]training loss: 8.819e-03:   0%|          | 426/300001 [3:49:06<2635:46:23, 31.67s/it]training loss: 8.819e-03:   0%|          | 427/300001 [3:49:39<2648:29:17, 31.83s/it]training loss: 8.819e-03:   0%|          | 428/300001 [3:50:12<2689:57:38, 32.33s/it]training loss: 8.819e-03:   0%|          | 429/300001 [3:50:44<2676:38:13, 32.17s/it]training loss: 8.819e-03:   0%|          | 430/300001 [3:51:16<2679:09:47, 32.20s/it]training loss: 8.819e-03:   0%|          | 431/300001 [3:51:48<2659:51:20, 31.96s/it]training loss: 8.819e-03:   0%|          | 432/300001 [3:52:19<2639:37:20, 31.72s/it]training loss: 8.819e-03:   0%|          | 433/300001 [3:52:50<2629:53:27, 31.60s/it]training loss: 8.819e-03:   0%|          | 434/300001 [3:53:21<2622:49:32, 31.52s/it]training loss: 8.819e-03:   0%|          | 435/300001 [3:53:52<2606:42:59, 31.33s/it]training loss: 8.819e-03:   0%|          | 436/300001 [3:54:23<2598:43:32, 31.23s/it]training loss: 8.819e-03:   0%|          | 437/300001 [3:54:56<2625:41:33, 31.55s/it]training loss: 8.819e-03:   0%|          | 438/300001 [3:55:28<2655:36:39, 31.91s/it]training loss: 8.819e-03:   0%|          | 439/300001 [3:56:00<2639:48:02, 31.72s/it]training loss: 8.819e-03:   0%|          | 440/300001 [3:56:32<2651:10:28, 31.86s/it]training loss: 8.693e-03:   0%|          | 440/300001 [3:57:04<2651:10:28, 31.86s/it]training loss: 8.693e-03:   0%|          | 441/300001 [3:57:04<2671:31:53, 32.11s/it]training loss: 8.693e-03:   0%|          | 442/300001 [3:57:36<2647:39:08, 31.82s/it]training loss: 8.693e-03:   0%|          | 443/300001 [3:58:08<2672:47:12, 32.12s/it]training loss: 8.693e-03:   0%|          | 444/300001 [3:58:40<2648:43:58, 31.83s/it]training loss: 8.693e-03:   0%|          | 445/300001 [3:59:10<2614:33:33, 31.42s/it]training loss: 8.693e-03:   0%|          | 446/300001 [3:59:42<2621:45:14, 31.51s/it]training loss: 8.693e-03:   0%|          | 447/300001 [4:00:13<2608:48:42, 31.35s/it]training loss: 8.693e-03:   0%|          | 448/300001 [4:00:45<2635:29:32, 31.67s/it]training loss: 8.693e-03:   0%|          | 449/300001 [4:01:17<2629:26:54, 31.60s/it]training loss: 8.693e-03:   0%|          | 450/300001 [4:01:48<2621:43:19, 31.51s/it]training loss: 8.693e-03:   0%|          | 451/300001 [4:02:21<2651:05:17, 31.86s/it]training loss: 8.693e-03:   0%|          | 452/300001 [4:02:54<2683:15:20, 32.25s/it]training loss: 8.693e-03:   0%|          | 453/300001 [4:03:26<2674:18:03, 32.14s/it]training loss: 8.693e-03:   0%|          | 454/300001 [4:03:58<2678:33:01, 32.19s/it]training loss: 8.693e-03:   0%|          | 455/300001 [4:04:31<2689:04:50, 32.32s/it]training loss: 8.693e-03:   0%|          | 456/300001 [4:05:02<2678:29:12, 32.19s/it]training loss: 8.693e-03:   0%|          | 457/300001 [4:05:34<2656:26:55, 31.93s/it]training loss: 8.693e-03:   0%|          | 458/300001 [4:06:05<2647:46:18, 31.82s/it]training loss: 8.693e-03:   0%|          | 459/300001 [4:06:36<2618:31:25, 31.47s/it]training loss: 8.693e-03:   0%|          | 460/300001 [4:07:07<2614:32:58, 31.42s/it]training loss: 9.485e-03:   0%|          | 460/300001 [4:07:40<2614:32:58, 31.42s/it]training loss: 9.485e-03:   0%|          | 461/300001 [4:07:40<2639:51:50, 31.73s/it]training loss: 9.485e-03:   0%|          | 462/300001 [4:08:10<2610:14:01, 31.37s/it]training loss: 9.485e-03:   0%|          | 463/300001 [4:08:42<2630:26:38, 31.61s/it]training loss: 9.485e-03:   0%|          | 464/300001 [4:09:15<2657:15:55, 31.94s/it]training loss: 9.485e-03:   0%|          | 465/300001 [4:09:47<2663:45:15, 32.01s/it]training loss: 9.485e-03:   0%|          | 466/300001 [4:10:19<2657:23:12, 31.94s/it]training loss: 9.485e-03:   0%|          | 467/300001 [4:10:50<2634:25:54, 31.66s/it]training loss: 9.485e-03:   0%|          | 468/300001 [4:11:21<2622:15:14, 31.52s/it]training loss: 9.485e-03:   0%|          | 469/300001 [4:11:53<2616:39:13, 31.45s/it]training loss: 9.485e-03:   0%|          | 470/300001 [4:12:24<2621:17:21, 31.50s/it]training loss: 9.485e-03:   0%|          | 471/300001 [4:12:47<2402:34:25, 28.88s/it]training loss: 9.485e-03:   0%|          | 472/300001 [4:13:20<2506:10:44, 30.12s/it]training loss: 9.485e-03:   0%|          | 473/300001 [4:13:52<2547:22:12, 30.62s/it]training loss: 9.485e-03:   0%|          | 474/300001 [4:14:23<2562:45:14, 30.80s/it]training loss: 9.485e-03:   0%|          | 475/300001 [4:14:54<2577:16:09, 30.98s/it]training loss: 9.485e-03:   0%|          | 476/300001 [4:15:26<2595:49:53, 31.20s/it]training loss: 9.485e-03:   0%|          | 477/300001 [4:15:57<2596:43:04, 31.21s/it]training loss: 9.485e-03:   0%|          | 478/300001 [4:16:30<2627:40:15, 31.58s/it]training loss: 9.485e-03:   0%|          | 479/300001 [4:17:03<2666:05:34, 32.04s/it]training loss: 9.485e-03:   0%|          | 480/300001 [4:17:35<2673:34:27, 32.13s/it]training loss: 8.607e-03:   0%|          | 480/300001 [4:18:07<2673:34:27, 32.13s/it]training loss: 8.607e-03:   0%|          | 481/300001 [4:18:07<2655:44:45, 31.92s/it]training loss: 8.607e-03:   0%|          | 482/300001 [4:18:39<2659:02:43, 31.96s/it]training loss: 8.607e-03:   0%|          | 483/300001 [4:19:11<2662:34:28, 32.00s/it]training loss: 8.607e-03:   0%|          | 484/300001 [4:19:43<2668:29:35, 32.07s/it]training loss: 8.607e-03:   0%|          | 485/300001 [4:20:16<2678:00:48, 32.19s/it]training loss: 8.607e-03:   0%|          | 486/300001 [4:20:47<2661:21:10, 31.99s/it]training loss: 8.607e-03:   0%|          | 487/300001 [4:21:19<2650:17:24, 31.86s/it]training loss: 8.607e-03:   0%|          | 488/300001 [4:21:50<2633:13:01, 31.65s/it]training loss: 8.607e-03:   0%|          | 489/300001 [4:22:20<2592:06:17, 31.16s/it]training loss: 8.607e-03:   0%|          | 490/300001 [4:22:52<2627:56:14, 31.59s/it]training loss: 8.607e-03:   0%|          | 491/300001 [4:23:24<2629:46:22, 31.61s/it]training loss: 8.607e-03:   0%|          | 492/300001 [4:23:54<2593:00:04, 31.17s/it]training loss: 8.607e-03:   0%|          | 493/300001 [4:24:25<2588:52:00, 31.12s/it]training loss: 8.607e-03:   0%|          | 494/300001 [4:24:56<2574:23:31, 30.94s/it]training loss: 8.607e-03:   0%|          | 495/300001 [4:25:27<2591:39:51, 31.15s/it]training loss: 8.607e-03:   0%|          | 496/300001 [4:26:00<2620:56:45, 31.50s/it]training loss: 8.607e-03:   0%|          | 497/300001 [4:26:31<2607:34:33, 31.34s/it]training loss: 8.607e-03:   0%|          | 498/300001 [4:27:03<2629:20:16, 31.60s/it]training loss: 8.607e-03:   0%|          | 499/300001 [4:27:34<2609:49:51, 31.37s/it]training loss: 8.607e-03:   0%|          | 500/300001 [4:28:05<2619:05:33, 31.48s/it]training loss: 8.172e-03:   0%|          | 500/300001 [4:28:36<2619:05:33, 31.48s/it]training loss: 8.172e-03:   0%|          | 501/300001 [4:28:39<2678:42:22, 32.20s/it]training loss: 8.172e-03:   0%|          | 502/300001 [4:29:10<2652:14:44, 31.88s/it]training loss: 8.172e-03:   0%|          | 503/300001 [4:29:42<2635:11:50, 31.68s/it]training loss: 8.172e-03:   0%|          | 504/300001 [4:30:14<2659:26:49, 31.97s/it]training loss: 8.172e-03:   0%|          | 505/300001 [4:30:45<2633:36:45, 31.66s/it]training loss: 8.172e-03:   0%|          | 506/300001 [4:31:17<2628:01:26, 31.59s/it]training loss: 8.172e-03:   0%|          | 507/300001 [4:31:48<2618:31:41, 31.48s/it]training loss: 8.172e-03:   0%|          | 508/300001 [4:32:19<2620:46:35, 31.50s/it]training loss: 8.172e-03:   0%|          | 509/300001 [4:32:52<2645:40:29, 31.80s/it]training loss: 8.172e-03:   0%|          | 510/300001 [4:33:23<2618:04:04, 31.47s/it]training loss: 8.172e-03:   0%|          | 511/300001 [4:33:54<2618:25:16, 31.47s/it]training loss: 8.172e-03:   0%|          | 512/300001 [4:34:26<2635:37:35, 31.68s/it]training loss: 8.172e-03:   0%|          | 513/300001 [4:34:57<2623:57:12, 31.54s/it]training loss: 8.172e-03:   0%|          | 514/300001 [4:35:28<2600:28:12, 31.26s/it]training loss: 8.172e-03:   0%|          | 515/300001 [4:36:00<2612:15:10, 31.40s/it]training loss: 8.172e-03:   0%|          | 516/300001 [4:36:32<2628:23:02, 31.59s/it]training loss: 8.172e-03:   0%|          | 517/300001 [4:37:03<2613:13:12, 31.41s/it]training loss: 8.172e-03:   0%|          | 518/300001 [4:37:35<2636:51:49, 31.70s/it]training loss: 8.172e-03:   0%|          | 519/300001 [4:38:07<2646:24:15, 31.81s/it]training loss: 8.172e-03:   0%|          | 520/300001 [4:38:39<2643:23:47, 31.78s/it]training loss: 8.168e-03:   0%|          | 520/300001 [4:39:10<2643:23:47, 31.78s/it]training loss: 8.168e-03:   0%|          | 521/300001 [4:39:10<2632:57:28, 31.65s/it]training loss: 8.168e-03:   0%|          | 522/300001 [4:39:42<2646:05:02, 31.81s/it]training loss: 8.168e-03:   0%|          | 523/300001 [4:40:15<2657:46:44, 31.95s/it]training loss: 8.168e-03:   0%|          | 524/300001 [4:40:47<2667:31:16, 32.07s/it]training loss: 8.168e-03:   0%|          | 525/300001 [4:41:20<2676:39:47, 32.18s/it]training loss: 8.168e-03:   0%|          | 526/300001 [4:41:50<2635:24:18, 31.68s/it]training loss: 8.168e-03:   0%|          | 527/300001 [4:42:22<2630:58:47, 31.63s/it]training loss: 8.168e-03:   0%|          | 528/300001 [4:42:53<2629:21:30, 31.61s/it]training loss: 8.168e-03:   0%|          | 529/300001 [4:43:24<2616:47:01, 31.46s/it]training loss: 8.168e-03:   0%|          | 530/300001 [4:43:56<2612:33:07, 31.41s/it]training loss: 8.168e-03:   0%|          | 531/300001 [4:44:27<2616:41:16, 31.46s/it]training loss: 8.168e-03:   0%|          | 532/300001 [4:44:59<2631:22:21, 31.63s/it]training loss: 8.168e-03:   0%|          | 533/300001 [4:45:30<2620:28:16, 31.50s/it]training loss: 8.168e-03:   0%|          | 534/300001 [4:46:03<2644:51:38, 31.79s/it]training loss: 8.168e-03:   0%|          | 535/300001 [4:46:36<2667:31:11, 32.07s/it]training loss: 8.168e-03:   0%|          | 536/300001 [4:47:06<2630:33:40, 31.62s/it]training loss: 8.168e-03:   0%|          | 537/300001 [4:47:38<2643:03:51, 31.77s/it]training loss: 8.168e-03:   0%|          | 538/300001 [4:48:09<2625:48:23, 31.57s/it]training loss: 8.168e-03:   0%|          | 539/300001 [4:48:41<2618:19:08, 31.48s/it]training loss: 8.168e-03:   0%|          | 540/300001 [4:49:12<2620:44:05, 31.51s/it]training loss: 8.765e-03:   0%|          | 540/300001 [4:49:44<2620:44:05, 31.51s/it]training loss: 8.765e-03:   0%|          | 541/300001 [4:49:44<2629:36:55, 31.61s/it]training loss: 8.765e-03:   0%|          | 542/300001 [4:50:16<2642:29:13, 31.77s/it]training loss: 8.765e-03:   0%|          | 543/300001 [4:50:48<2654:11:24, 31.91s/it]training loss: 8.765e-03:   0%|          | 544/300001 [4:51:21<2660:29:51, 31.98s/it]training loss: 8.765e-03:   0%|          | 545/300001 [4:51:52<2648:46:53, 31.84s/it]training loss: 8.765e-03:   0%|          | 546/300001 [4:52:24<2647:07:46, 31.82s/it]training loss: 8.765e-03:   0%|          | 547/300001 [4:52:56<2655:19:21, 31.92s/it]training loss: 8.765e-03:   0%|          | 548/300001 [4:53:27<2641:08:34, 31.75s/it]training loss: 8.765e-03:   0%|          | 549/300001 [4:53:59<2645:45:06, 31.81s/it]training loss: 8.765e-03:   0%|          | 550/300001 [4:54:31<2642:53:29, 31.77s/it]training loss: 8.765e-03:   0%|          | 551/300001 [4:55:02<2631:26:13, 31.64s/it]training loss: 8.765e-03:   0%|          | 552/300001 [4:55:34<2640:49:42, 31.75s/it]training loss: 8.765e-03:   0%|          | 553/300001 [4:56:07<2667:34:14, 32.07s/it]training loss: 8.765e-03:   0%|          | 554/300001 [4:56:38<2649:34:34, 31.85s/it]training loss: 8.765e-03:   0%|          | 555/300001 [4:57:10<2652:56:10, 31.89s/it]training loss: 8.765e-03:   0%|          | 556/300001 [4:57:42<2641:08:07, 31.75s/it]training loss: 8.765e-03:   0%|          | 557/300001 [4:58:14<2662:52:34, 32.01s/it]training loss: 8.765e-03:   0%|          | 558/300001 [4:58:47<2666:20:22, 32.06s/it]training loss: 8.765e-03:   0%|          | 559/300001 [4:59:18<2655:04:03, 31.92s/it]training loss: 8.765e-03:   0%|          | 560/300001 [4:59:50<2651:09:39, 31.87s/it]training loss: 9.340e-03:   0%|          | 560/300001 [5:00:21<2651:09:39, 31.87s/it]training loss: 9.340e-03:   0%|          | 561/300001 [5:00:21<2636:36:25, 31.70s/it]training loss: 9.340e-03:   0%|          | 562/300001 [5:00:53<2647:57:12, 31.83s/it]training loss: 9.340e-03:   0%|          | 563/300001 [5:01:25<2628:21:30, 31.60s/it]training loss: 9.340e-03:   0%|          | 564/300001 [5:01:56<2625:59:26, 31.57s/it]training loss: 9.340e-03:   0%|          | 565/300001 [5:02:28<2640:29:40, 31.75s/it]training loss: 9.340e-03:   0%|          | 566/300001 [5:03:00<2649:37:50, 31.86s/it]training loss: 9.340e-03:   0%|          | 567/300001 [5:03:32<2653:46:46, 31.91s/it]training loss: 9.340e-03:   0%|          | 568/300001 [5:04:04<2653:27:40, 31.90s/it]training loss: 9.340e-03:   0%|          | 569/300001 [5:04:36<2647:33:31, 31.83s/it]training loss: 9.340e-03:   0%|          | 570/300001 [5:05:06<2603:57:20, 31.31s/it]training loss: 9.340e-03:   0%|          | 571/300001 [5:05:38<2621:53:09, 31.52s/it]training loss: 9.340e-03:   0%|          | 572/300001 [5:06:09<2615:43:04, 31.45s/it]training loss: 9.340e-03:   0%|          | 573/300001 [5:06:42<2638:43:43, 31.73s/it]training loss: 9.340e-03:   0%|          | 574/300001 [5:07:15<2671:05:16, 32.11s/it]training loss: 9.340e-03:   0%|          | 575/300001 [5:07:46<2645:22:08, 31.81s/it]training loss: 9.340e-03:   0%|          | 576/300001 [5:08:18<2655:05:19, 31.92s/it]training loss: 9.340e-03:   0%|          | 577/300001 [5:08:50<2651:31:31, 31.88s/it]training loss: 9.340e-03:   0%|          | 578/300001 [5:09:22<2654:29:08, 31.92s/it]training loss: 9.340e-03:   0%|          | 579/300001 [5:09:54<2660:54:48, 31.99s/it]training loss: 9.340e-03:   0%|          | 580/300001 [5:10:25<2649:59:29, 31.86s/it]training loss: 7.164e-03:   0%|          | 580/300001 [5:10:57<2649:59:29, 31.86s/it]training loss: 7.164e-03:   0%|          | 581/300001 [5:10:57<2638:19:52, 31.72s/it]training loss: 7.164e-03:   0%|          | 582/300001 [5:11:28<2614:07:40, 31.43s/it]training loss: 7.164e-03:   0%|          | 583/300001 [5:11:59<2622:35:55, 31.53s/it]training loss: 7.164e-03:   0%|          | 584/300001 [5:12:30<2599:49:06, 31.26s/it]training loss: 7.164e-03:   0%|          | 585/300001 [5:13:02<2626:17:51, 31.58s/it]training loss: 7.164e-03:   0%|          | 586/300001 [5:13:34<2622:34:22, 31.53s/it]training loss: 7.164e-03:   0%|          | 587/300001 [5:14:05<2625:58:13, 31.57s/it]training loss: 7.164e-03:   0%|          | 588/300001 [5:14:35<2586:48:10, 31.10s/it]training loss: 7.164e-03:   0%|          | 589/300001 [5:15:08<2617:57:56, 31.48s/it]training loss: 7.164e-03:   0%|          | 590/300001 [5:15:38<2585:11:15, 31.08s/it]training loss: 7.164e-03:   0%|          | 591/300001 [5:16:10<2599:11:26, 31.25s/it]training loss: 7.164e-03:   0%|          | 592/300001 [5:16:41<2607:48:59, 31.36s/it]training loss: 7.164e-03:   0%|          | 593/300001 [5:17:13<2623:14:00, 31.54s/it]training loss: 7.164e-03:   0%|          | 594/300001 [5:17:45<2635:36:38, 31.69s/it]training loss: 7.164e-03:   0%|          | 595/300001 [5:18:17<2640:35:45, 31.75s/it]training loss: 7.164e-03:   0%|          | 596/300001 [5:18:49<2645:40:40, 31.81s/it]training loss: 7.164e-03:   0%|          | 597/300001 [5:19:20<2625:19:20, 31.57s/it]training loss: 7.164e-03:   0%|          | 598/300001 [5:19:52<2624:56:58, 31.56s/it]training loss: 7.164e-03:   0%|          | 599/300001 [5:20:24<2654:28:46, 31.92s/it]training loss: 7.164e-03:   0%|          | 600/300001 [5:20:55<2633:14:04, 31.66s/it]training loss: 7.862e-03:   0%|          | 600/300001 [5:21:27<2633:14:04, 31.66s/it]training loss: 7.862e-03:   0%|          | 601/300001 [5:21:27<2637:17:02, 31.71s/it]training loss: 7.862e-03:   0%|          | 602/300001 [5:21:59<2628:08:41, 31.60s/it]training loss: 7.862e-03:   0%|          | 603/300001 [5:22:30<2616:04:53, 31.46s/it]training loss: 7.862e-03:   0%|          | 604/300001 [5:23:03<2668:36:55, 32.09s/it]training loss: 7.862e-03:   0%|          | 605/300001 [5:23:35<2664:29:43, 32.04s/it]training loss: 7.862e-03:   0%|          | 606/300001 [5:24:06<2639:42:23, 31.74s/it]training loss: 7.862e-03:   0%|          | 607/300001 [5:24:38<2652:22:00, 31.89s/it]training loss: 7.862e-03:   0%|          | 608/300001 [5:25:12<2682:30:28, 32.26s/it]training loss: 7.862e-03:   0%|          | 609/300001 [5:25:43<2674:53:28, 32.16s/it]training loss: 7.862e-03:   0%|          | 610/300001 [5:26:16<2678:36:28, 32.21s/it]training loss: 7.862e-03:   0%|          | 611/300001 [5:26:47<2644:30:54, 31.80s/it]training loss: 7.862e-03:   0%|          | 612/300001 [5:27:18<2645:19:25, 31.81s/it]training loss: 7.862e-03:   0%|          | 613/300001 [5:27:50<2649:40:53, 31.86s/it]training loss: 7.862e-03:   0%|          | 614/300001 [5:28:22<2635:27:17, 31.69s/it]training loss: 7.862e-03:   0%|          | 615/300001 [5:28:53<2633:09:24, 31.66s/it]training loss: 7.862e-03:   0%|          | 616/300001 [5:29:26<2661:29:08, 32.00s/it]training loss: 7.862e-03:   0%|          | 617/300001 [5:29:58<2664:27:39, 32.04s/it]training loss: 7.862e-03:   0%|          | 618/300001 [5:30:30<2663:13:55, 32.02s/it]training loss: 7.862e-03:   0%|          | 619/300001 [5:31:02<2657:40:49, 31.96s/it]training loss: 7.862e-03:   0%|          | 620/300001 [5:31:34<2661:38:07, 32.01s/it]training loss: 8.401e-03:   0%|          | 620/300001 [5:32:06<2661:38:07, 32.01s/it]training loss: 8.401e-03:   0%|          | 621/300001 [5:32:06<2648:57:59, 31.85s/it]training loss: 8.401e-03:   0%|          | 622/300001 [5:32:37<2645:17:41, 31.81s/it]training loss: 8.401e-03:   0%|          | 623/300001 [5:33:09<2634:36:09, 31.68s/it]training loss: 8.401e-03:   0%|          | 624/300001 [5:33:40<2616:48:19, 31.47s/it]training loss: 8.401e-03:   0%|          | 625/300001 [5:34:11<2613:11:19, 31.42s/it]training loss: 8.401e-03:   0%|          | 626/300001 [5:34:43<2619:56:38, 31.50s/it]training loss: 8.401e-03:   0%|          | 627/300001 [5:35:14<2615:14:41, 31.45s/it]training loss: 8.401e-03:   0%|          | 628/300001 [5:35:36<2381:28:42, 28.64s/it]training loss: 8.401e-03:   0%|          | 629/300001 [5:36:08<2457:50:02, 29.56s/it]training loss: 8.401e-03:   0%|          | 630/300001 [5:36:40<2528:43:38, 30.41s/it]training loss: 8.401e-03:   0%|          | 631/300001 [5:37:12<2566:57:25, 30.87s/it]training loss: 8.401e-03:   0%|          | 632/300001 [5:37:43<2576:56:35, 30.99s/it]training loss: 8.401e-03:   0%|          | 633/300001 [5:38:16<2618:49:14, 31.49s/it]training loss: 8.401e-03:   0%|          | 634/300001 [5:38:47<2615:26:20, 31.45s/it]training loss: 8.401e-03:   0%|          | 635/300001 [5:39:19<2614:21:28, 31.44s/it]training loss: 8.401e-03:   0%|          | 636/300001 [5:39:50<2601:32:11, 31.28s/it]training loss: 8.401e-03:   0%|          | 637/300001 [5:40:21<2593:20:10, 31.19s/it]training loss: 8.401e-03:   0%|          | 638/300001 [5:40:53<2615:42:09, 31.46s/it]training loss: 8.401e-03:   0%|          | 639/300001 [5:41:23<2590:29:30, 31.15s/it]training loss: 8.401e-03:   0%|          | 640/300001 [5:41:55<2604:38:11, 31.32s/it]training loss: 8.672e-03:   0%|          | 640/300001 [5:42:27<2604:38:11, 31.32s/it]training loss: 8.672e-03:   0%|          | 641/300001 [5:42:27<2612:42:57, 31.42s/it]training loss: 8.672e-03:   0%|          | 642/300001 [5:42:59<2637:53:35, 31.72s/it]training loss: 8.672e-03:   0%|          | 643/300001 [5:43:32<2670:32:57, 32.12s/it]training loss: 8.672e-03:   0%|          | 644/300001 [5:44:03<2649:15:36, 31.86s/it]training loss: 8.672e-03:   0%|          | 645/300001 [5:44:36<2663:09:06, 32.03s/it]training loss: 8.672e-03:   0%|          | 646/300001 [5:45:08<2659:27:12, 31.98s/it]training loss: 8.672e-03:   0%|          | 647/300001 [5:45:38<2621:50:28, 31.53s/it]training loss: 8.672e-03:   0%|          | 648/300001 [5:46:10<2621:38:49, 31.53s/it]training loss: 8.672e-03:   0%|          | 649/300001 [5:46:43<2665:40:07, 32.06s/it]training loss: 8.672e-03:   0%|          | 650/300001 [5:47:15<2670:42:19, 32.12s/it]training loss: 8.672e-03:   0%|          | 651/300001 [5:47:47<2657:30:09, 31.96s/it]training loss: 8.672e-03:   0%|          | 652/300001 [5:48:19<2652:50:53, 31.90s/it]training loss: 8.672e-03:   0%|          | 653/300001 [5:48:52<2698:50:58, 32.46s/it]training loss: 8.672e-03:   0%|          | 654/300001 [5:49:24<2667:12:51, 32.08s/it]training loss: 8.672e-03:   0%|          | 655/300001 [5:49:55<2640:48:40, 31.76s/it]training loss: 8.672e-03:   0%|          | 656/300001 [5:50:27<2656:50:13, 31.95s/it]training loss: 8.672e-03:   0%|          | 657/300001 [5:50:58<2624:19:10, 31.56s/it]training loss: 8.672e-03:   0%|          | 658/300001 [5:51:30<2645:20:24, 31.81s/it]training loss: 8.672e-03:   0%|          | 659/300001 [5:52:02<2652:41:44, 31.90s/it]training loss: 8.672e-03:   0%|          | 660/300001 [5:52:34<2646:39:49, 31.83s/it]training loss: 7.886e-03:   0%|          | 660/300001 [5:53:05<2646:39:49, 31.83s/it]training loss: 7.886e-03:   0%|          | 661/300001 [5:53:06<2645:01:24, 31.81s/it]training loss: 7.886e-03:   0%|          | 662/300001 [5:53:37<2640:20:37, 31.75s/it]training loss: 7.886e-03:   0%|          | 663/300001 [5:54:09<2646:06:25, 31.82s/it]training loss: 7.886e-03:   0%|          | 664/300001 [5:54:40<2631:43:33, 31.65s/it]training loss: 7.886e-03:   0%|          | 665/300001 [5:55:12<2636:12:57, 31.70s/it]training loss: 7.886e-03:   0%|          | 666/300001 [5:55:42<2599:44:02, 31.27s/it]training loss: 7.886e-03:   0%|          | 667/300001 [5:56:14<2614:46:49, 31.45s/it]training loss: 7.886e-03:   0%|          | 668/300001 [5:56:46<2628:21:41, 31.61s/it]training loss: 7.886e-03:   0%|          | 669/300001 [5:57:17<2610:52:54, 31.40s/it]training loss: 7.886e-03:   0%|          | 670/300001 [5:57:49<2625:53:12, 31.58s/it]training loss: 7.886e-03:   0%|          | 671/300001 [5:58:21<2632:56:00, 31.67s/it]training loss: 7.886e-03:   0%|          | 672/300001 [5:58:53<2630:53:52, 31.64s/it]training loss: 7.886e-03:   0%|          | 673/300001 [5:59:24<2626:46:20, 31.59s/it]training loss: 7.886e-03:   0%|          | 674/300001 [5:59:55<2610:55:43, 31.40s/it]training loss: 7.886e-03:   0%|          | 675/300001 [6:00:27<2624:56:41, 31.57s/it]training loss: 7.886e-03:   0%|          | 676/300001 [6:00:59<2623:15:10, 31.55s/it]training loss: 7.886e-03:   0%|          | 677/300001 [6:01:31<2633:19:53, 31.67s/it]training loss: 7.886e-03:   0%|          | 678/300001 [6:02:03<2644:10:37, 31.80s/it]training loss: 7.886e-03:   0%|          | 679/300001 [6:02:35<2663:40:57, 32.04s/it]training loss: 7.886e-03:   0%|          | 680/300001 [6:03:07<2656:31:43, 31.95s/it]training loss: 7.296e-03:   0%|          | 680/300001 [6:03:39<2656:31:43, 31.95s/it]training loss: 7.296e-03:   0%|          | 681/300001 [6:03:39<2653:29:28, 31.91s/it]training loss: 7.296e-03:   0%|          | 682/300001 [6:04:10<2634:27:42, 31.69s/it]training loss: 7.296e-03:   0%|          | 683/300001 [6:04:42<2648:55:39, 31.86s/it]training loss: 7.296e-03:   0%|          | 684/300001 [6:05:15<2669:11:42, 32.10s/it]training loss: 7.296e-03:   0%|          | 685/300001 [6:05:47<2660:38:08, 32.00s/it]training loss: 7.296e-03:   0%|          | 686/300001 [6:06:19<2664:14:28, 32.04s/it]training loss: 7.296e-03:   0%|          | 687/300001 [6:06:51<2661:59:14, 32.02s/it]training loss: 7.296e-03:   0%|          | 688/300001 [6:07:22<2647:11:07, 31.84s/it]training loss: 7.296e-03:   0%|          | 689/300001 [6:07:54<2652:27:48, 31.90s/it]training loss: 7.296e-03:   0%|          | 690/300001 [6:08:26<2645:46:49, 31.82s/it]training loss: 7.296e-03:   0%|          | 691/300001 [6:08:57<2633:50:57, 31.68s/it]training loss: 7.296e-03:   0%|          | 692/300001 [6:09:29<2643:37:47, 31.80s/it]training loss: 7.296e-03:   0%|          | 693/300001 [6:10:02<2657:19:45, 31.96s/it]training loss: 7.296e-03:   0%|          | 694/300001 [6:10:32<2614:24:00, 31.45s/it]training loss: 7.296e-03:   0%|          | 695/300001 [6:11:04<2635:01:59, 31.69s/it]training loss: 7.296e-03:   0%|          | 696/300001 [6:11:37<2663:44:58, 32.04s/it]training loss: 7.296e-03:   0%|          | 697/300001 [6:12:10<2680:21:02, 32.24s/it]training loss: 7.296e-03:   0%|          | 698/300001 [6:12:41<2661:21:17, 32.01s/it]training loss: 7.296e-03:   0%|          | 699/300001 [6:13:14<2674:14:09, 32.17s/it]training loss: 7.296e-03:   0%|          | 700/300001 [6:13:45<2654:25:58, 31.93s/it]training loss: 7.398e-03:   0%|          | 700/300001 [6:14:17<2654:25:58, 31.93s/it]training loss: 7.398e-03:   0%|          | 701/300001 [6:14:17<2653:01:15, 31.91s/it]training loss: 7.398e-03:   0%|          | 702/300001 [6:14:49<2668:06:11, 32.09s/it]training loss: 7.398e-03:   0%|          | 703/300001 [6:15:21<2660:58:51, 32.01s/it]training loss: 7.398e-03:   0%|          | 704/300001 [6:15:53<2648:10:33, 31.85s/it]training loss: 7.398e-03:   0%|          | 705/300001 [6:16:25<2667:41:12, 32.09s/it]training loss: 7.398e-03:   0%|          | 706/300001 [6:16:57<2658:01:25, 31.97s/it]training loss: 7.398e-03:   0%|          | 707/300001 [6:17:29<2665:13:54, 32.06s/it]training loss: 7.398e-03:   0%|          | 708/300001 [6:18:01<2660:28:03, 32.00s/it]training loss: 7.398e-03:   0%|          | 709/300001 [6:18:33<2661:05:57, 32.01s/it]training loss: 7.398e-03:   0%|          | 710/300001 [6:19:05<2655:02:48, 31.94s/it]training loss: 7.398e-03:   0%|          | 711/300001 [6:19:36<2642:51:27, 31.79s/it]training loss: 7.398e-03:   0%|          | 712/300001 [6:20:08<2639:21:24, 31.75s/it]training loss: 7.398e-03:   0%|          | 713/300001 [6:20:39<2627:53:09, 31.61s/it]training loss: 7.398e-03:   0%|          | 714/300001 [6:21:10<2612:35:45, 31.43s/it]training loss: 7.398e-03:   0%|          | 715/300001 [6:21:42<2623:34:09, 31.56s/it]training loss: 7.398e-03:   0%|          | 716/300001 [6:22:14<2640:33:11, 31.76s/it]training loss: 7.398e-03:   0%|          | 717/300001 [6:22:47<2656:07:44, 31.95s/it]training loss: 7.398e-03:   0%|          | 718/300001 [6:23:19<2650:31:59, 31.88s/it]training loss: 7.398e-03:   0%|          | 719/300001 [6:23:50<2635:21:26, 31.70s/it]training loss: 7.398e-03:   0%|          | 720/300001 [6:24:23<2665:37:13, 32.06s/it]training loss: 8.100e-03:   0%|          | 720/300001 [6:24:55<2665:37:13, 32.06s/it]training loss: 8.100e-03:   0%|          | 721/300001 [6:24:55<2675:44:16, 32.19s/it]training loss: 8.100e-03:   0%|          | 722/300001 [6:25:26<2645:47:02, 31.83s/it]training loss: 8.100e-03:   0%|          | 723/300001 [6:25:57<2627:53:52, 31.61s/it]training loss: 8.100e-03:   0%|          | 724/300001 [6:26:29<2638:34:03, 31.74s/it]training loss: 8.100e-03:   0%|          | 725/300001 [6:27:00<2601:46:54, 31.30s/it]training loss: 8.100e-03:   0%|          | 726/300001 [6:27:31<2611:30:03, 31.41s/it]training loss: 8.100e-03:   0%|          | 727/300001 [6:28:03<2628:18:06, 31.62s/it]training loss: 8.100e-03:   0%|          | 728/300001 [6:28:35<2618:23:54, 31.50s/it]training loss: 8.100e-03:   0%|          | 729/300001 [6:29:06<2611:32:43, 31.41s/it]training loss: 8.100e-03:   0%|          | 730/300001 [6:29:37<2603:55:40, 31.32s/it]training loss: 8.100e-03:   0%|          | 731/300001 [6:30:08<2607:43:53, 31.37s/it]training loss: 8.100e-03:   0%|          | 732/300001 [6:30:40<2614:37:56, 31.45s/it]training loss: 8.100e-03:   0%|          | 733/300001 [6:31:11<2602:02:07, 31.30s/it]training loss: 8.100e-03:   0%|          | 734/300001 [6:31:43<2625:04:10, 31.58s/it]training loss: 8.100e-03:   0%|          | 735/300001 [6:32:17<2674:52:20, 32.18s/it]training loss: 8.100e-03:   0%|          | 736/300001 [6:32:49<2678:50:45, 32.23s/it]training loss: 8.100e-03:   0%|          | 737/300001 [6:33:21<2672:24:49, 32.15s/it]training loss: 8.100e-03:   0%|          | 738/300001 [6:33:52<2634:18:36, 31.69s/it]training loss: 8.100e-03:   0%|          | 739/300001 [6:34:25<2660:35:37, 32.01s/it]training loss: 8.100e-03:   0%|          | 740/300001 [6:34:57<2668:19:33, 32.10s/it]training loss: 8.071e-03:   0%|          | 740/300001 [6:35:29<2668:19:33, 32.10s/it]training loss: 8.071e-03:   0%|          | 741/300001 [6:35:30<2682:41:03, 32.27s/it]training loss: 8.071e-03:   0%|          | 742/300001 [6:36:02<2681:20:49, 32.26s/it]training loss: 8.071e-03:   0%|          | 743/300001 [6:36:34<2676:49:14, 32.20s/it]training loss: 8.071e-03:   0%|          | 744/300001 [6:37:04<2633:08:13, 31.68s/it]training loss: 8.071e-03:   0%|          | 745/300001 [6:37:35<2607:40:26, 31.37s/it]training loss: 8.071e-03:   0%|          | 746/300001 [6:38:07<2633:57:47, 31.69s/it]training loss: 8.071e-03:   0%|          | 747/300001 [6:38:38<2610:16:04, 31.40s/it]training loss: 8.071e-03:   0%|          | 748/300001 [6:39:09<2599:25:11, 31.27s/it]training loss: 8.071e-03:   0%|          | 749/300001 [6:39:40<2596:58:43, 31.24s/it]training loss: 8.071e-03:   0%|          | 750/300001 [6:40:11<2593:27:52, 31.20s/it]training loss: 8.071e-03:   0%|          | 751/300001 [6:40:43<2607:51:45, 31.37s/it]training loss: 8.071e-03:   0%|          | 752/300001 [6:41:14<2596:44:29, 31.24s/it]training loss: 8.071e-03:   0%|          | 753/300001 [6:41:44<2573:52:38, 30.96s/it]training loss: 8.071e-03:   0%|          | 754/300001 [6:42:16<2591:17:26, 31.17s/it]training loss: 8.071e-03:   0%|          | 755/300001 [6:42:49<2626:15:37, 31.59s/it]training loss: 8.071e-03:   0%|          | 756/300001 [6:43:21<2642:31:30, 31.79s/it]training loss: 8.071e-03:   0%|          | 757/300001 [6:43:53<2650:03:00, 31.88s/it]training loss: 8.071e-03:   0%|          | 758/300001 [6:44:24<2636:56:38, 31.72s/it]training loss: 8.071e-03:   0%|          | 759/300001 [6:44:56<2635:01:47, 31.70s/it]training loss: 8.071e-03:   0%|          | 760/300001 [6:45:29<2658:32:10, 31.98s/it]training loss: 7.864e-03:   0%|          | 760/300001 [6:46:00<2658:32:10, 31.98s/it]training loss: 7.864e-03:   0%|          | 761/300001 [6:46:00<2643:52:20, 31.81s/it]training loss: 7.864e-03:   0%|          | 762/300001 [6:46:32<2661:31:32, 32.02s/it]training loss: 7.864e-03:   0%|          | 763/300001 [6:47:05<2667:49:46, 32.10s/it]training loss: 7.864e-03:   0%|          | 764/300001 [6:47:37<2679:15:41, 32.23s/it]training loss: 7.864e-03:   0%|          | 765/300001 [6:48:08<2646:30:06, 31.84s/it]training loss: 7.864e-03:   0%|          | 766/300001 [6:48:40<2638:50:26, 31.75s/it]training loss: 7.864e-03:   0%|          | 767/300001 [6:49:11<2634:03:28, 31.69s/it]training loss: 7.864e-03:   0%|          | 768/300001 [6:49:45<2676:52:41, 32.20s/it]training loss: 7.864e-03:   0%|          | 769/300001 [6:50:17<2677:42:10, 32.21s/it]training loss: 7.864e-03:   0%|          | 770/300001 [6:50:48<2649:28:56, 31.88s/it]training loss: 7.864e-03:   0%|          | 771/300001 [6:51:19<2614:51:00, 31.46s/it]training loss: 7.864e-03:   0%|          | 772/300001 [6:51:50<2621:50:28, 31.54s/it]training loss: 7.864e-03:   0%|          | 773/300001 [6:52:21<2607:44:15, 31.37s/it]training loss: 7.864e-03:   0%|          | 774/300001 [6:52:52<2595:10:42, 31.22s/it]training loss: 7.864e-03:   0%|          | 775/300001 [6:53:24<2623:36:11, 31.56s/it]training loss: 7.864e-03:   0%|          | 776/300001 [6:53:57<2636:17:46, 31.72s/it]training loss: 7.864e-03:   0%|          | 777/300001 [6:54:29<2655:27:50, 31.95s/it]training loss: 7.864e-03:   0%|          | 778/300001 [6:55:00<2640:54:39, 31.77s/it]training loss: 7.864e-03:   0%|          | 779/300001 [6:55:31<2610:16:38, 31.40s/it]training loss: 7.864e-03:   0%|          | 780/300001 [6:56:01<2587:45:55, 31.13s/it]training loss: 8.500e-03:   0%|          | 780/300001 [6:56:33<2587:45:55, 31.13s/it]training loss: 8.500e-03:   0%|          | 781/300001 [6:56:33<2609:55:39, 31.40s/it]training loss: 8.500e-03:   0%|          | 782/300001 [6:57:04<2578:21:51, 31.02s/it]training loss: 8.500e-03:   0%|          | 783/300001 [6:57:37<2631:56:39, 31.67s/it]training loss: 8.500e-03:   0%|          | 784/300001 [6:58:08<2617:07:11, 31.49s/it]training loss: 8.500e-03:   0%|          | 785/300001 [6:58:30<2395:09:30, 28.82s/it]training loss: 8.500e-03:   0%|          | 786/300001 [6:59:00<2421:31:12, 29.13s/it]training loss: 8.500e-03:   0%|          | 787/300001 [6:59:33<2501:28:21, 30.10s/it]training loss: 8.500e-03:   0%|          | 788/300001 [7:00:05<2550:50:07, 30.69s/it]training loss: 8.500e-03:   0%|          | 789/300001 [7:00:36<2576:08:46, 31.00s/it]training loss: 8.500e-03:   0%|          | 790/300001 [7:01:08<2587:04:54, 31.13s/it]training loss: 8.500e-03:   0%|          | 791/300001 [7:01:40<2606:59:05, 31.37s/it]training loss: 8.500e-03:   0%|          | 792/300001 [7:02:11<2604:07:28, 31.33s/it]training loss: 8.500e-03:   0%|          | 793/300001 [7:02:43<2615:23:16, 31.47s/it]training loss: 8.500e-03:   0%|          | 794/300001 [7:03:15<2625:42:17, 31.59s/it]training loss: 8.500e-03:   0%|          | 795/300001 [7:03:46<2627:05:11, 31.61s/it]training loss: 8.500e-03:   0%|          | 796/300001 [7:04:18<2616:16:31, 31.48s/it]training loss: 8.500e-03:   0%|          | 797/300001 [7:04:48<2588:08:41, 31.14s/it]training loss: 8.500e-03:   0%|          | 798/300001 [7:05:19<2588:08:30, 31.14s/it]training loss: 8.500e-03:   0%|          | 799/300001 [7:05:50<2588:45:48, 31.15s/it]training loss: 8.500e-03:   0%|          | 800/300001 [7:06:22<2606:24:04, 31.36s/it]training loss: 8.692e-03:   0%|          | 800/300001 [7:06:54<2606:24:04, 31.36s/it]training loss: 8.692e-03:   0%|          | 801/300001 [7:06:56<2666:30:51, 32.08s/it]training loss: 8.692e-03:   0%|          | 802/300001 [7:07:27<2648:18:54, 31.86s/it]training loss: 8.692e-03:   0%|          | 803/300001 [7:08:00<2660:32:08, 32.01s/it]training loss: 8.692e-03:   0%|          | 804/300001 [7:08:31<2658:11:34, 31.98s/it]training loss: 8.692e-03:   0%|          | 805/300001 [7:09:03<2642:38:01, 31.80s/it]training loss: 8.692e-03:   0%|          | 806/300001 [7:09:35<2645:01:24, 31.83s/it]training loss: 8.692e-03:   0%|          | 807/300001 [7:10:05<2606:41:51, 31.36s/it]training loss: 8.692e-03:   0%|          | 808/300001 [7:10:36<2591:43:30, 31.18s/it]training loss: 8.692e-03:   0%|          | 809/300001 [7:11:07<2590:59:35, 31.18s/it]training loss: 8.692e-03:   0%|          | 810/300001 [7:11:38<2594:09:57, 31.21s/it]training loss: 8.692e-03:   0%|          | 811/300001 [7:12:10<2604:36:57, 31.34s/it]training loss: 8.692e-03:   0%|          | 812/300001 [7:12:40<2580:43:40, 31.05s/it]training loss: 8.692e-03:   0%|          | 813/300001 [7:13:13<2613:12:03, 31.44s/it]training loss: 8.692e-03:   0%|          | 814/300001 [7:13:46<2655:01:25, 31.95s/it]training loss: 8.692e-03:   0%|          | 815/300001 [7:14:17<2643:26:59, 31.81s/it]training loss: 8.692e-03:   0%|          | 816/300001 [7:14:49<2647:41:53, 31.86s/it]training loss: 8.692e-03:   0%|          | 817/300001 [7:15:21<2653:52:47, 31.93s/it]training loss: 8.692e-03:   0%|          | 818/300001 [7:15:53<2649:32:43, 31.88s/it]training loss: 8.692e-03:   0%|          | 819/300001 [7:16:26<2674:38:01, 32.18s/it]training loss: 8.692e-03:   0%|          | 820/300001 [7:16:58<2681:05:42, 32.26s/it]training loss: 8.765e-03:   0%|          | 820/300001 [7:17:29<2681:05:42, 32.26s/it]training loss: 8.765e-03:   0%|          | 821/300001 [7:17:29<2643:38:03, 31.81s/it]training loss: 8.765e-03:   0%|          | 822/300001 [7:18:00<2620:18:50, 31.53s/it]training loss: 8.765e-03:   0%|          | 823/300001 [7:18:31<2607:59:26, 31.38s/it]training loss: 8.765e-03:   0%|          | 824/300001 [7:19:03<2621:01:00, 31.54s/it]training loss: 8.765e-03:   0%|          | 825/300001 [7:19:34<2620:37:59, 31.53s/it]training loss: 8.765e-03:   0%|          | 826/300001 [7:20:06<2629:56:10, 31.65s/it]training loss: 8.765e-03:   0%|          | 827/300001 [7:20:37<2612:40:25, 31.44s/it]training loss: 8.765e-03:   0%|          | 828/300001 [7:21:09<2622:46:15, 31.56s/it]training loss: 8.765e-03:   0%|          | 829/300001 [7:21:41<2623:24:53, 31.57s/it]training loss: 8.765e-03:   0%|          | 830/300001 [7:22:13<2634:40:42, 31.70s/it]training loss: 8.765e-03:   0%|          | 831/300001 [7:22:44<2632:36:18, 31.68s/it]training loss: 8.765e-03:   0%|          | 832/300001 [7:23:17<2657:38:27, 31.98s/it]training loss: 8.765e-03:   0%|          | 833/300001 [7:23:48<2642:22:02, 31.80s/it]training loss: 8.765e-03:   0%|          | 834/300001 [7:24:21<2650:23:33, 31.89s/it]training loss: 8.765e-03:   0%|          | 835/300001 [7:24:51<2616:07:27, 31.48s/it]training loss: 8.765e-03:   0%|          | 836/300001 [7:25:23<2632:52:25, 31.68s/it]training loss: 8.765e-03:   0%|          | 837/300001 [7:25:55<2629:06:08, 31.64s/it]training loss: 8.765e-03:   0%|          | 838/300001 [7:26:26<2630:43:08, 31.66s/it]training loss: 8.765e-03:   0%|          | 839/300001 [7:26:58<2638:56:21, 31.76s/it]training loss: 8.765e-03:   0%|          | 840/300001 [7:27:30<2631:09:52, 31.66s/it]training loss: 6.394e-03:   0%|          | 840/300001 [7:28:02<2631:09:52, 31.66s/it]training loss: 6.394e-03:   0%|          | 841/300001 [7:28:02<2630:44:24, 31.66s/it]training loss: 6.394e-03:   0%|          | 842/300001 [7:28:33<2637:07:05, 31.73s/it]training loss: 6.394e-03:   0%|          | 843/300001 [7:29:06<2664:11:34, 32.06s/it]training loss: 6.394e-03:   0%|          | 844/300001 [7:29:39<2683:47:04, 32.30s/it]training loss: 6.394e-03:   0%|          | 845/300001 [7:30:11<2665:58:57, 32.08s/it]training loss: 6.394e-03:   0%|          | 846/300001 [7:30:42<2654:38:36, 31.95s/it]training loss: 6.394e-03:   0%|          | 847/300001 [7:31:14<2636:43:30, 31.73s/it]training loss: 6.394e-03:   0%|          | 848/300001 [7:31:46<2642:43:16, 31.80s/it]training loss: 6.394e-03:   0%|          | 849/300001 [7:32:18<2648:16:41, 31.87s/it]training loss: 6.394e-03:   0%|          | 850/300001 [7:32:50<2656:57:06, 31.97s/it]training loss: 6.394e-03:   0%|          | 851/300001 [7:33:21<2639:49:52, 31.77s/it]training loss: 6.394e-03:   0%|          | 852/300001 [7:33:53<2635:02:13, 31.71s/it]training loss: 6.394e-03:   0%|          | 853/300001 [7:34:25<2641:15:56, 31.79s/it]training loss: 6.394e-03:   0%|          | 854/300001 [7:34:57<2643:31:23, 31.81s/it]training loss: 6.394e-03:   0%|          | 855/300001 [7:35:30<2676:07:09, 32.21s/it]training loss: 6.394e-03:   0%|          | 856/300001 [7:36:02<2683:52:43, 32.30s/it]training loss: 6.394e-03:   0%|          | 857/300001 [7:36:34<2683:00:54, 32.29s/it]training loss: 6.394e-03:   0%|          | 858/300001 [7:37:06<2674:04:50, 32.18s/it]training loss: 6.394e-03:   0%|          | 859/300001 [7:37:38<2653:53:28, 31.94s/it]training loss: 6.394e-03:   0%|          | 860/300001 [7:38:09<2646:57:42, 31.85s/it]training loss: 6.564e-03:   0%|          | 860/300001 [7:38:40<2646:57:42, 31.85s/it]training loss: 6.564e-03:   0%|          | 861/300001 [7:38:40<2624:35:18, 31.59s/it]training loss: 6.564e-03:   0%|          | 862/300001 [7:39:12<2637:19:13, 31.74s/it]training loss: 6.564e-03:   0%|          | 863/300001 [7:39:45<2648:17:28, 31.87s/it]training loss: 6.564e-03:   0%|          | 864/300001 [7:40:16<2628:43:04, 31.64s/it]training loss: 6.564e-03:   0%|          | 865/300001 [7:40:48<2641:43:54, 31.79s/it]training loss: 6.564e-03:   0%|          | 866/300001 [7:41:19<2630:30:53, 31.66s/it]training loss: 6.564e-03:   0%|          | 867/300001 [7:41:52<2657:33:38, 31.98s/it]training loss: 6.564e-03:   0%|          | 868/300001 [7:42:23<2643:50:54, 31.82s/it]training loss: 6.564e-03:   0%|          | 869/300001 [7:42:54<2620:01:28, 31.53s/it]training loss: 6.564e-03:   0%|          | 870/300001 [7:43:26<2620:34:07, 31.54s/it]training loss: 6.564e-03:   0%|          | 871/300001 [7:43:57<2614:48:37, 31.47s/it]training loss: 6.564e-03:   0%|          | 872/300001 [7:44:30<2656:57:22, 31.98s/it]training loss: 6.564e-03:   0%|          | 873/300001 [7:45:03<2688:45:32, 32.36s/it]training loss: 6.564e-03:   0%|          | 874/300001 [7:45:35<2665:54:27, 32.08s/it]training loss: 6.564e-03:   0%|          | 875/300001 [7:46:07<2656:09:09, 31.97s/it]training loss: 6.564e-03:   0%|          | 876/300001 [7:46:38<2639:46:51, 31.77s/it]training loss: 6.564e-03:   0%|          | 877/300001 [7:47:10<2654:40:08, 31.95s/it]training loss: 6.564e-03:   0%|          | 878/300001 [7:47:41<2622:28:31, 31.56s/it]training loss: 6.564e-03:   0%|          | 879/300001 [7:48:13<2634:44:47, 31.71s/it]training loss: 6.564e-03:   0%|          | 880/300001 [7:48:44<2624:09:30, 31.58s/it]training loss: 7.261e-03:   0%|          | 880/300001 [7:49:16<2624:09:30, 31.58s/it]training loss: 7.261e-03:   0%|          | 881/300001 [7:49:16<2634:15:48, 31.70s/it]training loss: 7.261e-03:   0%|          | 882/300001 [7:49:49<2649:10:49, 31.88s/it]training loss: 7.261e-03:   0%|          | 883/300001 [7:50:20<2640:40:27, 31.78s/it]training loss: 7.261e-03:   0%|          | 884/300001 [7:50:54<2690:49:08, 32.39s/it]training loss: 7.261e-03:   0%|          | 885/300001 [7:51:26<2693:34:36, 32.42s/it]training loss: 7.261e-03:   0%|          | 886/300001 [7:51:59<2686:25:30, 32.33s/it]training loss: 7.261e-03:   0%|          | 887/300001 [7:52:31<2682:21:06, 32.28s/it]training loss: 7.261e-03:   0%|          | 888/300001 [7:53:03<2676:36:00, 32.21s/it]training loss: 7.261e-03:   0%|          | 889/300001 [7:53:35<2680:14:25, 32.26s/it]training loss: 7.261e-03:   0%|          | 890/300001 [7:54:07<2667:12:46, 32.10s/it]training loss: 7.261e-03:   0%|          | 891/300001 [7:54:38<2644:11:45, 31.82s/it]training loss: 7.261e-03:   0%|          | 892/300001 [7:55:10<2638:26:18, 31.76s/it]training loss: 7.261e-03:   0%|          | 893/300001 [7:55:41<2632:00:22, 31.68s/it]training loss: 7.261e-03:   0%|          | 894/300001 [7:56:13<2633:28:14, 31.70s/it]training loss: 7.261e-03:   0%|          | 895/300001 [7:56:46<2658:59:51, 32.00s/it]training loss: 7.261e-03:   0%|          | 896/300001 [7:57:17<2649:45:13, 31.89s/it]training loss: 7.261e-03:   0%|          | 897/300001 [7:57:49<2638:21:11, 31.76s/it]training loss: 7.261e-03:   0%|          | 898/300001 [7:58:20<2630:51:24, 31.66s/it]training loss: 7.261e-03:   0%|          | 899/300001 [7:58:52<2633:45:14, 31.70s/it]training loss: 7.261e-03:   0%|          | 900/300001 [7:59:23<2614:21:59, 31.47s/it]training loss: 7.057e-03:   0%|          | 900/300001 [7:59:55<2614:21:59, 31.47s/it]training loss: 7.057e-03:   0%|          | 901/300001 [7:59:55<2636:50:34, 31.74s/it]training loss: 7.057e-03:   0%|          | 902/300001 [8:00:27<2631:50:27, 31.68s/it]training loss: 7.057e-03:   0%|          | 903/300001 [8:00:59<2637:59:40, 31.75s/it]training loss: 7.057e-03:   0%|          | 904/300001 [8:01:31<2651:18:19, 31.91s/it]training loss: 7.057e-03:   0%|          | 905/300001 [8:02:02<2631:48:40, 31.68s/it]training loss: 7.057e-03:   0%|          | 906/300001 [8:02:33<2622:27:32, 31.56s/it]training loss: 7.057e-03:   0%|          | 907/300001 [8:03:05<2620:35:00, 31.54s/it]training loss: 7.057e-03:   0%|          | 908/300001 [8:03:37<2629:19:54, 31.65s/it]training loss: 7.057e-03:   0%|          | 909/300001 [8:04:08<2623:42:23, 31.58s/it]training loss: 7.057e-03:   0%|          | 910/300001 [8:04:39<2615:43:53, 31.48s/it]training loss: 7.057e-03:   0%|          | 911/300001 [8:05:10<2603:22:03, 31.34s/it]training loss: 7.057e-03:   0%|          | 912/300001 [8:05:43<2645:49:49, 31.85s/it]training loss: 7.057e-03:   0%|          | 913/300001 [8:06:16<2653:50:30, 31.94s/it]training loss: 7.057e-03:   0%|          | 914/300001 [8:06:48<2654:04:54, 31.95s/it]training loss: 7.057e-03:   0%|          | 915/300001 [8:07:20<2665:35:39, 32.08s/it]training loss: 7.057e-03:   0%|          | 916/300001 [8:07:52<2653:06:59, 31.93s/it]training loss: 7.057e-03:   0%|          | 917/300001 [8:08:23<2637:25:16, 31.75s/it]training loss: 7.057e-03:   0%|          | 918/300001 [8:08:54<2628:25:05, 31.64s/it]training loss: 7.057e-03:   0%|          | 919/300001 [8:09:27<2643:44:05, 31.82s/it]training loss: 7.057e-03:   0%|          | 920/300001 [8:09:58<2647:00:39, 31.86s/it]training loss: 6.758e-03:   0%|          | 920/300001 [8:10:30<2647:00:39, 31.86s/it]training loss: 6.758e-03:   0%|          | 921/300001 [8:10:30<2641:59:54, 31.80s/it]training loss: 6.758e-03:   0%|          | 922/300001 [8:11:02<2640:48:42, 31.79s/it]training loss: 6.758e-03:   0%|          | 923/300001 [8:11:35<2661:28:27, 32.04s/it]training loss: 6.758e-03:   0%|          | 924/300001 [8:12:06<2656:33:46, 31.98s/it]training loss: 6.758e-03:   0%|          | 925/300001 [8:12:38<2649:58:01, 31.90s/it]training loss: 6.758e-03:   0%|          | 926/300001 [8:13:10<2648:39:49, 31.88s/it]training loss: 6.758e-03:   0%|          | 927/300001 [8:13:41<2636:40:05, 31.74s/it]training loss: 6.758e-03:   0%|          | 928/300001 [8:14:13<2638:21:08, 31.76s/it]training loss: 6.758e-03:   0%|          | 929/300001 [8:14:45<2639:39:24, 31.77s/it]training loss: 6.758e-03:   0%|          | 930/300001 [8:15:16<2621:44:25, 31.56s/it]training loss: 6.758e-03:   0%|          | 931/300001 [8:15:46<2588:11:55, 31.15s/it]training loss: 6.758e-03:   0%|          | 932/300001 [8:16:18<2601:43:47, 31.32s/it]training loss: 6.758e-03:   0%|          | 933/300001 [8:16:50<2619:20:51, 31.53s/it]training loss: 6.758e-03:   0%|          | 934/300001 [8:17:22<2633:24:43, 31.70s/it]training loss: 6.758e-03:   0%|          | 935/300001 [8:17:53<2606:58:24, 31.38s/it]training loss: 6.758e-03:   0%|          | 936/300001 [8:18:25<2628:19:18, 31.64s/it]training loss: 6.758e-03:   0%|          | 937/300001 [8:18:56<2616:35:34, 31.50s/it]training loss: 6.758e-03:   0%|          | 938/300001 [8:19:28<2617:19:19, 31.51s/it]training loss: 6.758e-03:   0%|          | 939/300001 [8:19:58<2599:05:32, 31.29s/it]training loss: 6.758e-03:   0%|          | 940/300001 [8:20:30<2602:35:29, 31.33s/it]training loss: 7.688e-03:   0%|          | 940/300001 [8:21:02<2602:35:29, 31.33s/it]training loss: 7.688e-03:   0%|          | 941/300001 [8:21:02<2623:11:32, 31.58s/it]training loss: 7.688e-03:   0%|          | 942/300001 [8:21:24<2385:11:56, 28.71s/it]training loss: 7.688e-03:   0%|          | 943/300001 [8:21:56<2471:00:48, 29.75s/it]training loss: 7.688e-03:   0%|          | 944/300001 [8:22:27<2498:28:12, 30.08s/it]training loss: 7.688e-03:   0%|          | 945/300001 [8:22:58<2533:21:46, 30.50s/it]training loss: 7.688e-03:   0%|          | 946/300001 [8:23:31<2585:41:37, 31.13s/it]training loss: 7.688e-03:   0%|          | 947/300001 [8:24:03<2598:05:02, 31.28s/it]training loss: 7.688e-03:   0%|          | 948/300001 [8:24:34<2609:05:38, 31.41s/it]training loss: 7.688e-03:   0%|          | 949/300001 [8:25:06<2617:19:20, 31.51s/it]training loss: 7.688e-03:   0%|          | 950/300001 [8:25:39<2647:09:11, 31.87s/it]training loss: 7.688e-03:   0%|          | 951/300001 [8:26:11<2656:57:50, 31.98s/it]training loss: 7.688e-03:   0%|          | 952/300001 [8:26:43<2644:31:28, 31.84s/it]training loss: 7.688e-03:   0%|          | 953/300001 [8:27:14<2628:54:04, 31.65s/it]training loss: 7.688e-03:   0%|          | 954/300001 [8:27:44<2595:25:07, 31.24s/it]training loss: 7.688e-03:   0%|          | 955/300001 [8:28:15<2584:40:01, 31.11s/it]training loss: 7.688e-03:   0%|          | 956/300001 [8:28:47<2619:03:27, 31.53s/it]training loss: 7.688e-03:   0%|          | 957/300001 [8:29:18<2601:53:02, 31.32s/it]training loss: 7.688e-03:   0%|          | 958/300001 [8:29:50<2612:33:23, 31.45s/it]training loss: 7.688e-03:   0%|          | 959/300001 [8:30:22<2615:27:17, 31.49s/it]training loss: 7.688e-03:   0%|          | 960/300001 [8:30:53<2611:18:04, 31.44s/it]training loss: 7.087e-03:   0%|          | 960/300001 [8:31:25<2611:18:04, 31.44s/it]training loss: 7.087e-03:   0%|          | 961/300001 [8:31:25<2629:22:36, 31.65s/it]training loss: 7.087e-03:   0%|          | 962/300001 [8:31:57<2627:56:13, 31.64s/it]training loss: 7.087e-03:   0%|          | 963/300001 [8:32:28<2624:15:16, 31.59s/it]training loss: 7.087e-03:   0%|          | 964/300001 [8:33:00<2620:23:17, 31.55s/it]training loss: 7.087e-03:   0%|          | 965/300001 [8:33:31<2620:13:45, 31.54s/it]training loss: 7.087e-03:   0%|          | 966/300001 [8:34:04<2654:23:54, 31.96s/it]training loss: 7.087e-03:   0%|          | 967/300001 [8:34:36<2642:14:17, 31.81s/it]training loss: 7.087e-03:   0%|          | 968/300001 [8:35:06<2621:42:42, 31.56s/it]training loss: 7.087e-03:   0%|          | 969/300001 [8:35:37<2606:45:15, 31.38s/it]training loss: 7.087e-03:   0%|          | 970/300001 [8:36:09<2607:43:04, 31.39s/it]training loss: 7.087e-03:   0%|          | 971/300001 [8:36:41<2617:04:07, 31.51s/it]training loss: 7.087e-03:   0%|          | 972/300001 [8:37:14<2653:34:22, 31.95s/it]training loss: 7.087e-03:   0%|          | 973/300001 [8:37:45<2646:24:35, 31.86s/it]training loss: 7.087e-03:   0%|          | 974/300001 [8:38:16<2618:25:14, 31.52s/it]training loss: 7.087e-03:   0%|          | 975/300001 [8:38:48<2618:48:23, 31.53s/it]training loss: 7.087e-03:   0%|          | 976/300001 [8:39:19<2614:31:04, 31.48s/it]training loss: 7.087e-03:   0%|          | 977/300001 [8:39:50<2612:56:40, 31.46s/it]training loss: 7.087e-03:   0%|          | 978/300001 [8:40:22<2606:07:52, 31.38s/it]training loss: 7.087e-03:   0%|          | 979/300001 [8:40:54<2624:16:29, 31.59s/it]training loss: 7.087e-03:   0%|          | 980/300001 [8:41:25<2627:08:39, 31.63s/it]training loss: 6.799e-03:   0%|          | 980/300001 [8:41:55<2627:08:39, 31.63s/it]training loss: 6.799e-03:   0%|          | 981/300001 [8:41:55<2584:37:28, 31.12s/it]training loss: 6.799e-03:   0%|          | 982/300001 [8:42:26<2572:44:37, 30.97s/it]training loss: 6.799e-03:   0%|          | 983/300001 [8:42:59<2617:12:45, 31.51s/it]training loss: 6.799e-03:   0%|          | 984/300001 [8:43:30<2621:14:48, 31.56s/it]training loss: 6.799e-03:   0%|          | 985/300001 [8:44:02<2617:56:15, 31.52s/it]training loss: 6.799e-03:   0%|          | 986/300001 [8:44:33<2600:30:09, 31.31s/it]training loss: 6.799e-03:   0%|          | 987/300001 [8:45:04<2610:11:44, 31.43s/it]training loss: 6.799e-03:   0%|          | 988/300001 [8:45:35<2596:58:06, 31.27s/it]training loss: 6.799e-03:   0%|          | 989/300001 [8:46:07<2611:31:21, 31.44s/it]training loss: 6.799e-03:   0%|          | 990/300001 [8:46:39<2619:55:43, 31.54s/it]training loss: 6.799e-03:   0%|          | 991/300001 [8:47:10<2614:37:10, 31.48s/it]training loss: 6.799e-03:   0%|          | 992/300001 [8:47:42<2619:27:44, 31.54s/it]training loss: 6.799e-03:   0%|          | 993/300001 [8:48:15<2659:01:47, 32.01s/it]training loss: 6.799e-03:   0%|          | 994/300001 [8:48:46<2647:51:05, 31.88s/it]training loss: 6.799e-03:   0%|          | 995/300001 [8:49:18<2633:16:10, 31.70s/it]training loss: 6.799e-03:   0%|          | 996/300001 [8:49:49<2627:37:14, 31.64s/it]training loss: 6.799e-03:   0%|          | 997/300001 [8:50:21<2634:57:15, 31.72s/it]training loss: 6.799e-03:   0%|          | 998/300001 [8:50:52<2612:46:48, 31.46s/it]training loss: 6.799e-03:   0%|          | 999/300001 [8:51:24<2620:58:20, 31.56s/it]training loss: 6.799e-03:   0%|          | 1000/300001 [8:51:56<2635:24:49, 31.73s/it]training loss: 6.868e-03:   0%|          | 1000/300001 [8:52:29<2635:24:49, 31.73s/it]training loss: 6.868e-03:   0%|          | 1001/300001 [8:52:33<2756:43:14, 33.19s/it]training loss: 6.868e-03:   0%|          | 1002/300001 [8:53:06<2771:53:19, 33.37s/it]training loss: 6.868e-03:   0%|          | 1003/300001 [8:53:41<2797:28:45, 33.68s/it]training loss: 6.868e-03:   0%|          | 1004/300001 [8:54:13<2765:54:28, 33.30s/it]training loss: 6.868e-03:   0%|          | 1005/300001 [8:54:45<2719:51:56, 32.75s/it]training loss: 6.868e-03:   0%|          | 1006/300001 [8:55:18<2740:27:00, 33.00s/it]training loss: 6.868e-03:   0%|          | 1007/300001 [8:55:48<2668:51:37, 32.13s/it]training loss: 6.868e-03:   0%|          | 1008/300001 [8:56:20<2659:37:21, 32.02s/it]training loss: 6.868e-03:   0%|          | 1009/300001 [8:56:53<2686:19:59, 32.34s/it]training loss: 6.868e-03:   0%|          | 1010/300001 [8:57:25<2661:59:53, 32.05s/it]training loss: 6.868e-03:   0%|          | 1011/300001 [8:57:56<2643:39:09, 31.83s/it]training loss: 6.868e-03:   0%|          | 1012/300001 [8:58:28<2649:41:05, 31.90s/it]training loss: 6.868e-03:   0%|          | 1013/300001 [8:59:00<2652:11:31, 31.93s/it]training loss: 6.868e-03:   0%|          | 1014/300001 [8:59:32<2664:31:07, 32.08s/it]training loss: 6.868e-03:   0%|          | 1015/300001 [9:00:04<2661:42:06, 32.05s/it]training loss: 6.868e-03:   0%|          | 1016/300001 [9:00:36<2656:51:55, 31.99s/it]training loss: 6.868e-03:   0%|          | 1017/300001 [9:01:09<2671:56:20, 32.17s/it]training loss: 6.868e-03:   0%|          | 1018/300001 [9:01:41<2663:10:08, 32.07s/it]training loss: 6.868e-03:   0%|          | 1019/300001 [9:02:12<2648:43:36, 31.89s/it]training loss: 6.868e-03:   0%|          | 1020/300001 [9:02:45<2661:52:58, 32.05s/it]training loss: 7.189e-03:   0%|          | 1020/300001 [9:03:16<2661:52:58, 32.05s/it]training loss: 7.189e-03:   0%|          | 1021/300001 [9:03:16<2657:09:33, 31.99s/it]training loss: 7.189e-03:   0%|          | 1022/300001 [9:03:48<2641:39:19, 31.81s/it]training loss: 7.189e-03:   0%|          | 1023/300001 [9:04:20<2640:25:08, 31.79s/it]training loss: 7.189e-03:   0%|          | 1024/300001 [9:04:52<2661:43:37, 32.05s/it]training loss: 7.189e-03:   0%|          | 1025/300001 [9:05:25<2671:07:06, 32.16s/it]training loss: 7.189e-03:   0%|          | 1026/300001 [9:05:56<2655:29:40, 31.98s/it]training loss: 7.189e-03:   0%|          | 1027/300001 [9:06:28<2659:51:19, 32.03s/it]training loss: 7.189e-03:   0%|          | 1028/300001 [9:06:59<2638:30:11, 31.77s/it]training loss: 7.189e-03:   0%|          | 1029/300001 [9:07:32<2667:14:22, 32.12s/it]training loss: 7.189e-03:   0%|          | 1030/300001 [9:08:05<2677:26:28, 32.24s/it]training loss: 7.189e-03:   0%|          | 1031/300001 [9:08:37<2678:16:20, 32.25s/it]training loss: 7.189e-03:   0%|          | 1032/300001 [9:09:08<2654:10:10, 31.96s/it]training loss: 7.189e-03:   0%|          | 1033/300001 [9:09:42<2690:08:26, 32.39s/it]training loss: 7.189e-03:   0%|          | 1034/300001 [9:10:15<2704:58:16, 32.57s/it]training loss: 7.189e-03:   0%|          | 1035/300001 [9:10:47<2702:32:59, 32.54s/it]training loss: 7.189e-03:   0%|          | 1036/300001 [9:11:19<2677:09:30, 32.24s/it]training loss: 7.189e-03:   0%|          | 1037/300001 [9:11:51<2666:58:05, 32.11s/it]training loss: 7.189e-03:   0%|          | 1038/300001 [9:12:22<2656:10:50, 31.98s/it]training loss: 7.189e-03:   0%|          | 1039/300001 [9:12:55<2667:48:52, 32.12s/it]training loss: 7.189e-03:   0%|          | 1040/300001 [9:13:27<2667:36:49, 32.12s/it]training loss: 6.749e-03:   0%|          | 1040/300001 [9:13:59<2667:36:49, 32.12s/it]training loss: 6.749e-03:   0%|          | 1041/300001 [9:13:59<2663:21:34, 32.07s/it]training loss: 6.749e-03:   0%|          | 1042/300001 [9:14:31<2658:52:31, 32.02s/it]training loss: 6.749e-03:   0%|          | 1043/300001 [9:15:03<2661:48:50, 32.05s/it]training loss: 6.749e-03:   0%|          | 1044/300001 [9:15:35<2662:22:25, 32.06s/it]training loss: 6.749e-03:   0%|          | 1045/300001 [9:16:08<2680:56:03, 32.28s/it]training loss: 6.749e-03:   0%|          | 1046/300001 [9:16:40<2676:36:10, 32.23s/it]training loss: 6.749e-03:   0%|          | 1047/300001 [9:17:13<2697:59:30, 32.49s/it]training loss: 6.749e-03:   0%|          | 1048/300001 [9:17:45<2682:19:36, 32.30s/it]training loss: 6.749e-03:   0%|          | 1049/300001 [9:18:17<2689:24:09, 32.39s/it]training loss: 6.749e-03:   0%|          | 1050/300001 [9:18:50<2681:38:11, 32.29s/it]training loss: 6.749e-03:   0%|          | 1051/300001 [9:19:22<2674:36:34, 32.21s/it]training loss: 6.749e-03:   0%|          | 1052/300001 [9:19:53<2662:13:26, 32.06s/it]training loss: 6.749e-03:   0%|          | 1053/300001 [9:20:25<2650:18:36, 31.92s/it]training loss: 6.749e-03:   0%|          | 1054/300001 [9:20:57<2645:16:34, 31.86s/it]training loss: 6.749e-03:   0%|          | 1055/300001 [9:21:28<2632:28:45, 31.70s/it]training loss: 6.749e-03:   0%|          | 1056/300001 [9:21:59<2628:16:32, 31.65s/it]training loss: 6.749e-03:   0%|          | 1057/300001 [9:22:32<2645:12:53, 31.85s/it]training loss: 6.749e-03:   0%|          | 1058/300001 [9:23:04<2646:52:21, 31.87s/it]training loss: 6.749e-03:   0%|          | 1059/300001 [9:23:36<2657:50:05, 32.01s/it]training loss: 6.749e-03:   0%|          | 1060/300001 [9:24:08<2663:21:46, 32.07s/it]training loss: 7.298e-03:   0%|          | 1060/300001 [9:24:41<2663:21:46, 32.07s/it]training loss: 7.298e-03:   0%|          | 1061/300001 [9:24:41<2682:20:42, 32.30s/it]training loss: 7.298e-03:   0%|          | 1062/300001 [9:25:13<2680:29:27, 32.28s/it]training loss: 7.298e-03:   0%|          | 1063/300001 [9:25:44<2653:33:20, 31.96s/it]training loss: 7.298e-03:   0%|          | 1064/300001 [9:26:15<2622:24:54, 31.58s/it]training loss: 7.298e-03:   0%|          | 1065/300001 [9:26:47<2621:47:10, 31.57s/it]training loss: 7.298e-03:   0%|          | 1066/300001 [9:27:19<2646:43:07, 31.87s/it]training loss: 7.298e-03:   0%|          | 1067/300001 [9:27:51<2648:23:56, 31.89s/it]training loss: 7.298e-03:   0%|          | 1068/300001 [9:28:23<2643:51:49, 31.84s/it]training loss: 7.298e-03:   0%|          | 1069/300001 [9:28:56<2664:29:41, 32.09s/it]training loss: 7.298e-03:   0%|          | 1070/300001 [9:29:26<2631:50:59, 31.70s/it]training loss: 7.298e-03:   0%|          | 1071/300001 [9:29:58<2620:50:45, 31.56s/it]training loss: 7.298e-03:   0%|          | 1072/300001 [9:30:30<2628:22:50, 31.65s/it]training loss: 7.298e-03:   0%|          | 1073/300001 [9:31:01<2625:42:25, 31.62s/it]training loss: 7.298e-03:   0%|          | 1074/300001 [9:31:34<2660:08:42, 32.04s/it]training loss: 7.298e-03:   0%|          | 1075/300001 [9:32:06<2650:38:13, 31.92s/it]training loss: 7.298e-03:   0%|          | 1076/300001 [9:32:39<2676:34:42, 32.23s/it]training loss: 7.298e-03:   0%|          | 1077/300001 [9:33:10<2645:12:47, 31.86s/it]training loss: 7.298e-03:   0%|          | 1078/300001 [9:33:41<2621:03:03, 31.57s/it]training loss: 7.298e-03:   0%|          | 1079/300001 [9:34:12<2629:43:24, 31.67s/it]training loss: 7.298e-03:   0%|          | 1080/300001 [9:34:43<2611:33:10, 31.45s/it]training loss: 6.152e-03:   0%|          | 1080/300001 [9:35:15<2611:33:10, 31.45s/it]training loss: 6.152e-03:   0%|          | 1081/300001 [9:35:16<2627:59:05, 31.65s/it]training loss: 6.152e-03:   0%|          | 1082/300001 [9:35:48<2641:42:37, 31.82s/it]training loss: 6.152e-03:   0%|          | 1083/300001 [9:36:19<2629:14:22, 31.67s/it]training loss: 6.152e-03:   0%|          | 1084/300001 [9:36:51<2644:42:26, 31.85s/it]training loss: 6.152e-03:   0%|          | 1085/300001 [9:37:24<2655:40:51, 31.98s/it]training loss: 6.152e-03:   0%|          | 1086/300001 [9:37:56<2657:11:15, 32.00s/it]training loss: 6.152e-03:   0%|          | 1087/300001 [9:38:28<2656:39:57, 32.00s/it]training loss: 6.152e-03:   0%|          | 1088/300001 [9:38:59<2650:53:26, 31.93s/it]training loss: 6.152e-03:   0%|          | 1089/300001 [9:39:31<2639:02:18, 31.78s/it]training loss: 6.152e-03:   0%|          | 1090/300001 [9:40:03<2660:24:48, 32.04s/it]training loss: 6.152e-03:   0%|          | 1091/300001 [9:40:34<2633:51:57, 31.72s/it]training loss: 6.152e-03:   0%|          | 1092/300001 [9:41:05<2615:36:54, 31.50s/it]training loss: 6.152e-03:   0%|          | 1093/300001 [9:41:37<2619:41:29, 31.55s/it]training loss: 6.152e-03:   0%|          | 1094/300001 [9:42:08<2603:22:18, 31.35s/it]training loss: 6.152e-03:   0%|          | 1095/300001 [9:42:40<2618:38:28, 31.54s/it]training loss: 6.152e-03:   0%|          | 1096/300001 [9:43:13<2653:34:29, 31.96s/it]training loss: 6.152e-03:   0%|          | 1097/300001 [9:43:45<2646:49:24, 31.88s/it]training loss: 6.152e-03:   0%|          | 1098/300001 [9:44:17<2651:35:54, 31.94s/it]training loss: 6.152e-03:   0%|          | 1099/300001 [9:44:39<2402:43:27, 28.94s/it]training loss: 6.152e-03:   0%|          | 1100/300001 [9:45:11<2475:59:26, 29.82s/it]training loss: 7.918e-03:   0%|          | 1100/300001 [9:45:42<2475:59:26, 29.82s/it]training loss: 7.918e-03:   0%|          | 1101/300001 [9:45:42<2518:36:51, 30.33s/it]training loss: 7.918e-03:   0%|          | 1102/300001 [9:46:14<2557:13:51, 30.80s/it]training loss: 7.918e-03:   0%|          | 1103/300001 [9:46:46<2584:02:51, 31.12s/it]training loss: 7.918e-03:   0%|          | 1104/300001 [9:47:18<2619:35:08, 31.55s/it]training loss: 7.918e-03:   0%|          | 1105/300001 [9:47:50<2626:04:21, 31.63s/it]training loss: 7.918e-03:   0%|          | 1106/300001 [9:48:23<2649:12:23, 31.91s/it]training loss: 7.918e-03:   0%|          | 1107/300001 [9:48:55<2659:48:17, 32.04s/it]training loss: 7.918e-03:   0%|          | 1108/300001 [9:49:27<2647:32:22, 31.89s/it]training loss: 7.918e-03:   0%|          | 1109/300001 [9:49:59<2666:59:44, 32.12s/it]training loss: 7.918e-03:   0%|          | 1110/300001 [9:50:32<2670:02:08, 32.16s/it]training loss: 7.918e-03:   0%|          | 1111/300001 [9:51:03<2661:36:10, 32.06s/it]training loss: 7.918e-03:   0%|          | 1112/300001 [9:51:35<2647:49:47, 31.89s/it]training loss: 7.918e-03:   0%|          | 1113/300001 [9:52:07<2645:10:47, 31.86s/it]training loss: 7.918e-03:   0%|          | 1114/300001 [9:52:37<2613:10:21, 31.47s/it]training loss: 7.918e-03:   0%|          | 1115/300001 [9:53:10<2651:59:20, 31.94s/it]training loss: 7.918e-03:   0%|          | 1116/300001 [9:53:41<2626:32:50, 31.64s/it]training loss: 7.918e-03:   0%|          | 1117/300001 [9:54:14<2648:21:01, 31.90s/it]training loss: 7.918e-03:   0%|          | 1118/300001 [9:54:46<2669:11:01, 32.15s/it]training loss: 7.918e-03:   0%|          | 1119/300001 [9:55:18<2659:08:25, 32.03s/it]training loss: 7.918e-03:   0%|          | 1120/300001 [9:55:51<2671:27:22, 32.18s/it]training loss: 6.347e-03:   0%|          | 1120/300001 [9:56:22<2671:27:22, 32.18s/it]training loss: 6.347e-03:   0%|          | 1121/300001 [9:56:22<2652:59:41, 31.96s/it]training loss: 6.347e-03:   0%|          | 1122/300001 [9:56:55<2665:44:44, 32.11s/it]training loss: 6.347e-03:   0%|          | 1123/300001 [9:57:26<2646:18:02, 31.87s/it]training loss: 6.347e-03:   0%|          | 1124/300001 [9:57:58<2644:46:19, 31.86s/it]training loss: 6.347e-03:   0%|          | 1125/300001 [9:58:30<2662:31:23, 32.07s/it]training loss: 6.347e-03:   0%|          | 1126/300001 [9:59:02<2665:04:25, 32.10s/it]training loss: 6.347e-03:   0%|          | 1127/300001 [9:59:36<2690:20:30, 32.41s/it]training loss: 6.347e-03:   0%|          | 1128/300001 [10:00:08<2698:31:16, 32.50s/it]training loss: 6.347e-03:   0%|          | 1129/300001 [10:00:40<2674:07:19, 32.21s/it]training loss: 6.347e-03:   0%|          | 1130/300001 [10:01:11<2652:28:00, 31.95s/it]training loss: 6.347e-03:   0%|          | 1131/300001 [10:01:42<2620:56:39, 31.57s/it]training loss: 6.347e-03:   0%|          | 1132/300001 [10:02:14<2628:40:34, 31.66s/it]training loss: 6.347e-03:   0%|          | 1133/300001 [10:02:47<2657:31:45, 32.01s/it]training loss: 6.347e-03:   0%|          | 1134/300001 [10:03:19<2660:28:45, 32.05s/it]training loss: 6.347e-03:   0%|          | 1135/300001 [10:03:50<2631:23:54, 31.70s/it]training loss: 6.347e-03:   0%|          | 1136/300001 [10:04:21<2628:58:34, 31.67s/it]training loss: 6.347e-03:   0%|          | 1137/300001 [10:04:54<2651:52:19, 31.94s/it]training loss: 6.347e-03:   0%|          | 1138/300001 [10:05:26<2649:15:00, 31.91s/it]training loss: 6.347e-03:   0%|          | 1139/300001 [10:05:58<2671:29:47, 32.18s/it]training loss: 6.347e-03:   0%|          | 1140/300001 [10:06:29<2640:00:24, 31.80s/it]training loss: 6.066e-03:   0%|          | 1140/300001 [10:07:01<2640:00:24, 31.80s/it]training loss: 6.066e-03:   0%|          | 1141/300001 [10:07:01<2641:56:25, 31.82s/it]training loss: 6.066e-03:   0%|          | 1142/300001 [10:07:34<2667:41:00, 32.13s/it]training loss: 6.066e-03:   0%|          | 1143/300001 [10:08:06<2654:53:15, 31.98s/it]training loss: 6.066e-03:   0%|          | 1144/300001 [10:08:37<2642:22:17, 31.83s/it]training loss: 6.066e-03:   0%|          | 1145/300001 [10:09:09<2647:49:26, 31.90s/it]training loss: 6.066e-03:   0%|          | 1146/300001 [10:09:41<2649:41:38, 31.92s/it]training loss: 6.066e-03:   0%|          | 1147/300001 [10:10:13<2654:17:40, 31.97s/it]training loss: 6.066e-03:   0%|          | 1148/300001 [10:10:45<2652:45:46, 31.96s/it]training loss: 6.066e-03:   0%|          | 1149/300001 [10:11:18<2665:17:55, 32.11s/it]training loss: 6.066e-03:   0%|          | 1150/300001 [10:11:50<2666:55:47, 32.13s/it]training loss: 6.066e-03:   0%|          | 1151/300001 [10:12:22<2664:38:58, 32.10s/it]training loss: 6.066e-03:   0%|          | 1152/300001 [10:12:54<2672:10:22, 32.19s/it]training loss: 6.066e-03:   0%|          | 1153/300001 [10:13:26<2659:58:32, 32.04s/it]training loss: 6.066e-03:   0%|          | 1154/300001 [10:13:58<2666:55:18, 32.13s/it]training loss: 6.066e-03:   0%|          | 1155/300001 [10:14:30<2665:56:03, 32.11s/it]training loss: 6.066e-03:   0%|          | 1156/300001 [10:15:02<2643:10:29, 31.84s/it]training loss: 6.066e-03:   0%|          | 1157/300001 [10:15:34<2646:20:30, 31.88s/it]training loss: 6.066e-03:   0%|          | 1158/300001 [10:16:05<2640:23:22, 31.81s/it]training loss: 6.066e-03:   0%|          | 1159/300001 [10:16:37<2634:42:42, 31.74s/it]training loss: 6.066e-03:   0%|          | 1160/300001 [10:17:09<2637:50:20, 31.78s/it]training loss: 7.023e-03:   0%|          | 1160/300001 [10:17:40<2637:50:20, 31.78s/it]training loss: 7.023e-03:   0%|          | 1161/300001 [10:17:40<2617:02:24, 31.53s/it]training loss: 7.023e-03:   0%|          | 1162/300001 [10:18:11<2623:47:09, 31.61s/it]training loss: 7.023e-03:   0%|          | 1163/300001 [10:18:43<2611:56:22, 31.47s/it]training loss: 7.023e-03:   0%|          | 1164/300001 [10:19:15<2639:18:39, 31.79s/it]training loss: 7.023e-03:   0%|          | 1165/300001 [10:19:47<2635:55:01, 31.75s/it]training loss: 7.023e-03:   0%|          | 1166/300001 [10:20:19<2650:33:46, 31.93s/it]training loss: 7.023e-03:   0%|          | 1167/300001 [10:20:51<2660:20:40, 32.05s/it]training loss: 7.023e-03:   0%|          | 1168/300001 [10:21:23<2646:25:51, 31.88s/it]training loss: 7.023e-03:   0%|          | 1169/300001 [10:21:54<2637:17:33, 31.77s/it]training loss: 7.023e-03:   0%|          | 1170/300001 [10:22:26<2625:06:30, 31.62s/it]training loss: 7.023e-03:   0%|          | 1171/300001 [10:22:57<2624:09:33, 31.61s/it]training loss: 7.023e-03:   0%|          | 1172/300001 [10:23:28<2611:18:30, 31.46s/it]training loss: 7.023e-03:   0%|          | 1173/300001 [10:24:00<2621:12:59, 31.58s/it]training loss: 7.023e-03:   0%|          | 1174/300001 [10:24:33<2656:12:08, 32.00s/it]training loss: 7.023e-03:   0%|          | 1175/300001 [10:25:07<2688:47:36, 32.39s/it]training loss: 7.023e-03:   0%|          | 1176/300001 [10:25:38<2669:31:31, 32.16s/it]training loss: 7.023e-03:   0%|          | 1177/300001 [10:26:11<2687:51:22, 32.38s/it]training loss: 7.023e-03:   0%|          | 1178/300001 [10:26:43<2674:24:52, 32.22s/it]training loss: 7.023e-03:   0%|          | 1179/300001 [10:27:14<2659:33:02, 32.04s/it]training loss: 7.023e-03:   0%|          | 1180/300001 [10:27:47<2680:34:17, 32.29s/it]training loss: 6.463e-03:   0%|          | 1180/300001 [10:28:18<2680:34:17, 32.29s/it]training loss: 6.463e-03:   0%|          | 1181/300001 [10:28:18<2639:31:46, 31.80s/it]training loss: 6.463e-03:   0%|          | 1182/300001 [10:28:49<2623:27:30, 31.61s/it]training loss: 6.463e-03:   0%|          | 1183/300001 [10:29:21<2625:19:52, 31.63s/it]training loss: 6.463e-03:   0%|          | 1184/300001 [10:29:52<2612:01:29, 31.47s/it]training loss: 6.463e-03:   0%|          | 1185/300001 [10:30:24<2626:04:30, 31.64s/it]training loss: 6.463e-03:   0%|          | 1186/300001 [10:30:57<2657:36:18, 32.02s/it]training loss: 6.463e-03:   0%|          | 1187/300001 [10:31:28<2645:28:51, 31.87s/it]training loss: 6.463e-03:   0%|          | 1188/300001 [10:31:59<2623:33:10, 31.61s/it]training loss: 6.463e-03:   0%|          | 1189/300001 [10:32:32<2646:16:29, 31.88s/it]training loss: 6.463e-03:   0%|          | 1190/300001 [10:33:06<2691:15:05, 32.42s/it]training loss: 6.463e-03:   0%|          | 1191/300001 [10:33:37<2657:56:35, 32.02s/it]training loss: 6.463e-03:   0%|          | 1192/300001 [10:34:08<2640:01:04, 31.81s/it]training loss: 6.463e-03:   0%|          | 1193/300001 [10:34:39<2626:10:46, 31.64s/it]training loss: 6.463e-03:   0%|          | 1194/300001 [10:35:10<2612:44:10, 31.48s/it]training loss: 6.463e-03:   0%|          | 1195/300001 [10:35:42<2613:43:03, 31.49s/it]training loss: 6.463e-03:   0%|          | 1196/300001 [10:36:13<2596:00:55, 31.28s/it]training loss: 6.463e-03:   0%|          | 1197/300001 [10:36:45<2610:57:37, 31.46s/it]training loss: 6.463e-03:   0%|          | 1198/300001 [10:37:16<2622:25:29, 31.60s/it]training loss: 6.463e-03:   0%|          | 1199/300001 [10:37:49<2644:38:35, 31.86s/it]training loss: 6.463e-03:   0%|          | 1200/300001 [10:38:22<2666:13:43, 32.12s/it]training loss: 6.668e-03:   0%|          | 1200/300001 [10:38:52<2666:13:43, 32.12s/it]training loss: 6.668e-03:   0%|          | 1201/300001 [10:38:53<2635:08:10, 31.75s/it]training loss: 6.668e-03:   0%|          | 1202/300001 [10:39:25<2644:28:13, 31.86s/it]training loss: 6.668e-03:   0%|          | 1203/300001 [10:39:56<2641:00:30, 31.82s/it]training loss: 6.668e-03:   0%|          | 1204/300001 [10:40:28<2632:00:45, 31.71s/it]training loss: 6.668e-03:   0%|          | 1205/300001 [10:40:59<2620:29:04, 31.57s/it]training loss: 6.668e-03:   0%|          | 1206/300001 [10:41:31<2618:26:47, 31.55s/it]training loss: 6.668e-03:   0%|          | 1207/300001 [10:42:04<2661:05:37, 32.06s/it]training loss: 6.668e-03:   0%|          | 1208/300001 [10:42:34<2612:24:42, 31.48s/it]training loss: 6.668e-03:   0%|          | 1209/300001 [10:43:06<2630:19:20, 31.69s/it]training loss: 6.668e-03:   0%|          | 1210/300001 [10:43:38<2634:54:21, 31.75s/it]training loss: 6.668e-03:   0%|          | 1211/300001 [10:44:09<2621:52:30, 31.59s/it]training loss: 6.668e-03:   0%|          | 1212/300001 [10:44:41<2621:16:13, 31.58s/it]training loss: 6.668e-03:   0%|          | 1213/300001 [10:45:11<2595:18:12, 31.27s/it]training loss: 6.668e-03:   0%|          | 1214/300001 [10:45:42<2587:08:38, 31.17s/it]training loss: 6.668e-03:   0%|          | 1215/300001 [10:46:14<2612:11:56, 31.47s/it]training loss: 6.668e-03:   0%|          | 1216/300001 [10:46:46<2613:45:14, 31.49s/it]training loss: 6.668e-03:   0%|          | 1217/300001 [10:47:18<2623:44:31, 31.61s/it]training loss: 6.668e-03:   0%|          | 1218/300001 [10:47:50<2644:11:33, 31.86s/it]training loss: 6.668e-03:   0%|          | 1219/300001 [10:48:24<2685:27:22, 32.36s/it]training loss: 6.668e-03:   0%|          | 1220/300001 [10:48:55<2665:27:34, 32.12s/it]training loss: 6.024e-03:   0%|          | 1220/300001 [10:49:28<2665:27:34, 32.12s/it]training loss: 6.024e-03:   0%|          | 1221/300001 [10:49:28<2680:52:42, 32.30s/it]training loss: 6.024e-03:   0%|          | 1222/300001 [10:50:00<2679:36:45, 32.29s/it]training loss: 6.024e-03:   0%|          | 1223/300001 [10:50:31<2646:14:18, 31.88s/it]training loss: 6.024e-03:   0%|          | 1224/300001 [10:51:03<2647:25:46, 31.90s/it]training loss: 6.024e-03:   0%|          | 1225/300001 [10:51:36<2656:57:21, 32.01s/it]training loss: 6.024e-03:   0%|          | 1226/300001 [10:52:07<2647:15:17, 31.90s/it]training loss: 6.024e-03:   0%|          | 1227/300001 [10:52:38<2625:38:52, 31.64s/it]training loss: 6.024e-03:   0%|          | 1228/300001 [10:53:10<2631:27:34, 31.71s/it]training loss: 6.024e-03:   0%|          | 1229/300001 [10:53:42<2647:11:57, 31.90s/it]training loss: 6.024e-03:   0%|          | 1230/300001 [10:54:14<2628:05:57, 31.67s/it]training loss: 6.024e-03:   0%|          | 1231/300001 [10:54:45<2621:54:11, 31.59s/it]training loss: 6.024e-03:   0%|          | 1232/300001 [10:55:16<2611:15:02, 31.46s/it]training loss: 6.024e-03:   0%|          | 1233/300001 [10:55:47<2605:44:18, 31.40s/it]training loss: 6.024e-03:   0%|          | 1234/300001 [10:56:19<2604:19:27, 31.38s/it]training loss: 6.024e-03:   0%|          | 1235/300001 [10:56:50<2602:14:21, 31.36s/it]training loss: 6.024e-03:   0%|          | 1236/300001 [10:57:23<2630:54:27, 31.70s/it]training loss: 6.024e-03:   0%|          | 1237/300001 [10:57:54<2630:20:14, 31.69s/it]training loss: 6.024e-03:   0%|          | 1238/300001 [10:58:25<2611:02:07, 31.46s/it]training loss: 6.024e-03:   0%|          | 1239/300001 [10:58:57<2611:42:40, 31.47s/it]training loss: 6.024e-03:   0%|          | 1240/300001 [10:59:28<2598:26:58, 31.31s/it]training loss: 6.547e-03:   0%|          | 1240/300001 [11:00:00<2598:26:58, 31.31s/it]training loss: 6.547e-03:   0%|          | 1241/300001 [11:00:00<2618:23:06, 31.55s/it]training loss: 6.547e-03:   0%|          | 1242/300001 [11:00:31<2613:24:34, 31.49s/it]training loss: 6.547e-03:   0%|          | 1243/300001 [11:01:03<2615:48:17, 31.52s/it]training loss: 6.547e-03:   0%|          | 1244/300001 [11:01:34<2614:12:47, 31.50s/it]training loss: 6.547e-03:   0%|          | 1245/300001 [11:02:08<2665:59:05, 32.13s/it]training loss: 6.547e-03:   0%|          | 1246/300001 [11:02:40<2672:50:37, 32.21s/it]training loss: 6.547e-03:   0%|          | 1247/300001 [11:03:12<2657:22:09, 32.02s/it]training loss: 6.547e-03:   0%|          | 1248/300001 [11:03:43<2642:32:54, 31.84s/it]training loss: 6.547e-03:   0%|          | 1249/300001 [11:04:14<2624:06:38, 31.62s/it]training loss: 6.547e-03:   0%|          | 1250/300001 [11:04:46<2632:10:17, 31.72s/it]training loss: 6.547e-03:   0%|          | 1251/300001 [11:05:18<2625:52:28, 31.64s/it]training loss: 6.547e-03:   0%|          | 1252/300001 [11:05:50<2642:16:54, 31.84s/it]training loss: 6.547e-03:   0%|          | 1253/300001 [11:06:23<2666:06:42, 32.13s/it]training loss: 6.547e-03:   0%|          | 1254/300001 [11:06:54<2652:47:51, 31.97s/it]training loss: 6.547e-03:   0%|          | 1255/300001 [11:07:25<2629:41:33, 31.69s/it]training loss: 6.547e-03:   0%|          | 1256/300001 [11:07:48<2395:42:14, 28.87s/it]training loss: 6.547e-03:   0%|          | 1257/300001 [11:08:18<2444:31:54, 29.46s/it]training loss: 6.547e-03:   0%|          | 1258/300001 [11:08:51<2528:23:57, 30.47s/it]training loss: 6.547e-03:   0%|          | 1259/300001 [11:09:23<2557:37:17, 30.82s/it]training loss: 6.547e-03:   0%|          | 1260/300001 [11:09:55<2578:09:23, 31.07s/it]training loss: 7.577e-03:   0%|          | 1260/300001 [11:10:26<2578:09:23, 31.07s/it]training loss: 7.577e-03:   0%|          | 1261/300001 [11:10:26<2596:13:22, 31.29s/it]training loss: 7.577e-03:   0%|          | 1262/300001 [11:10:58<2602:54:40, 31.37s/it]training loss: 7.577e-03:   0%|          | 1263/300001 [11:11:29<2585:22:22, 31.16s/it]training loss: 7.577e-03:   0%|          | 1264/300001 [11:12:00<2600:48:53, 31.34s/it]training loss: 7.577e-03:   0%|          | 1265/300001 [11:12:32<2602:11:06, 31.36s/it]training loss: 7.577e-03:   0%|          | 1266/300001 [11:13:03<2603:27:37, 31.37s/it]training loss: 7.577e-03:   0%|          | 1267/300001 [11:13:34<2602:14:05, 31.36s/it]training loss: 7.577e-03:   0%|          | 1268/300001 [11:14:06<2602:53:06, 31.37s/it]training loss: 7.577e-03:   0%|          | 1269/300001 [11:14:38<2623:12:25, 31.61s/it]training loss: 7.577e-03:   0%|          | 1270/300001 [11:15:10<2638:35:33, 31.80s/it]training loss: 7.577e-03:   0%|          | 1271/300001 [11:15:42<2648:44:11, 31.92s/it]training loss: 7.577e-03:   0%|          | 1272/300001 [11:16:15<2656:21:56, 32.01s/it]training loss: 7.577e-03:   0%|          | 1273/300001 [11:16:46<2632:13:17, 31.72s/it]training loss: 7.577e-03:   0%|          | 1274/300001 [11:17:17<2627:37:31, 31.67s/it]training loss: 7.577e-03:   0%|          | 1275/300001 [11:17:49<2638:24:03, 31.80s/it]training loss: 7.577e-03:   0%|          | 1276/300001 [11:18:21<2638:53:26, 31.80s/it]training loss: 7.577e-03:   0%|          | 1277/300001 [11:18:53<2632:52:13, 31.73s/it]training loss: 7.577e-03:   0%|          | 1278/300001 [11:19:25<2642:08:24, 31.84s/it]training loss: 7.577e-03:   0%|          | 1279/300001 [11:19:57<2656:01:13, 32.01s/it]training loss: 7.577e-03:   0%|          | 1280/300001 [11:20:30<2679:01:11, 32.29s/it]training loss: 6.906e-03:   0%|          | 1280/300001 [11:21:02<2679:01:11, 32.29s/it]training loss: 6.906e-03:   0%|          | 1281/300001 [11:21:02<2677:09:16, 32.26s/it]training loss: 6.906e-03:   0%|          | 1282/300001 [11:21:35<2691:57:08, 32.44s/it]training loss: 6.906e-03:   0%|          | 1283/300001 [11:22:07<2678:39:30, 32.28s/it]training loss: 6.906e-03:   0%|          | 1284/300001 [11:22:39<2665:29:02, 32.12s/it]training loss: 6.906e-03:   0%|          | 1285/300001 [11:23:11<2663:35:47, 32.10s/it]training loss: 6.906e-03:   0%|          | 1286/300001 [11:23:43<2651:29:36, 31.95s/it]training loss: 6.906e-03:   0%|          | 1287/300001 [11:24:14<2637:41:22, 31.79s/it]training loss: 6.906e-03:   0%|          | 1288/300001 [11:24:46<2653:26:19, 31.98s/it]training loss: 6.906e-03:   0%|          | 1289/300001 [11:25:18<2649:30:00, 31.93s/it]training loss: 6.906e-03:   0%|          | 1290/300001 [11:25:51<2671:21:19, 32.19s/it]training loss: 6.906e-03:   0%|          | 1291/300001 [11:26:23<2667:57:14, 32.15s/it]training loss: 6.906e-03:   0%|          | 1292/300001 [11:26:54<2646:28:22, 31.89s/it]training loss: 6.906e-03:   0%|          | 1293/300001 [11:27:26<2628:50:32, 31.68s/it]training loss: 6.906e-03:   0%|          | 1294/300001 [11:27:57<2626:32:59, 31.66s/it]training loss: 6.906e-03:   0%|          | 1295/300001 [11:28:29<2631:49:08, 31.72s/it]training loss: 6.906e-03:   0%|          | 1296/300001 [11:29:00<2618:14:04, 31.56s/it]training loss: 6.906e-03:   0%|          | 1297/300001 [11:29:33<2639:00:33, 31.81s/it]training loss: 6.906e-03:   0%|          | 1298/300001 [11:30:05<2651:52:38, 31.96s/it]training loss: 6.906e-03:   0%|          | 1299/300001 [11:30:37<2656:39:59, 32.02s/it]training loss: 6.906e-03:   0%|          | 1300/300001 [11:31:09<2662:05:22, 32.08s/it]training loss: 6.712e-03:   0%|          | 1300/300001 [11:31:40<2662:05:22, 32.08s/it]training loss: 6.712e-03:   0%|          | 1301/300001 [11:31:40<2637:10:13, 31.78s/it]training loss: 6.712e-03:   0%|          | 1302/300001 [11:32:11<2612:41:02, 31.49s/it]training loss: 6.712e-03:   0%|          | 1303/300001 [11:32:42<2597:12:50, 31.30s/it]training loss: 6.712e-03:   0%|          | 1304/300001 [11:33:13<2596:30:47, 31.29s/it]training loss: 6.712e-03:   0%|          | 1305/300001 [11:33:45<2607:09:53, 31.42s/it]training loss: 6.712e-03:   0%|          | 1306/300001 [11:34:18<2633:15:12, 31.74s/it]training loss: 6.712e-03:   0%|          | 1307/300001 [11:34:51<2669:52:48, 32.18s/it]training loss: 6.712e-03:   0%|          | 1308/300001 [11:35:23<2660:57:02, 32.07s/it]training loss: 6.712e-03:   0%|          | 1309/300001 [11:35:55<2676:23:16, 32.26s/it]training loss: 6.712e-03:   0%|          | 1310/300001 [11:36:26<2647:17:11, 31.91s/it]training loss: 6.712e-03:   0%|          | 1311/300001 [11:36:59<2661:58:12, 32.08s/it]training loss: 6.712e-03:   0%|          | 1312/300001 [11:37:31<2659:02:50, 32.05s/it]training loss: 6.712e-03:   0%|          | 1313/300001 [11:38:02<2643:32:15, 31.86s/it]training loss: 6.712e-03:   0%|          | 1314/300001 [11:38:33<2625:16:16, 31.64s/it]training loss: 6.712e-03:   0%|          | 1315/300001 [11:39:06<2642:20:23, 31.85s/it]training loss: 6.712e-03:   0%|          | 1316/300001 [11:39:38<2642:47:01, 31.85s/it]training loss: 6.712e-03:   0%|          | 1317/300001 [11:40:08<2620:13:34, 31.58s/it]training loss: 6.712e-03:   0%|          | 1318/300001 [11:40:40<2621:23:06, 31.60s/it]training loss: 6.712e-03:   0%|          | 1319/300001 [11:41:12<2634:22:49, 31.75s/it]training loss: 6.712e-03:   0%|          | 1320/300001 [11:41:44<2639:17:19, 31.81s/it]training loss: 5.921e-03:   0%|          | 1320/300001 [11:42:17<2639:17:19, 31.81s/it]training loss: 5.921e-03:   0%|          | 1321/300001 [11:42:17<2658:25:48, 32.04s/it]training loss: 5.921e-03:   0%|          | 1322/300001 [11:42:49<2653:43:28, 31.99s/it]training loss: 5.921e-03:   0%|          | 1323/300001 [11:43:22<2694:18:54, 32.47s/it]training loss: 5.921e-03:   0%|          | 1324/300001 [11:43:54<2666:37:42, 32.14s/it]training loss: 5.921e-03:   0%|          | 1325/300001 [11:44:25<2654:18:59, 31.99s/it]training loss: 5.921e-03:   0%|          | 1326/300001 [11:44:57<2638:19:45, 31.80s/it]training loss: 5.921e-03:   0%|          | 1327/300001 [11:45:28<2633:05:00, 31.74s/it]training loss: 5.921e-03:   0%|          | 1328/300001 [11:46:00<2646:47:22, 31.90s/it]training loss: 5.921e-03:   0%|          | 1329/300001 [11:46:32<2627:33:53, 31.67s/it]training loss: 5.921e-03:   0%|          | 1330/300001 [11:47:03<2628:55:07, 31.69s/it]training loss: 5.921e-03:   0%|          | 1331/300001 [11:47:36<2657:22:57, 32.03s/it]training loss: 5.921e-03:   0%|          | 1332/300001 [11:48:08<2650:54:52, 31.95s/it]training loss: 5.921e-03:   0%|          | 1333/300001 [11:48:39<2623:28:06, 31.62s/it]training loss: 5.921e-03:   0%|          | 1334/300001 [11:49:11<2645:01:06, 31.88s/it]training loss: 5.921e-03:   0%|          | 1335/300001 [11:49:43<2635:59:05, 31.77s/it]training loss: 5.921e-03:   0%|          | 1336/300001 [11:50:13<2604:15:38, 31.39s/it]training loss: 5.921e-03:   0%|          | 1337/300001 [11:50:44<2596:42:26, 31.30s/it]training loss: 5.921e-03:   0%|          | 1338/300001 [11:51:16<2610:26:12, 31.47s/it]training loss: 5.921e-03:   0%|          | 1339/300001 [11:51:48<2607:44:39, 31.43s/it]training loss: 5.921e-03:   0%|          | 1340/300001 [11:52:20<2630:11:29, 31.70s/it]training loss: 6.701e-03:   0%|          | 1340/300001 [11:52:51<2630:11:29, 31.70s/it]training loss: 6.701e-03:   0%|          | 1341/300001 [11:52:51<2616:05:05, 31.53s/it]training loss: 6.701e-03:   0%|          | 1342/300001 [11:53:24<2639:56:37, 31.82s/it]training loss: 6.701e-03:   0%|          | 1343/300001 [11:53:55<2639:25:56, 31.82s/it]training loss: 6.701e-03:   0%|          | 1344/300001 [11:54:27<2637:47:23, 31.80s/it]training loss: 6.701e-03:   0%|          | 1345/300001 [11:54:58<2618:52:24, 31.57s/it]training loss: 6.701e-03:   0%|          | 1346/300001 [11:55:30<2626:46:52, 31.66s/it]training loss: 6.701e-03:   0%|          | 1347/300001 [11:56:02<2638:54:22, 31.81s/it]training loss: 6.701e-03:   0%|          | 1348/300001 [11:56:34<2642:10:55, 31.85s/it]training loss: 6.701e-03:   0%|          | 1349/300001 [11:57:07<2669:03:14, 32.17s/it]training loss: 6.701e-03:   0%|          | 1350/300001 [11:57:38<2646:20:00, 31.90s/it]training loss: 6.701e-03:   0%|          | 1351/300001 [11:58:10<2641:25:31, 31.84s/it]training loss: 6.701e-03:   0%|          | 1352/300001 [11:58:42<2647:31:40, 31.91s/it]training loss: 6.701e-03:   0%|          | 1353/300001 [11:59:14<2658:22:52, 32.04s/it]training loss: 6.701e-03:   0%|          | 1354/300001 [11:59:46<2646:31:37, 31.90s/it]training loss: 6.701e-03:   0%|          | 1355/300001 [12:00:16<2607:15:10, 31.43s/it]training loss: 6.701e-03:   0%|          | 1356/300001 [12:00:48<2605:29:18, 31.41s/it]training loss: 6.701e-03:   0%|          | 1357/300001 [12:01:20<2622:56:49, 31.62s/it]training loss: 6.701e-03:   0%|          | 1358/300001 [12:01:52<2625:23:13, 31.65s/it]training loss: 6.701e-03:   0%|          | 1359/300001 [12:02:22<2600:21:43, 31.35s/it]training loss: 6.701e-03:   0%|          | 1360/300001 [12:02:55<2629:13:29, 31.69s/it]training loss: 5.809e-03:   0%|          | 1360/300001 [12:03:27<2629:13:29, 31.69s/it]training loss: 5.809e-03:   0%|          | 1361/300001 [12:03:28<2658:34:19, 32.05s/it]training loss: 5.809e-03:   0%|          | 1362/300001 [12:04:00<2680:09:07, 32.31s/it]training loss: 5.809e-03:   0%|          | 1363/300001 [12:04:31<2635:31:55, 31.77s/it]training loss: 5.809e-03:   0%|          | 1364/300001 [12:05:02<2613:10:11, 31.50s/it]training loss: 5.809e-03:   0%|          | 1365/300001 [12:05:34<2634:49:09, 31.76s/it]training loss: 5.809e-03:   0%|          | 1366/300001 [12:06:06<2643:49:40, 31.87s/it]training loss: 5.809e-03:   0%|          | 1367/300001 [12:06:38<2644:11:50, 31.88s/it]training loss: 5.809e-03:   0%|          | 1368/300001 [12:07:10<2648:09:04, 31.92s/it]training loss: 5.809e-03:   0%|          | 1369/300001 [12:07:41<2622:33:59, 31.61s/it]training loss: 5.809e-03:   0%|          | 1370/300001 [12:08:13<2636:20:55, 31.78s/it]training loss: 5.809e-03:   0%|          | 1371/300001 [12:08:46<2651:24:45, 31.96s/it]training loss: 5.809e-03:   0%|          | 1372/300001 [12:09:17<2635:52:02, 31.78s/it]training loss: 5.809e-03:   0%|          | 1373/300001 [12:09:49<2642:28:08, 31.86s/it]training loss: 5.809e-03:   0%|          | 1374/300001 [12:10:21<2639:54:34, 31.82s/it]training loss: 5.809e-03:   0%|          | 1375/300001 [12:10:53<2646:15:55, 31.90s/it]training loss: 5.809e-03:   0%|          | 1376/300001 [12:11:25<2649:33:16, 31.94s/it]training loss: 5.809e-03:   0%|          | 1377/300001 [12:11:57<2657:57:17, 32.04s/it]training loss: 5.809e-03:   0%|          | 1378/300001 [12:12:29<2645:54:55, 31.90s/it]training loss: 5.809e-03:   0%|          | 1379/300001 [12:13:01<2644:01:33, 31.87s/it]training loss: 5.809e-03:   0%|          | 1380/300001 [12:13:33<2649:52:29, 31.95s/it]training loss: 6.069e-03:   0%|          | 1380/300001 [12:14:04<2649:52:29, 31.95s/it]training loss: 6.069e-03:   0%|          | 1381/300001 [12:14:05<2645:50:37, 31.90s/it]training loss: 6.069e-03:   0%|          | 1382/300001 [12:14:36<2635:00:12, 31.77s/it]training loss: 6.069e-03:   0%|          | 1383/300001 [12:15:08<2646:35:02, 31.91s/it]training loss: 6.069e-03:   0%|          | 1384/300001 [12:15:39<2629:59:24, 31.71s/it]training loss: 6.069e-03:   0%|          | 1385/300001 [12:16:11<2619:04:00, 31.57s/it]training loss: 6.069e-03:   0%|          | 1386/300001 [12:16:42<2601:35:00, 31.36s/it]training loss: 6.069e-03:   0%|          | 1387/300001 [12:17:13<2612:25:44, 31.49s/it]training loss: 6.069e-03:   0%|          | 1388/300001 [12:17:47<2662:12:57, 32.09s/it]training loss: 6.069e-03:   0%|          | 1389/300001 [12:18:19<2657:30:35, 32.04s/it]training loss: 6.069e-03:   0%|          | 1390/300001 [12:18:51<2650:11:32, 31.95s/it]training loss: 6.069e-03:   0%|          | 1391/300001 [12:19:23<2656:21:31, 32.02s/it]training loss: 6.069e-03:   0%|          | 1392/300001 [12:19:54<2627:28:00, 31.68s/it]training loss: 6.069e-03:   0%|          | 1393/300001 [12:20:25<2629:42:27, 31.70s/it]training loss: 6.069e-03:   0%|          | 1394/300001 [12:20:58<2642:45:28, 31.86s/it]training loss: 6.069e-03:   0%|          | 1395/300001 [12:21:30<2653:26:22, 31.99s/it]training loss: 6.069e-03:   0%|          | 1396/300001 [12:22:03<2686:27:02, 32.39s/it]training loss: 6.069e-03:   0%|          | 1397/300001 [12:22:36<2703:16:21, 32.59s/it]training loss: 6.069e-03:   0%|          | 1398/300001 [12:23:09<2695:27:33, 32.50s/it]training loss: 6.069e-03:   0%|          | 1399/300001 [12:23:41<2692:23:53, 32.46s/it]training loss: 6.069e-03:   0%|          | 1400/300001 [12:24:13<2683:36:10, 32.35s/it]training loss: 6.451e-03:   0%|          | 1400/300001 [12:24:45<2683:36:10, 32.35s/it]training loss: 6.451e-03:   0%|          | 1401/300001 [12:24:45<2680:20:47, 32.31s/it]training loss: 6.451e-03:   0%|          | 1402/300001 [12:25:17<2672:32:07, 32.22s/it]training loss: 6.451e-03:   0%|          | 1403/300001 [12:25:49<2666:19:49, 32.15s/it]training loss: 6.451e-03:   0%|          | 1404/300001 [12:26:20<2635:40:58, 31.78s/it]training loss: 6.451e-03:   0%|          | 1405/300001 [12:26:51<2619:02:57, 31.58s/it]training loss: 6.451e-03:   0%|          | 1406/300001 [12:27:23<2622:17:57, 31.62s/it]training loss: 6.451e-03:   0%|          | 1407/300001 [12:27:54<2616:42:48, 31.55s/it]training loss: 6.451e-03:   0%|          | 1408/300001 [12:28:26<2616:37:11, 31.55s/it]training loss: 6.451e-03:   0%|          | 1409/300001 [12:28:57<2600:44:44, 31.36s/it]training loss: 6.451e-03:   0%|          | 1410/300001 [12:29:28<2586:19:10, 31.18s/it]training loss: 6.451e-03:   0%|          | 1411/300001 [12:29:59<2598:52:01, 31.33s/it]training loss: 6.451e-03:   0%|          | 1412/300001 [12:30:30<2577:16:29, 31.07s/it]training loss: 6.451e-03:   0%|          | 1413/300001 [12:30:52<2353:43:47, 28.38s/it]training loss: 6.451e-03:   0%|          | 1414/300001 [12:31:24<2448:23:52, 29.52s/it]training loss: 6.451e-03:   0%|          | 1415/300001 [12:31:55<2473:49:05, 29.83s/it]training loss: 6.451e-03:   0%|          | 1416/300001 [12:32:27<2541:33:49, 30.64s/it]training loss: 6.451e-03:   0%|          | 1417/300001 [12:32:58<2556:05:44, 30.82s/it]training loss: 6.451e-03:   0%|          | 1418/300001 [12:33:29<2561:59:14, 30.89s/it]training loss: 6.451e-03:   0%|          | 1419/300001 [12:34:01<2581:12:24, 31.12s/it]training loss: 6.451e-03:   0%|          | 1420/300001 [12:34:34<2616:54:56, 31.55s/it]training loss: 6.580e-03:   0%|          | 1420/300001 [12:35:05<2616:54:56, 31.55s/it]training loss: 6.580e-03:   0%|          | 1421/300001 [12:35:05<2608:25:33, 31.45s/it]training loss: 6.580e-03:   0%|          | 1422/300001 [12:35:36<2601:39:18, 31.37s/it]training loss: 6.580e-03:   0%|          | 1423/300001 [12:36:08<2614:41:48, 31.53s/it]training loss: 6.580e-03:   0%|          | 1424/300001 [12:36:40<2617:02:25, 31.55s/it]training loss: 6.580e-03:   0%|          | 1425/300001 [12:37:12<2639:06:57, 31.82s/it]training loss: 6.580e-03:   0%|          | 1426/300001 [12:37:44<2646:49:33, 31.91s/it]training loss: 6.580e-03:   0%|          | 1427/300001 [12:38:16<2645:29:48, 31.90s/it]training loss: 6.580e-03:   0%|          | 1428/300001 [12:38:48<2660:14:21, 32.08s/it]training loss: 6.580e-03:   0%|          | 1429/300001 [12:39:20<2646:13:42, 31.91s/it]training loss: 6.580e-03:   0%|          | 1430/300001 [12:39:51<2628:38:50, 31.69s/it]training loss: 6.580e-03:   0%|          | 1431/300001 [12:40:23<2641:46:14, 31.85s/it]training loss: 6.580e-03:   0%|          | 1432/300001 [12:40:54<2599:49:34, 31.35s/it]training loss: 6.580e-03:   0%|          | 1433/300001 [12:41:25<2595:15:45, 31.29s/it]training loss: 6.580e-03:   0%|          | 1434/300001 [12:41:56<2599:26:26, 31.34s/it]training loss: 6.580e-03:   0%|          | 1435/300001 [12:42:29<2625:57:32, 31.66s/it]training loss: 6.580e-03:   0%|          | 1436/300001 [12:43:00<2609:36:30, 31.47s/it]training loss: 6.580e-03:   0%|          | 1437/300001 [12:43:31<2615:17:55, 31.53s/it]training loss: 6.580e-03:   0%|          | 1438/300001 [12:44:03<2613:38:25, 31.51s/it]training loss: 6.580e-03:   0%|          | 1439/300001 [12:44:34<2610:47:16, 31.48s/it]training loss: 6.580e-03:   0%|          | 1440/300001 [12:45:05<2599:33:36, 31.35s/it]training loss: 5.666e-03:   0%|          | 1440/300001 [12:45:36<2599:33:36, 31.35s/it]training loss: 5.666e-03:   0%|          | 1441/300001 [12:45:36<2598:13:36, 31.33s/it]training loss: 5.666e-03:   0%|          | 1442/300001 [12:46:09<2625:43:08, 31.66s/it]training loss: 5.666e-03:   0%|          | 1443/300001 [12:46:41<2626:30:04, 31.67s/it]training loss: 5.666e-03:   0%|          | 1444/300001 [12:47:13<2639:14:49, 31.82s/it]training loss: 5.666e-03:   0%|          | 1445/300001 [12:47:44<2628:22:49, 31.69s/it]training loss: 5.666e-03:   0%|          | 1446/300001 [12:48:16<2634:30:03, 31.77s/it]training loss: 5.666e-03:   0%|          | 1447/300001 [12:48:48<2644:31:52, 31.89s/it]training loss: 5.666e-03:   0%|          | 1448/300001 [12:49:20<2632:07:38, 31.74s/it]training loss: 5.666e-03:   0%|          | 1449/300001 [12:49:51<2614:54:11, 31.53s/it]training loss: 5.666e-03:   0%|          | 1450/300001 [12:50:23<2632:50:28, 31.75s/it]training loss: 5.666e-03:   0%|          | 1451/300001 [12:50:56<2658:19:34, 32.05s/it]training loss: 5.666e-03:   0%|          | 1452/300001 [12:51:26<2625:31:41, 31.66s/it]training loss: 5.666e-03:   0%|          | 1453/300001 [12:51:58<2617:41:22, 31.57s/it]training loss: 5.666e-03:   0%|          | 1454/300001 [12:52:29<2609:22:32, 31.46s/it]training loss: 5.666e-03:   0%|          | 1455/300001 [12:53:02<2646:01:58, 31.91s/it]training loss: 5.666e-03:   0%|          | 1456/300001 [12:53:33<2620:15:17, 31.60s/it]training loss: 5.666e-03:   0%|          | 1457/300001 [12:54:06<2655:32:56, 32.02s/it]training loss: 5.666e-03:   0%|          | 1458/300001 [12:54:39<2672:37:27, 32.23s/it]training loss: 5.666e-03:   0%|          | 1459/300001 [12:55:09<2629:50:21, 31.71s/it]training loss: 5.666e-03:   0%|          | 1460/300001 [12:55:41<2624:23:54, 31.65s/it]training loss: 6.650e-03:   0%|          | 1460/300001 [12:56:12<2624:23:54, 31.65s/it]training loss: 6.650e-03:   0%|          | 1461/300001 [12:56:13<2634:28:36, 31.77s/it]training loss: 6.650e-03:   0%|          | 1462/300001 [12:56:44<2621:18:30, 31.61s/it]training loss: 6.650e-03:   0%|          | 1463/300001 [12:57:16<2630:41:12, 31.72s/it]training loss: 6.650e-03:   0%|          | 1464/300001 [12:57:49<2665:22:31, 32.14s/it]training loss: 6.650e-03:   0%|          | 1465/300001 [12:58:20<2640:25:43, 31.84s/it]training loss: 6.650e-03:   0%|          | 1466/300001 [12:58:52<2631:09:41, 31.73s/it]training loss: 6.650e-03:   0%|          | 1467/300001 [12:59:23<2630:51:24, 31.73s/it]training loss: 6.650e-03:   0%|          | 1468/300001 [12:59:55<2634:13:07, 31.77s/it]training loss: 6.650e-03:   0%|          | 1469/300001 [13:00:27<2625:01:03, 31.66s/it]training loss: 6.650e-03:   0%|          | 1470/300001 [13:00:58<2621:16:07, 31.61s/it]training loss: 6.650e-03:   0%|          | 1471/300001 [13:01:29<2609:58:32, 31.47s/it]training loss: 6.650e-03:   0%|          | 1472/300001 [13:02:02<2634:44:47, 31.77s/it]training loss: 6.650e-03:   0%|          | 1473/300001 [13:02:33<2631:12:48, 31.73s/it]training loss: 6.650e-03:   0%|          | 1474/300001 [13:03:04<2605:25:17, 31.42s/it]training loss: 6.650e-03:   0%|          | 1475/300001 [13:03:37<2638:08:07, 31.81s/it]training loss: 6.650e-03:   0%|          | 1476/300001 [13:04:09<2655:33:23, 32.02s/it]training loss: 6.650e-03:   0%|          | 1477/300001 [13:04:41<2657:39:14, 32.05s/it]training loss: 6.650e-03:   0%|          | 1478/300001 [13:05:14<2677:15:05, 32.29s/it]training loss: 6.650e-03:   0%|          | 1479/300001 [13:05:46<2659:01:44, 32.07s/it]training loss: 6.650e-03:   0%|          | 1480/300001 [13:06:17<2630:23:33, 31.72s/it]training loss: 6.931e-03:   0%|          | 1480/300001 [13:06:48<2630:23:33, 31.72s/it]training loss: 6.931e-03:   0%|          | 1481/300001 [13:06:48<2615:04:49, 31.54s/it]training loss: 6.931e-03:   0%|          | 1482/300001 [13:07:19<2618:51:39, 31.58s/it]training loss: 6.931e-03:   0%|          | 1483/300001 [13:07:52<2646:59:00, 31.92s/it]training loss: 6.931e-03:   0%|          | 1484/300001 [13:08:23<2631:10:24, 31.73s/it]training loss: 6.931e-03:   0%|          | 1485/300001 [13:08:56<2659:08:10, 32.07s/it]training loss: 6.931e-03:   0%|          | 1486/300001 [13:09:29<2669:32:05, 32.19s/it]training loss: 6.931e-03:   0%|          | 1487/300001 [13:10:01<2657:30:14, 32.05s/it]training loss: 6.931e-03:   0%|          | 1488/300001 [13:10:33<2658:24:03, 32.06s/it]training loss: 6.931e-03:   0%|          | 1489/300001 [13:11:04<2643:16:43, 31.88s/it]training loss: 6.931e-03:   0%|          | 1490/300001 [13:11:36<2651:21:27, 31.97s/it]training loss: 6.931e-03:   0%|          | 1491/300001 [13:12:07<2631:59:07, 31.74s/it]training loss: 6.931e-03:   0%|          | 1492/300001 [13:12:40<2658:16:13, 32.06s/it]training loss: 6.931e-03:   0%|          | 1493/300001 [13:13:12<2660:07:10, 32.08s/it]training loss: 6.931e-03:   0%|          | 1494/300001 [13:13:46<2691:53:21, 32.46s/it]training loss: 6.931e-03:   0%|          | 1495/300001 [13:14:18<2687:19:16, 32.41s/it]training loss: 6.931e-03:   0%|          | 1496/300001 [13:14:50<2665:42:14, 32.15s/it]training loss: 6.931e-03:   0%|          | 1497/300001 [13:15:22<2670:38:19, 32.21s/it]training loss: 6.931e-03:   0%|          | 1498/300001 [13:15:56<2727:58:47, 32.90s/it]training loss: 6.931e-03:   0%|          | 1499/300001 [13:16:28<2684:56:24, 32.38s/it]training loss: 6.931e-03:   0%|          | 1500/300001 [13:16:58<2645:49:34, 31.91s/it]training loss: 6.019e-03:   0%|          | 1500/300001 [13:17:30<2645:49:34, 31.91s/it]training loss: 6.019e-03:   1%|          | 1501/300001 [13:17:34<2733:42:14, 32.97s/it]training loss: 6.019e-03:   1%|          | 1502/300001 [13:18:05<2695:13:12, 32.51s/it]training loss: 6.019e-03:   1%|          | 1503/300001 [13:18:37<2668:44:21, 32.19s/it]training loss: 6.019e-03:   1%|          | 1504/300001 [13:19:08<2656:32:20, 32.04s/it]training loss: 6.019e-03:   1%|          | 1505/300001 [13:19:40<2655:31:09, 32.03s/it]training loss: 6.019e-03:   1%|          | 1506/300001 [13:20:12<2652:27:54, 31.99s/it]training loss: 6.019e-03:   1%|          | 1507/300001 [13:20:45<2658:22:56, 32.06s/it]training loss: 6.019e-03:   1%|          | 1508/300001 [13:21:16<2637:29:59, 31.81s/it]training loss: 6.019e-03:   1%|          | 1509/300001 [13:21:47<2613:07:56, 31.52s/it]training loss: 6.019e-03:   1%|          | 1510/300001 [13:22:19<2637:31:47, 31.81s/it]training loss: 6.019e-03:   1%|          | 1511/300001 [13:22:51<2633:26:10, 31.76s/it]training loss: 6.019e-03:   1%|          | 1512/300001 [13:23:22<2617:39:05, 31.57s/it]training loss: 6.019e-03:   1%|          | 1513/300001 [13:23:55<2651:38:56, 31.98s/it]training loss: 6.019e-03:   1%|          | 1514/300001 [13:24:28<2686:38:41, 32.40s/it]training loss: 6.019e-03:   1%|          | 1515/300001 [13:25:00<2670:06:10, 32.20s/it]training loss: 6.019e-03:   1%|          | 1516/300001 [13:25:31<2652:32:09, 31.99s/it]training loss: 6.019e-03:   1%|          | 1517/300001 [13:26:02<2624:01:39, 31.65s/it]training loss: 6.019e-03:   1%|          | 1518/300001 [13:26:34<2615:03:53, 31.54s/it]training loss: 6.019e-03:   1%|          | 1519/300001 [13:27:06<2645:24:34, 31.91s/it]training loss: 6.019e-03:   1%|          | 1520/300001 [13:27:37<2610:25:15, 31.48s/it]training loss: 5.791e-03:   1%|          | 1520/300001 [13:28:08<2610:25:15, 31.48s/it]training loss: 5.791e-03:   1%|          | 1521/300001 [13:28:09<2617:14:05, 31.57s/it]training loss: 5.791e-03:   1%|          | 1522/300001 [13:28:40<2619:33:17, 31.59s/it]training loss: 5.791e-03:   1%|          | 1523/300001 [13:29:11<2608:36:11, 31.46s/it]training loss: 5.791e-03:   1%|          | 1524/300001 [13:29:44<2624:41:38, 31.66s/it]training loss: 5.791e-03:   1%|          | 1525/300001 [13:30:17<2678:31:33, 32.31s/it]training loss: 5.791e-03:   1%|          | 1526/300001 [13:30:49<2659:10:15, 32.07s/it]training loss: 5.791e-03:   1%|          | 1527/300001 [13:31:21<2654:18:40, 32.01s/it]training loss: 5.791e-03:   1%|          | 1528/300001 [13:31:56<2724:18:21, 32.86s/it]training loss: 5.791e-03:   1%|          | 1529/300001 [13:32:27<2692:24:49, 32.47s/it]training loss: 5.791e-03:   1%|          | 1530/300001 [13:32:59<2687:57:19, 32.42s/it]training loss: 5.791e-03:   1%|          | 1531/300001 [13:33:31<2672:39:20, 32.24s/it]training loss: 5.791e-03:   1%|          | 1532/300001 [13:34:04<2673:36:27, 32.25s/it]training loss: 5.791e-03:   1%|          | 1533/300001 [13:34:35<2658:41:33, 32.07s/it]training loss: 5.791e-03:   1%|          | 1534/300001 [13:35:07<2654:04:28, 32.01s/it]training loss: 5.791e-03:   1%|          | 1535/300001 [13:35:39<2649:47:02, 31.96s/it]training loss: 5.791e-03:   1%|          | 1536/300001 [13:36:10<2631:20:12, 31.74s/it]training loss: 5.791e-03:   1%|          | 1537/300001 [13:36:43<2656:11:01, 32.04s/it]training loss: 5.791e-03:   1%|          | 1538/300001 [13:37:14<2632:29:59, 31.75s/it]training loss: 5.791e-03:   1%|          | 1539/300001 [13:37:46<2634:50:52, 31.78s/it]training loss: 5.791e-03:   1%|          | 1540/300001 [13:38:17<2630:37:13, 31.73s/it]training loss: 6.179e-03:   1%|          | 1540/300001 [13:38:48<2630:37:13, 31.73s/it]training loss: 6.179e-03:   1%|          | 1541/300001 [13:38:48<2605:57:41, 31.43s/it]training loss: 6.179e-03:   1%|          | 1542/300001 [13:39:22<2662:40:06, 32.12s/it]training loss: 6.179e-03:   1%|          | 1543/300001 [13:39:55<2691:05:20, 32.46s/it]training loss: 6.179e-03:   1%|          | 1544/300001 [13:40:27<2679:47:25, 32.32s/it]training loss: 6.179e-03:   1%|          | 1545/300001 [13:41:01<2710:58:59, 32.70s/it]training loss: 6.179e-03:   1%|          | 1546/300001 [13:41:33<2692:07:18, 32.47s/it]training loss: 6.179e-03:   1%|          | 1547/300001 [13:42:04<2672:22:56, 32.23s/it]training loss: 6.179e-03:   1%|          | 1548/300001 [13:42:36<2655:38:16, 32.03s/it]training loss: 6.179e-03:   1%|          | 1549/300001 [13:43:07<2638:07:14, 31.82s/it]training loss: 6.179e-03:   1%|          | 1550/300001 [13:43:39<2630:07:10, 31.73s/it]training loss: 6.179e-03:   1%|          | 1551/300001 [13:44:10<2612:36:33, 31.51s/it]training loss: 6.179e-03:   1%|          | 1552/300001 [13:44:42<2632:19:00, 31.75s/it]training loss: 6.179e-03:   1%|          | 1553/300001 [13:45:14<2633:38:56, 31.77s/it]training loss: 6.179e-03:   1%|          | 1554/300001 [13:45:46<2639:53:18, 31.84s/it]training loss: 6.179e-03:   1%|          | 1555/300001 [13:46:18<2636:43:02, 31.81s/it]training loss: 6.179e-03:   1%|          | 1556/300001 [13:46:51<2666:36:43, 32.17s/it]training loss: 6.179e-03:   1%|          | 1557/300001 [13:47:22<2637:08:46, 31.81s/it]training loss: 6.179e-03:   1%|          | 1558/300001 [13:47:53<2625:23:27, 31.67s/it]training loss: 6.179e-03:   1%|          | 1559/300001 [13:48:25<2632:32:05, 31.76s/it]training loss: 6.179e-03:   1%|          | 1560/300001 [13:48:57<2650:48:40, 31.98s/it]training loss: 7.058e-03:   1%|          | 1560/300001 [13:49:30<2650:48:40, 31.98s/it]training loss: 7.058e-03:   1%|          | 1561/300001 [13:49:30<2667:12:46, 32.17s/it]training loss: 7.058e-03:   1%|          | 1562/300001 [13:50:03<2688:48:25, 32.43s/it]training loss: 7.058e-03:   1%|          | 1563/300001 [13:50:35<2674:17:05, 32.26s/it]training loss: 7.058e-03:   1%|          | 1564/300001 [13:51:07<2677:09:33, 32.29s/it]training loss: 7.058e-03:   1%|          | 1565/300001 [13:51:38<2643:54:58, 31.89s/it]training loss: 7.058e-03:   1%|          | 1566/300001 [13:52:10<2637:19:16, 31.81s/it]training loss: 7.058e-03:   1%|          | 1567/300001 [13:52:41<2626:11:48, 31.68s/it]training loss: 7.058e-03:   1%|          | 1568/300001 [13:53:12<2605:51:13, 31.43s/it]training loss: 7.058e-03:   1%|          | 1569/300001 [13:53:43<2605:23:56, 31.43s/it]training loss: 7.058e-03:   1%|          | 1570/300001 [13:54:07<2397:04:37, 28.92s/it]training loss: 7.058e-03:   1%|          | 1571/300001 [13:54:40<2498:05:47, 30.13s/it]training loss: 7.058e-03:   1%|          | 1572/300001 [13:55:12<2555:36:36, 30.83s/it]training loss: 7.058e-03:   1%|          | 1573/300001 [13:55:45<2617:15:00, 31.57s/it]training loss: 7.058e-03:   1%|          | 1574/300001 [13:56:17<2632:42:51, 31.76s/it]training loss: 7.058e-03:   1%|          | 1575/300001 [13:56:49<2639:10:24, 31.84s/it]training loss: 7.058e-03:   1%|          | 1576/300001 [13:57:21<2620:07:20, 31.61s/it]training loss: 7.058e-03:   1%|          | 1577/300001 [13:57:51<2603:23:41, 31.41s/it]training loss: 7.058e-03:   1%|          | 1578/300001 [13:58:25<2651:42:37, 31.99s/it]training loss: 7.058e-03:   1%|          | 1579/300001 [13:58:57<2646:00:26, 31.92s/it]training loss: 7.058e-03:   1%|          | 1580/300001 [13:59:28<2635:31:53, 31.79s/it]training loss: 6.672e-03:   1%|          | 1580/300001 [14:00:00<2635:31:53, 31.79s/it]training loss: 6.672e-03:   1%|          | 1581/300001 [14:00:00<2643:22:32, 31.89s/it]training loss: 6.672e-03:   1%|          | 1582/300001 [14:00:32<2647:59:46, 31.94s/it]training loss: 6.672e-03:   1%|          | 1583/300001 [14:01:04<2642:44:20, 31.88s/it]training loss: 6.672e-03:   1%|          | 1584/300001 [14:01:36<2634:13:57, 31.78s/it]training loss: 6.672e-03:   1%|          | 1585/300001 [14:02:08<2648:40:00, 31.95s/it]training loss: 6.672e-03:   1%|          | 1586/300001 [14:02:39<2628:29:38, 31.71s/it]training loss: 6.672e-03:   1%|          | 1587/300001 [14:03:10<2610:36:32, 31.49s/it]training loss: 6.672e-03:   1%|          | 1588/300001 [14:03:41<2608:58:22, 31.47s/it]training loss: 6.672e-03:   1%|          | 1589/300001 [14:04:14<2638:14:30, 31.83s/it]training loss: 6.672e-03:   1%|          | 1590/300001 [14:04:46<2641:59:16, 31.87s/it]training loss: 6.672e-03:   1%|          | 1591/300001 [14:05:18<2638:26:33, 31.83s/it]training loss: 6.672e-03:   1%|          | 1592/300001 [14:05:51<2666:44:39, 32.17s/it]training loss: 6.672e-03:   1%|          | 1593/300001 [14:06:23<2668:26:10, 32.19s/it]training loss: 6.672e-03:   1%|          | 1594/300001 [14:06:56<2679:39:22, 32.33s/it]training loss: 6.672e-03:   1%|          | 1595/300001 [14:07:27<2659:55:18, 32.09s/it]training loss: 6.672e-03:   1%|          | 1596/300001 [14:07:58<2631:46:20, 31.75s/it]training loss: 6.672e-03:   1%|          | 1597/300001 [14:08:30<2629:25:41, 31.72s/it]training loss: 6.672e-03:   1%|          | 1598/300001 [14:09:03<2655:12:48, 32.03s/it]training loss: 6.672e-03:   1%|          | 1599/300001 [14:09:34<2632:09:09, 31.75s/it]training loss: 6.672e-03:   1%|          | 1600/300001 [14:10:07<2663:19:11, 32.13s/it]training loss: 5.567e-03:   1%|          | 1600/300001 [14:10:38<2663:19:11, 32.13s/it]training loss: 5.567e-03:   1%|          | 1601/300001 [14:10:38<2646:13:19, 31.92s/it]training loss: 5.567e-03:   1%|          | 1602/300001 [14:11:10<2653:39:54, 32.01s/it]training loss: 5.567e-03:   1%|          | 1603/300001 [14:11:43<2659:41:50, 32.09s/it]training loss: 5.567e-03:   1%|          | 1604/300001 [14:12:14<2648:02:23, 31.95s/it]training loss: 5.567e-03:   1%|          | 1605/300001 [14:12:45<2621:00:58, 31.62s/it]training loss: 5.567e-03:   1%|          | 1606/300001 [14:13:17<2625:23:36, 31.67s/it]training loss: 5.567e-03:   1%|          | 1607/300001 [14:13:50<2651:32:29, 31.99s/it]training loss: 5.567e-03:   1%|          | 1608/300001 [14:14:21<2633:20:46, 31.77s/it]training loss: 5.567e-03:   1%|          | 1609/300001 [14:14:52<2627:36:02, 31.70s/it]training loss: 5.567e-03:   1%|          | 1610/300001 [14:15:24<2632:26:15, 31.76s/it]training loss: 5.567e-03:   1%|          | 1611/300001 [14:15:55<2613:52:43, 31.54s/it]training loss: 5.567e-03:   1%|          | 1612/300001 [14:16:27<2613:54:53, 31.54s/it]training loss: 5.567e-03:   1%|          | 1613/300001 [14:16:58<2611:04:15, 31.50s/it]training loss: 5.567e-03:   1%|          | 1614/300001 [14:17:30<2621:10:23, 31.62s/it]training loss: 5.567e-03:   1%|          | 1615/300001 [14:18:01<2591:29:04, 31.27s/it]training loss: 5.567e-03:   1%|          | 1616/300001 [14:18:31<2580:57:53, 31.14s/it]training loss: 5.567e-03:   1%|          | 1617/300001 [14:19:05<2630:29:56, 31.74s/it]training loss: 5.567e-03:   1%|          | 1618/300001 [14:19:38<2659:59:26, 32.09s/it]training loss: 5.567e-03:   1%|          | 1619/300001 [14:20:09<2648:55:56, 31.96s/it]training loss: 5.567e-03:   1%|          | 1620/300001 [14:20:41<2635:40:06, 31.80s/it]training loss: 6.175e-03:   1%|          | 1620/300001 [14:21:12<2635:40:06, 31.80s/it]training loss: 6.175e-03:   1%|          | 1621/300001 [14:21:12<2618:03:31, 31.59s/it]training loss: 6.175e-03:   1%|          | 1622/300001 [14:21:43<2620:32:36, 31.62s/it]training loss: 6.175e-03:   1%|          | 1623/300001 [14:22:16<2654:38:56, 32.03s/it]training loss: 6.175e-03:   1%|          | 1624/300001 [14:22:47<2616:30:58, 31.57s/it]training loss: 6.175e-03:   1%|          | 1625/300001 [14:23:18<2611:18:19, 31.51s/it]training loss: 6.175e-03:   1%|          | 1626/300001 [14:23:49<2598:45:44, 31.35s/it]training loss: 6.175e-03:   1%|          | 1627/300001 [14:24:19<2567:09:08, 30.97s/it]training loss: 6.175e-03:   1%|          | 1628/300001 [14:24:52<2598:49:26, 31.36s/it]training loss: 6.175e-03:   1%|          | 1629/300001 [14:25:23<2606:03:16, 31.44s/it]training loss: 6.175e-03:   1%|          | 1630/300001 [14:25:56<2626:46:26, 31.69s/it]training loss: 6.175e-03:   1%|          | 1631/300001 [14:26:28<2643:17:22, 31.89s/it]training loss: 6.175e-03:   1%|          | 1632/300001 [14:26:59<2627:07:37, 31.70s/it]training loss: 6.175e-03:   1%|          | 1633/300001 [14:27:30<2611:31:51, 31.51s/it]training loss: 6.175e-03:   1%|          | 1634/300001 [14:28:02<2626:40:28, 31.69s/it]training loss: 6.175e-03:   1%|          | 1635/300001 [14:28:33<2602:21:44, 31.40s/it]training loss: 6.175e-03:   1%|          | 1636/300001 [14:29:05<2622:09:51, 31.64s/it]training loss: 6.175e-03:   1%|          | 1637/300001 [14:29:37<2625:32:59, 31.68s/it]training loss: 6.175e-03:   1%|          | 1638/300001 [14:30:10<2670:36:08, 32.22s/it]training loss: 6.175e-03:   1%|          | 1639/300001 [14:30:42<2643:55:56, 31.90s/it]training loss: 6.175e-03:   1%|          | 1640/300001 [14:31:14<2666:28:06, 32.17s/it]training loss: 5.879e-03:   1%|          | 1640/300001 [14:31:47<2666:28:06, 32.17s/it]training loss: 5.879e-03:   1%|          | 1641/300001 [14:31:47<2668:02:30, 32.19s/it]training loss: 5.879e-03:   1%|          | 1642/300001 [14:32:19<2663:44:37, 32.14s/it]training loss: 5.879e-03:   1%|          | 1643/300001 [14:32:50<2645:46:38, 31.92s/it]training loss: 5.879e-03:   1%|          | 1644/300001 [14:33:22<2655:11:38, 32.04s/it]training loss: 5.879e-03:   1%|          | 1645/300001 [14:33:55<2670:41:06, 32.22s/it]training loss: 5.879e-03:   1%|          | 1646/300001 [14:34:27<2655:07:15, 32.04s/it]training loss: 5.879e-03:   1%|          | 1647/300001 [14:34:58<2631:49:35, 31.76s/it]training loss: 5.879e-03:   1%|          | 1648/300001 [14:35:30<2636:55:51, 31.82s/it]training loss: 5.879e-03:   1%|          | 1649/300001 [14:36:02<2654:54:52, 32.03s/it]training loss: 5.879e-03:   1%|          | 1650/300001 [14:36:34<2636:55:22, 31.82s/it]training loss: 5.879e-03:   1%|          | 1651/300001 [14:37:05<2634:49:27, 31.79s/it]training loss: 5.879e-03:   1%|          | 1652/300001 [14:37:37<2623:10:08, 31.65s/it]training loss: 5.879e-03:   1%|          | 1653/300001 [14:38:10<2664:35:08, 32.15s/it]training loss: 5.879e-03:   1%|          | 1654/300001 [14:38:41<2643:35:38, 31.90s/it]training loss: 5.879e-03:   1%|          | 1655/300001 [14:39:15<2679:37:17, 32.33s/it]training loss: 5.879e-03:   1%|          | 1656/300001 [14:39:46<2648:45:17, 31.96s/it]training loss: 5.879e-03:   1%|          | 1657/300001 [14:40:17<2620:17:50, 31.62s/it]training loss: 5.879e-03:   1%|          | 1658/300001 [14:40:49<2636:32:23, 31.81s/it]training loss: 5.879e-03:   1%|          | 1659/300001 [14:41:19<2605:32:48, 31.44s/it]training loss: 5.879e-03:   1%|          | 1660/300001 [14:41:52<2637:41:40, 31.83s/it]training loss: 7.230e-03:   1%|          | 1660/300001 [14:42:24<2637:41:40, 31.83s/it]training loss: 7.230e-03:   1%|          | 1661/300001 [14:42:24<2640:37:10, 31.86s/it]training loss: 7.230e-03:   1%|          | 1662/300001 [14:42:55<2625:45:38, 31.68s/it]training loss: 7.230e-03:   1%|          | 1663/300001 [14:43:27<2622:49:47, 31.65s/it]training loss: 7.230e-03:   1%|          | 1664/300001 [14:44:00<2653:36:28, 32.02s/it]training loss: 7.230e-03:   1%|          | 1665/300001 [14:44:30<2611:59:17, 31.52s/it]training loss: 7.230e-03:   1%|          | 1666/300001 [14:45:01<2606:12:33, 31.45s/it]training loss: 7.230e-03:   1%|          | 1667/300001 [14:45:33<2619:11:42, 31.61s/it]training loss: 7.230e-03:   1%|          | 1668/300001 [14:46:05<2616:43:28, 31.58s/it]training loss: 7.230e-03:   1%|          | 1669/300001 [14:46:37<2641:27:41, 31.87s/it]training loss: 7.230e-03:   1%|          | 1670/300001 [14:47:10<2662:04:41, 32.12s/it]training loss: 7.230e-03:   1%|          | 1671/300001 [14:47:43<2667:38:35, 32.19s/it]training loss: 7.230e-03:   1%|          | 1672/300001 [14:48:14<2646:45:23, 31.94s/it]training loss: 7.230e-03:   1%|          | 1673/300001 [14:48:47<2669:31:08, 32.21s/it]training loss: 7.230e-03:   1%|          | 1674/300001 [14:49:18<2654:33:16, 32.03s/it]training loss: 7.230e-03:   1%|          | 1675/300001 [14:49:51<2659:29:46, 32.09s/it]training loss: 7.230e-03:   1%|          | 1676/300001 [14:50:22<2645:41:49, 31.93s/it]training loss: 7.230e-03:   1%|          | 1677/300001 [14:50:54<2650:55:47, 31.99s/it]training loss: 7.230e-03:   1%|          | 1678/300001 [14:51:27<2661:54:08, 32.12s/it]training loss: 7.230e-03:   1%|          | 1679/300001 [14:51:59<2659:58:06, 32.10s/it]training loss: 7.230e-03:   1%|          | 1680/300001 [14:52:30<2645:59:03, 31.93s/it]training loss: 5.444e-03:   1%|          | 1680/300001 [14:53:02<2645:59:03, 31.93s/it]training loss: 5.444e-03:   1%|          | 1681/300001 [14:53:02<2637:16:57, 31.83s/it]training loss: 5.444e-03:   1%|          | 1682/300001 [14:53:34<2648:55:03, 31.97s/it]training loss: 5.444e-03:   1%|          | 1683/300001 [14:54:06<2642:02:12, 31.88s/it]training loss: 5.444e-03:   1%|          | 1684/300001 [14:54:37<2612:25:44, 31.53s/it]training loss: 5.444e-03:   1%|          | 1685/300001 [14:55:09<2636:54:27, 31.82s/it]training loss: 5.444e-03:   1%|          | 1686/300001 [14:55:41<2645:04:45, 31.92s/it]training loss: 5.444e-03:   1%|          | 1687/300001 [14:56:12<2624:56:22, 31.68s/it]training loss: 5.444e-03:   1%|          | 1688/300001 [14:56:44<2635:56:15, 31.81s/it]training loss: 5.444e-03:   1%|          | 1689/300001 [14:57:16<2632:49:35, 31.77s/it]training loss: 5.444e-03:   1%|          | 1690/300001 [14:57:49<2653:17:04, 32.02s/it]training loss: 5.444e-03:   1%|          | 1691/300001 [14:58:20<2636:44:30, 31.82s/it]training loss: 5.444e-03:   1%|          | 1692/300001 [14:58:52<2633:53:27, 31.79s/it]training loss: 5.444e-03:   1%|          | 1693/300001 [14:59:23<2629:53:56, 31.74s/it]training loss: 5.444e-03:   1%|          | 1694/300001 [14:59:56<2648:00:20, 31.96s/it]training loss: 5.444e-03:   1%|          | 1695/300001 [15:00:27<2636:30:40, 31.82s/it]training loss: 5.444e-03:   1%|          | 1696/300001 [15:00:58<2620:23:34, 31.62s/it]training loss: 5.444e-03:   1%|          | 1697/300001 [15:01:31<2633:14:03, 31.78s/it]training loss: 5.444e-03:   1%|          | 1698/300001 [15:02:02<2621:59:53, 31.64s/it]training loss: 5.444e-03:   1%|          | 1699/300001 [15:02:33<2599:29:51, 31.37s/it]training loss: 5.444e-03:   1%|          | 1700/300001 [15:03:04<2591:38:51, 31.28s/it]training loss: 6.042e-03:   1%|          | 1700/300001 [15:03:36<2591:38:51, 31.28s/it]training loss: 6.042e-03:   1%|          | 1701/300001 [15:03:37<2629:42:11, 31.74s/it]training loss: 6.042e-03:   1%|          | 1702/300001 [15:04:07<2601:53:55, 31.40s/it]training loss: 6.042e-03:   1%|          | 1703/300001 [15:04:39<2603:39:56, 31.42s/it]training loss: 6.042e-03:   1%|          | 1704/300001 [15:05:10<2597:29:05, 31.35s/it]training loss: 6.042e-03:   1%|          | 1705/300001 [15:05:41<2603:50:09, 31.42s/it]training loss: 6.042e-03:   1%|          | 1706/300001 [15:06:14<2629:44:44, 31.74s/it]training loss: 6.042e-03:   1%|          | 1707/300001 [15:06:46<2635:36:01, 31.81s/it]training loss: 6.042e-03:   1%|          | 1708/300001 [15:07:17<2629:32:42, 31.74s/it]training loss: 6.042e-03:   1%|          | 1709/300001 [15:07:49<2633:45:06, 31.79s/it]training loss: 6.042e-03:   1%|          | 1710/300001 [15:08:21<2631:22:23, 31.76s/it]training loss: 6.042e-03:   1%|          | 1711/300001 [15:08:53<2630:56:35, 31.75s/it]training loss: 6.042e-03:   1%|          | 1712/300001 [15:09:23<2591:36:58, 31.28s/it]training loss: 6.042e-03:   1%|          | 1713/300001 [15:09:54<2586:52:27, 31.22s/it]training loss: 6.042e-03:   1%|          | 1714/300001 [15:10:25<2583:57:35, 31.19s/it]training loss: 6.042e-03:   1%|          | 1715/300001 [15:10:56<2584:44:13, 31.20s/it]training loss: 6.042e-03:   1%|          | 1716/300001 [15:11:28<2599:19:08, 31.37s/it]training loss: 6.042e-03:   1%|          | 1717/300001 [15:12:00<2600:05:58, 31.38s/it]training loss: 6.042e-03:   1%|          | 1718/300001 [15:12:31<2606:07:01, 31.45s/it]training loss: 6.042e-03:   1%|          | 1719/300001 [15:13:04<2630:09:38, 31.74s/it]training loss: 6.042e-03:   1%|          | 1720/300001 [15:13:36<2657:54:22, 32.08s/it]training loss: 5.986e-03:   1%|          | 1720/300001 [15:14:08<2657:54:22, 32.08s/it]training loss: 5.986e-03:   1%|          | 1721/300001 [15:14:08<2655:39:48, 32.05s/it]training loss: 5.986e-03:   1%|          | 1722/300001 [15:14:40<2639:54:35, 31.86s/it]training loss: 5.986e-03:   1%|          | 1723/300001 [15:15:12<2637:09:38, 31.83s/it]training loss: 5.986e-03:   1%|          | 1724/300001 [15:15:44<2645:34:35, 31.93s/it]training loss: 5.986e-03:   1%|          | 1725/300001 [15:16:16<2645:26:26, 31.93s/it]training loss: 5.986e-03:   1%|          | 1726/300001 [15:16:49<2677:56:02, 32.32s/it]training loss: 5.986e-03:   1%|          | 1727/300001 [15:17:12<2441:24:53, 29.47s/it]training loss: 5.986e-03:   1%|          | 1728/300001 [15:17:43<2476:45:24, 29.89s/it]training loss: 5.986e-03:   1%|          | 1729/300001 [15:18:14<2507:52:21, 30.27s/it]training loss: 5.986e-03:   1%|          | 1730/300001 [15:18:45<2541:21:02, 30.67s/it]training loss: 5.986e-03:   1%|          | 1731/300001 [15:19:17<2574:34:56, 31.07s/it]training loss: 5.986e-03:   1%|          | 1732/300001 [15:19:49<2579:09:25, 31.13s/it]training loss: 5.986e-03:   1%|          | 1733/300001 [15:20:21<2602:25:30, 31.41s/it]training loss: 5.986e-03:   1%|          | 1734/300001 [15:20:51<2578:01:07, 31.12s/it]training loss: 5.986e-03:   1%|          | 1735/300001 [15:21:23<2590:29:59, 31.27s/it]training loss: 5.986e-03:   1%|          | 1736/300001 [15:21:55<2604:48:33, 31.44s/it]training loss: 5.986e-03:   1%|          | 1737/300001 [15:22:26<2591:06:22, 31.27s/it]training loss: 5.986e-03:   1%|          | 1738/300001 [15:22:58<2617:57:37, 31.60s/it]training loss: 5.986e-03:   1%|          | 1739/300001 [15:23:29<2596:52:09, 31.34s/it]training loss: 5.986e-03:   1%|          | 1740/300001 [15:24:02<2651:12:49, 32.00s/it]training loss: 5.885e-03:   1%|          | 1740/300001 [15:24:34<2651:12:49, 32.00s/it]training loss: 5.885e-03:   1%|          | 1741/300001 [15:24:34<2655:54:39, 32.06s/it]training loss: 5.885e-03:   1%|          | 1742/300001 [15:25:07<2667:54:37, 32.20s/it]training loss: 5.885e-03:   1%|          | 1743/300001 [15:25:38<2651:38:53, 32.01s/it]training loss: 5.885e-03:   1%|          | 1744/300001 [15:26:11<2676:52:46, 32.31s/it]training loss: 5.885e-03:   1%|          | 1745/300001 [15:26:43<2669:09:14, 32.22s/it]training loss: 5.885e-03:   1%|          | 1746/300001 [15:27:16<2671:45:04, 32.25s/it]training loss: 5.885e-03:   1%|          | 1747/300001 [15:27:48<2682:48:44, 32.38s/it]training loss: 5.885e-03:   1%|          | 1748/300001 [15:28:20<2672:26:48, 32.26s/it]training loss: 5.885e-03:   1%|          | 1749/300001 [15:28:51<2625:27:51, 31.69s/it]training loss: 5.885e-03:   1%|          | 1750/300001 [15:29:23<2639:53:36, 31.86s/it]training loss: 5.885e-03:   1%|          | 1751/300001 [15:29:55<2653:49:45, 32.03s/it]training loss: 5.885e-03:   1%|          | 1752/300001 [15:30:27<2643:29:33, 31.91s/it]training loss: 5.885e-03:   1%|          | 1753/300001 [15:30:59<2636:12:59, 31.82s/it]training loss: 5.885e-03:   1%|          | 1754/300001 [15:31:30<2628:05:25, 31.72s/it]training loss: 5.885e-03:   1%|          | 1755/300001 [15:32:03<2649:13:07, 31.98s/it]training loss: 5.885e-03:   1%|          | 1756/300001 [15:32:34<2628:30:52, 31.73s/it]training loss: 5.885e-03:   1%|          | 1757/300001 [15:33:05<2619:28:17, 31.62s/it]training loss: 5.885e-03:   1%|          | 1758/300001 [15:33:37<2621:00:32, 31.64s/it]training loss: 5.885e-03:   1%|          | 1759/300001 [15:34:08<2602:08:42, 31.41s/it]training loss: 5.885e-03:   1%|          | 1760/300001 [15:34:39<2594:23:24, 31.32s/it]training loss: 5.694e-03:   1%|          | 1760/300001 [15:35:12<2594:23:24, 31.32s/it]training loss: 5.694e-03:   1%|          | 1761/300001 [15:35:12<2633:44:15, 31.79s/it]training loss: 5.694e-03:   1%|          | 1762/300001 [15:35:45<2661:51:56, 32.13s/it]training loss: 5.694e-03:   1%|          | 1763/300001 [15:36:18<2676:50:25, 32.31s/it]training loss: 5.694e-03:   1%|          | 1764/300001 [15:36:50<2680:20:15, 32.35s/it]training loss: 5.694e-03:   1%|          | 1765/300001 [15:37:23<2703:06:22, 32.63s/it]training loss: 5.694e-03:   1%|          | 1766/300001 [15:37:55<2690:41:58, 32.48s/it]training loss: 5.694e-03:   1%|          | 1767/300001 [15:38:27<2664:48:29, 32.17s/it]training loss: 5.694e-03:   1%|          | 1768/300001 [15:38:58<2645:26:06, 31.93s/it]training loss: 5.694e-03:   1%|          | 1769/300001 [15:39:29<2629:55:48, 31.75s/it]training loss: 5.694e-03:   1%|          | 1770/300001 [15:40:01<2614:55:17, 31.57s/it]training loss: 5.694e-03:   1%|          | 1771/300001 [15:40:33<2629:34:13, 31.74s/it]training loss: 5.694e-03:   1%|          | 1772/300001 [15:41:05<2639:35:21, 31.86s/it]training loss: 5.694e-03:   1%|          | 1773/300001 [15:41:37<2653:24:36, 32.03s/it]training loss: 5.694e-03:   1%|          | 1774/300001 [15:42:09<2639:41:52, 31.86s/it]training loss: 5.694e-03:   1%|          | 1775/300001 [15:42:40<2622:31:25, 31.66s/it]training loss: 5.694e-03:   1%|          | 1776/300001 [15:43:12<2621:10:00, 31.64s/it]training loss: 5.694e-03:   1%|          | 1777/300001 [15:43:44<2639:47:35, 31.87s/it]training loss: 5.694e-03:   1%|          | 1778/300001 [15:44:16<2653:21:11, 32.03s/it]training loss: 5.694e-03:   1%|          | 1779/300001 [15:44:48<2648:34:05, 31.97s/it]training loss: 5.694e-03:   1%|          | 1780/300001 [15:45:20<2630:37:21, 31.76s/it]training loss: 6.414e-03:   1%|          | 1780/300001 [15:45:51<2630:37:21, 31.76s/it]training loss: 6.414e-03:   1%|          | 1781/300001 [15:45:52<2637:33:46, 31.84s/it]training loss: 6.414e-03:   1%|          | 1782/300001 [15:46:23<2626:23:04, 31.70s/it]training loss: 6.414e-03:   1%|          | 1783/300001 [15:46:54<2618:57:39, 31.62s/it]training loss: 6.414e-03:   1%|          | 1784/300001 [15:47:26<2615:26:02, 31.57s/it]training loss: 6.414e-03:   1%|          | 1785/300001 [15:47:57<2613:21:30, 31.55s/it]training loss: 6.414e-03:   1%|          | 1786/300001 [15:48:29<2626:37:21, 31.71s/it]training loss: 6.414e-03:   1%|          | 1787/300001 [15:49:01<2622:57:24, 31.66s/it]training loss: 6.414e-03:   1%|          | 1788/300001 [15:49:34<2663:33:16, 32.15s/it]training loss: 6.414e-03:   1%|          | 1789/300001 [15:50:06<2644:32:26, 31.92s/it]training loss: 6.414e-03:   1%|          | 1790/300001 [15:50:37<2631:55:42, 31.77s/it]training loss: 6.414e-03:   1%|          | 1791/300001 [15:51:08<2621:20:18, 31.64s/it]training loss: 6.414e-03:   1%|          | 1792/300001 [15:51:40<2619:40:09, 31.62s/it]training loss: 6.414e-03:   1%|          | 1793/300001 [15:52:12<2628:31:03, 31.73s/it]training loss: 6.414e-03:   1%|          | 1794/300001 [15:52:43<2622:38:58, 31.66s/it]training loss: 6.414e-03:   1%|          | 1795/300001 [15:53:14<2605:02:15, 31.45s/it]training loss: 6.414e-03:   1%|          | 1796/300001 [15:53:46<2597:06:58, 31.35s/it]training loss: 6.414e-03:   1%|          | 1797/300001 [15:54:18<2612:34:26, 31.54s/it]training loss: 6.414e-03:   1%|          | 1798/300001 [15:54:49<2610:29:04, 31.51s/it]training loss: 6.414e-03:   1%|          | 1799/300001 [15:55:21<2612:13:07, 31.54s/it]training loss: 6.414e-03:   1%|          | 1800/300001 [15:55:52<2615:53:17, 31.58s/it]training loss: 6.045e-03:   1%|          | 1800/300001 [15:56:24<2615:53:17, 31.58s/it]training loss: 6.045e-03:   1%|          | 1801/300001 [15:56:25<2634:15:35, 31.80s/it]training loss: 6.045e-03:   1%|          | 1802/300001 [15:56:58<2671:19:17, 32.25s/it]training loss: 6.045e-03:   1%|          | 1803/300001 [15:57:30<2681:12:41, 32.37s/it]training loss: 6.045e-03:   1%|          | 1804/300001 [15:58:02<2672:08:54, 32.26s/it]training loss: 6.045e-03:   1%|          | 1805/300001 [15:58:34<2665:43:16, 32.18s/it]training loss: 6.045e-03:   1%|          | 1806/300001 [15:59:08<2699:30:26, 32.59s/it]training loss: 6.045e-03:   1%|          | 1807/300001 [15:59:40<2681:29:37, 32.37s/it]training loss: 6.045e-03:   1%|          | 1808/300001 [16:00:11<2651:42:19, 32.01s/it]training loss: 6.045e-03:   1%|          | 1809/300001 [16:00:44<2680:05:21, 32.36s/it]training loss: 6.045e-03:   1%|          | 1810/300001 [16:01:16<2659:58:46, 32.11s/it]training loss: 6.045e-03:   1%|          | 1811/300001 [16:01:48<2650:31:00, 32.00s/it]training loss: 6.045e-03:   1%|          | 1812/300001 [16:02:18<2619:55:38, 31.63s/it]training loss: 6.045e-03:   1%|          | 1813/300001 [16:02:50<2619:50:11, 31.63s/it]training loss: 6.045e-03:   1%|          | 1814/300001 [16:03:21<2616:22:48, 31.59s/it]training loss: 6.045e-03:   1%|          | 1815/300001 [16:03:54<2635:20:17, 31.82s/it]training loss: 6.045e-03:   1%|          | 1816/300001 [16:04:25<2609:49:44, 31.51s/it]training loss: 6.045e-03:   1%|          | 1817/300001 [16:04:56<2618:03:43, 31.61s/it]training loss: 6.045e-03:   1%|          | 1818/300001 [16:05:27<2590:36:03, 31.28s/it]training loss: 6.045e-03:   1%|          | 1819/300001 [16:05:59<2613:23:22, 31.55s/it]training loss: 6.045e-03:   1%|          | 1820/300001 [16:06:31<2621:28:58, 31.65s/it]training loss: 5.584e-03:   1%|          | 1820/300001 [16:07:03<2621:28:58, 31.65s/it]training loss: 5.584e-03:   1%|          | 1821/300001 [16:07:03<2623:23:35, 31.67s/it]training loss: 5.584e-03:   1%|          | 1822/300001 [16:07:34<2614:53:29, 31.57s/it]training loss: 5.584e-03:   1%|          | 1823/300001 [16:08:06<2632:27:52, 31.78s/it]training loss: 5.584e-03:   1%|          | 1824/300001 [16:08:36<2589:18:16, 31.26s/it]training loss: 5.584e-03:   1%|          | 1825/300001 [16:09:09<2611:55:40, 31.53s/it]training loss: 5.584e-03:   1%|          | 1826/300001 [16:09:40<2615:58:34, 31.58s/it]training loss: 5.584e-03:   1%|          | 1827/300001 [16:10:13<2637:44:54, 31.85s/it]training loss: 5.584e-03:   1%|          | 1828/300001 [16:10:45<2641:59:46, 31.90s/it]training loss: 5.584e-03:   1%|          | 1829/300001 [16:11:17<2648:25:46, 31.98s/it]training loss: 5.584e-03:   1%|          | 1830/300001 [16:11:49<2659:57:04, 32.12s/it]training loss: 5.584e-03:   1%|          | 1831/300001 [16:12:22<2681:08:23, 32.37s/it]training loss: 5.584e-03:   1%|          | 1832/300001 [16:12:55<2682:38:50, 32.39s/it]training loss: 5.584e-03:   1%|          | 1833/300001 [16:13:26<2656:27:43, 32.07s/it]training loss: 5.584e-03:   1%|          | 1834/300001 [16:13:58<2651:01:32, 32.01s/it]training loss: 5.584e-03:   1%|          | 1835/300001 [16:14:31<2669:31:54, 32.23s/it]training loss: 5.584e-03:   1%|          | 1836/300001 [16:15:02<2645:43:56, 31.94s/it]training loss: 5.584e-03:   1%|          | 1837/300001 [16:15:33<2635:55:58, 31.83s/it]training loss: 5.584e-03:   1%|          | 1838/300001 [16:16:07<2678:12:10, 32.34s/it]training loss: 5.584e-03:   1%|          | 1839/300001 [16:16:39<2659:50:55, 32.11s/it]training loss: 5.584e-03:   1%|          | 1840/300001 [16:17:10<2652:24:18, 32.03s/it]training loss: 5.990e-03:   1%|          | 1840/300001 [16:17:43<2652:24:18, 32.03s/it]training loss: 5.990e-03:   1%|          | 1841/300001 [16:17:43<2660:22:12, 32.12s/it]training loss: 5.990e-03:   1%|          | 1842/300001 [16:18:14<2649:25:49, 31.99s/it]training loss: 5.990e-03:   1%|          | 1843/300001 [16:18:45<2615:52:36, 31.58s/it]training loss: 5.990e-03:   1%|          | 1844/300001 [16:19:17<2623:56:37, 31.68s/it]training loss: 5.990e-03:   1%|          | 1845/300001 [16:19:49<2633:36:48, 31.80s/it]training loss: 5.990e-03:   1%|          | 1846/300001 [16:20:21<2629:15:26, 31.75s/it]training loss: 5.990e-03:   1%|          | 1847/300001 [16:20:52<2625:12:41, 31.70s/it]training loss: 5.990e-03:   1%|          | 1848/300001 [16:21:26<2663:46:47, 32.16s/it]training loss: 5.990e-03:   1%|          | 1849/300001 [16:21:57<2655:38:54, 32.07s/it]training loss: 5.990e-03:   1%|          | 1850/300001 [16:22:29<2647:49:03, 31.97s/it]training loss: 5.990e-03:   1%|          | 1851/300001 [16:23:00<2625:45:52, 31.70s/it]training loss: 5.990e-03:   1%|          | 1852/300001 [16:23:32<2627:10:56, 31.72s/it]training loss: 5.990e-03:   1%|          | 1853/300001 [16:24:04<2642:37:11, 31.91s/it]training loss: 5.990e-03:   1%|          | 1854/300001 [16:24:35<2608:23:42, 31.50s/it]training loss: 5.990e-03:   1%|          | 1855/300001 [16:25:06<2600:39:57, 31.40s/it]training loss: 5.990e-03:   1%|          | 1856/300001 [16:25:39<2632:26:53, 31.79s/it]training loss: 5.990e-03:   1%|          | 1857/300001 [16:26:11<2639:12:26, 31.87s/it]training loss: 5.990e-03:   1%|          | 1858/300001 [16:26:42<2626:49:04, 31.72s/it]training loss: 5.990e-03:   1%|          | 1859/300001 [16:27:14<2622:35:54, 31.67s/it]training loss: 5.990e-03:   1%|          | 1860/300001 [16:27:46<2637:41:10, 31.85s/it]training loss: 5.307e-03:   1%|          | 1860/300001 [16:28:18<2637:41:10, 31.85s/it]training loss: 5.307e-03:   1%|          | 1861/300001 [16:28:18<2643:11:12, 31.92s/it]training loss: 5.307e-03:   1%|          | 1862/300001 [16:28:48<2593:54:48, 31.32s/it]training loss: 5.307e-03:   1%|          | 1863/300001 [16:29:20<2607:02:43, 31.48s/it]training loss: 5.307e-03:   1%|          | 1864/300001 [16:29:51<2597:40:04, 31.37s/it]training loss: 5.307e-03:   1%|          | 1865/300001 [16:30:22<2592:42:02, 31.31s/it]training loss: 5.307e-03:   1%|          | 1866/300001 [16:30:53<2594:01:00, 31.32s/it]training loss: 5.307e-03:   1%|          | 1867/300001 [16:31:25<2588:31:35, 31.26s/it]training loss: 5.307e-03:   1%|          | 1868/300001 [16:31:56<2596:27:17, 31.35s/it]training loss: 5.307e-03:   1%|          | 1869/300001 [16:32:27<2591:49:26, 31.30s/it]training loss: 5.307e-03:   1%|          | 1870/300001 [16:32:59<2599:37:18, 31.39s/it]training loss: 5.307e-03:   1%|          | 1871/300001 [16:33:31<2627:34:24, 31.73s/it]training loss: 5.307e-03:   1%|          | 1872/300001 [16:34:03<2631:05:17, 31.77s/it]training loss: 5.307e-03:   1%|          | 1873/300001 [16:34:35<2631:36:58, 31.78s/it]training loss: 5.307e-03:   1%|          | 1874/300001 [16:35:06<2615:40:11, 31.59s/it]training loss: 5.307e-03:   1%|          | 1875/300001 [16:35:38<2625:56:30, 31.71s/it]training loss: 5.307e-03:   1%|          | 1876/300001 [16:36:09<2604:40:50, 31.45s/it]training loss: 5.307e-03:   1%|          | 1877/300001 [16:36:40<2602:13:08, 31.42s/it]training loss: 5.307e-03:   1%|          | 1878/300001 [16:37:13<2638:03:40, 31.86s/it]training loss: 5.307e-03:   1%|          | 1879/300001 [16:37:45<2630:30:14, 31.76s/it]training loss: 5.307e-03:   1%|          | 1880/300001 [16:38:17<2634:16:17, 31.81s/it]training loss: 7.141e-03:   1%|          | 1880/300001 [16:38:49<2634:16:17, 31.81s/it]training loss: 7.141e-03:   1%|          | 1881/300001 [16:38:49<2635:35:04, 31.83s/it]training loss: 7.141e-03:   1%|          | 1882/300001 [16:39:21<2657:31:16, 32.09s/it]training loss: 7.141e-03:   1%|          | 1883/300001 [16:39:55<2686:33:50, 32.44s/it]training loss: 7.141e-03:   1%|          | 1884/300001 [16:40:18<2459:38:54, 29.70s/it]training loss: 7.141e-03:   1%|          | 1885/300001 [16:40:50<2520:40:58, 30.44s/it]training loss: 7.141e-03:   1%|          | 1886/300001 [16:41:23<2581:21:03, 31.17s/it]training loss: 7.141e-03:   1%|          | 1887/300001 [16:41:54<2581:55:17, 31.18s/it]training loss: 7.141e-03:   1%|          | 1888/300001 [16:42:26<2607:50:05, 31.49s/it]training loss: 7.141e-03:   1%|          | 1889/300001 [16:42:58<2611:16:55, 31.53s/it]training loss: 7.141e-03:   1%|          | 1890/300001 [16:43:30<2615:34:50, 31.59s/it]training loss: 7.141e-03:   1%|          | 1891/300001 [16:44:01<2607:42:17, 31.49s/it]training loss: 7.141e-03:   1%|          | 1892/300001 [16:44:33<2629:16:34, 31.75s/it]training loss: 7.141e-03:   1%|          | 1893/300001 [16:45:06<2648:50:38, 31.99s/it]training loss: 7.141e-03:   1%|          | 1894/300001 [16:45:38<2647:48:55, 31.98s/it]training loss: 7.141e-03:   1%|          | 1895/300001 [16:46:10<2666:08:15, 32.20s/it]training loss: 7.141e-03:   1%|          | 1896/300001 [16:46:43<2668:37:54, 32.23s/it]training loss: 7.141e-03:   1%|          | 1897/300001 [16:47:15<2665:31:31, 32.19s/it]training loss: 7.141e-03:   1%|          | 1898/300001 [16:47:47<2656:04:11, 32.08s/it]training loss: 7.141e-03:   1%|          | 1899/300001 [16:48:19<2650:25:45, 32.01s/it]training loss: 7.141e-03:   1%|          | 1900/300001 [16:48:50<2629:03:00, 31.75s/it]training loss: 5.980e-03:   1%|          | 1900/300001 [16:49:21<2629:03:00, 31.75s/it]training loss: 5.980e-03:   1%|          | 1901/300001 [16:49:21<2630:01:23, 31.76s/it]training loss: 5.980e-03:   1%|          | 1902/300001 [16:49:53<2616:11:21, 31.59s/it]training loss: 5.980e-03:   1%|          | 1903/300001 [16:50:24<2617:21:42, 31.61s/it]training loss: 5.980e-03:   1%|          | 1904/300001 [16:50:56<2614:41:49, 31.58s/it]training loss: 5.980e-03:   1%|          | 1905/300001 [16:51:27<2603:55:55, 31.45s/it]training loss: 5.980e-03:   1%|          | 1906/300001 [16:51:59<2612:14:11, 31.55s/it]training loss: 5.980e-03:   1%|          | 1907/300001 [16:52:30<2602:22:39, 31.43s/it]training loss: 5.980e-03:   1%|          | 1908/300001 [16:53:02<2626:03:11, 31.71s/it]training loss: 5.980e-03:   1%|          | 1909/300001 [16:53:34<2636:21:49, 31.84s/it]training loss: 5.980e-03:   1%|          | 1910/300001 [16:54:06<2622:08:58, 31.67s/it]training loss: 5.980e-03:   1%|          | 1911/300001 [16:54:37<2612:06:31, 31.55s/it]training loss: 5.980e-03:   1%|          | 1912/300001 [16:55:08<2607:02:26, 31.49s/it]training loss: 5.980e-03:   1%|          | 1913/300001 [16:55:40<2605:59:45, 31.47s/it]training loss: 5.980e-03:   1%|          | 1914/300001 [16:56:13<2642:16:42, 31.91s/it]training loss: 5.980e-03:   1%|          | 1915/300001 [16:56:44<2638:54:24, 31.87s/it]training loss: 5.980e-03:   1%|          | 1916/300001 [16:57:16<2623:59:50, 31.69s/it]training loss: 5.980e-03:   1%|          | 1917/300001 [16:57:47<2614:43:58, 31.58s/it]training loss: 5.980e-03:   1%|          | 1918/300001 [16:58:19<2616:32:48, 31.60s/it]training loss: 5.980e-03:   1%|          | 1919/300001 [16:58:50<2613:34:37, 31.56s/it]training loss: 5.980e-03:   1%|          | 1920/300001 [16:59:22<2631:18:57, 31.78s/it]training loss: 8.339e-03:   1%|          | 1920/300001 [16:59:55<2631:18:57, 31.78s/it]training loss: 8.339e-03:   1%|          | 1921/300001 [16:59:55<2649:28:06, 32.00s/it]training loss: 8.339e-03:   1%|          | 1922/300001 [17:00:27<2647:40:30, 31.98s/it]training loss: 8.339e-03:   1%|          | 1923/300001 [17:00:58<2628:47:21, 31.75s/it]training loss: 8.339e-03:   1%|          | 1924/300001 [17:01:30<2626:36:11, 31.72s/it]training loss: 8.339e-03:   1%|          | 1925/300001 [17:02:01<2610:07:11, 31.52s/it]training loss: 8.339e-03:   1%|          | 1926/300001 [17:02:32<2610:46:35, 31.53s/it]training loss: 8.339e-03:   1%|          | 1927/300001 [17:03:03<2581:42:05, 31.18s/it]training loss: 8.339e-03:   1%|          | 1928/300001 [17:03:34<2578:31:31, 31.14s/it]training loss: 8.339e-03:   1%|          | 1929/300001 [17:04:06<2594:49:27, 31.34s/it]training loss: 8.339e-03:   1%|          | 1930/300001 [17:04:37<2596:23:59, 31.36s/it]training loss: 8.339e-03:   1%|          | 1931/300001 [17:05:09<2614:05:16, 31.57s/it]training loss: 8.339e-03:   1%|          | 1932/300001 [17:05:40<2594:36:49, 31.34s/it]training loss: 8.339e-03:   1%|          | 1933/300001 [17:06:11<2597:53:29, 31.38s/it]training loss: 8.339e-03:   1%|          | 1934/300001 [17:06:42<2573:35:02, 31.08s/it]training loss: 8.339e-03:   1%|          | 1935/300001 [17:07:13<2590:47:05, 31.29s/it]training loss: 8.339e-03:   1%|          | 1936/300001 [17:07:46<2620:35:48, 31.65s/it]training loss: 8.339e-03:   1%|          | 1937/300001 [17:08:18<2621:10:34, 31.66s/it]training loss: 8.339e-03:   1%|          | 1938/300001 [17:08:51<2661:58:38, 32.15s/it]training loss: 8.339e-03:   1%|          | 1939/300001 [17:09:25<2696:59:24, 32.57s/it]training loss: 8.339e-03:   1%|          | 1940/300001 [17:09:56<2667:02:35, 32.21s/it]training loss: 6.176e-03:   1%|          | 1940/300001 [17:10:27<2667:02:35, 32.21s/it]training loss: 6.176e-03:   1%|          | 1941/300001 [17:10:27<2632:10:30, 31.79s/it]training loss: 6.176e-03:   1%|          | 1942/300001 [17:10:58<2624:11:48, 31.70s/it]training loss: 6.176e-03:   1%|          | 1943/300001 [17:11:29<2609:37:01, 31.52s/it]training loss: 6.176e-03:   1%|          | 1944/300001 [17:12:00<2590:35:12, 31.29s/it]training loss: 6.176e-03:   1%|          | 1945/300001 [17:12:32<2616:17:50, 31.60s/it]training loss: 6.176e-03:   1%|          | 1946/300001 [17:13:03<2604:24:10, 31.46s/it]training loss: 6.176e-03:   1%|          | 1947/300001 [17:13:35<2604:54:45, 31.46s/it]training loss: 6.176e-03:   1%|          | 1948/300001 [17:14:07<2615:45:31, 31.59s/it]training loss: 6.176e-03:   1%|          | 1949/300001 [17:14:38<2608:33:46, 31.51s/it]training loss: 6.176e-03:   1%|          | 1950/300001 [17:15:11<2650:03:05, 32.01s/it]training loss: 6.176e-03:   1%|          | 1951/300001 [17:15:43<2652:24:11, 32.04s/it]training loss: 6.176e-03:   1%|          | 1952/300001 [17:16:15<2641:19:16, 31.90s/it]training loss: 6.176e-03:   1%|          | 1953/300001 [17:16:46<2628:28:01, 31.75s/it]training loss: 6.176e-03:   1%|          | 1954/300001 [17:17:18<2622:55:05, 31.68s/it]training loss: 6.176e-03:   1%|          | 1955/300001 [17:17:49<2607:50:45, 31.50s/it]training loss: 6.176e-03:   1%|          | 1956/300001 [17:18:21<2613:10:49, 31.56s/it]training loss: 6.176e-03:   1%|          | 1957/300001 [17:18:53<2628:21:07, 31.75s/it]training loss: 6.176e-03:   1%|          | 1958/300001 [17:19:24<2612:32:33, 31.56s/it]training loss: 6.176e-03:   1%|          | 1959/300001 [17:19:55<2599:15:33, 31.40s/it]training loss: 6.176e-03:   1%|          | 1960/300001 [17:20:27<2602:16:17, 31.43s/it]training loss: 5.960e-03:   1%|          | 1960/300001 [17:20:58<2602:16:17, 31.43s/it]training loss: 5.960e-03:   1%|          | 1961/300001 [17:20:58<2604:54:37, 31.46s/it]training loss: 5.960e-03:   1%|          | 1962/300001 [17:21:29<2580:53:25, 31.17s/it]training loss: 5.960e-03:   1%|          | 1963/300001 [17:22:00<2582:56:03, 31.20s/it]training loss: 5.960e-03:   1%|          | 1964/300001 [17:22:31<2587:53:56, 31.26s/it]training loss: 5.960e-03:   1%|          | 1965/300001 [17:23:04<2628:22:24, 31.75s/it]training loss: 5.960e-03:   1%|          | 1966/300001 [17:23:35<2601:27:22, 31.42s/it]training loss: 5.960e-03:   1%|          | 1967/300001 [17:24:06<2595:01:45, 31.35s/it]training loss: 5.960e-03:   1%|          | 1968/300001 [17:24:38<2605:13:11, 31.47s/it]training loss: 5.960e-03:   1%|          | 1969/300001 [17:25:10<2629:03:35, 31.76s/it]training loss: 5.960e-03:   1%|          | 1970/300001 [17:25:43<2647:07:50, 31.98s/it]training loss: 5.960e-03:   1%|          | 1971/300001 [17:26:14<2635:34:27, 31.84s/it]training loss: 5.960e-03:   1%|          | 1972/300001 [17:26:47<2663:09:04, 32.17s/it]training loss: 5.960e-03:   1%|          | 1973/300001 [17:27:18<2639:21:40, 31.88s/it]training loss: 5.960e-03:   1%|          | 1974/300001 [17:27:49<2613:58:46, 31.58s/it]training loss: 5.960e-03:   1%|          | 1975/300001 [17:28:19<2577:42:51, 31.14s/it]training loss: 5.960e-03:   1%|          | 1976/300001 [17:28:50<2572:14:16, 31.07s/it]training loss: 5.960e-03:   1%|          | 1977/300001 [17:29:22<2595:55:04, 31.36s/it]training loss: 5.960e-03:   1%|          | 1978/300001 [17:29:54<2595:35:13, 31.35s/it]training loss: 5.960e-03:   1%|          | 1979/300001 [17:30:26<2623:37:50, 31.69s/it]training loss: 5.960e-03:   1%|          | 1980/300001 [17:30:58<2624:39:32, 31.71s/it]training loss: 6.836e-03:   1%|          | 1980/300001 [17:31:29<2624:39:32, 31.71s/it]training loss: 6.836e-03:   1%|          | 1981/300001 [17:31:29<2622:56:46, 31.68s/it]training loss: 6.836e-03:   1%|          | 1982/300001 [17:32:00<2601:49:50, 31.43s/it]training loss: 6.836e-03:   1%|          | 1983/300001 [17:32:32<2602:34:05, 31.44s/it]training loss: 6.836e-03:   1%|          | 1984/300001 [17:33:04<2618:45:11, 31.63s/it]training loss: 6.836e-03:   1%|          | 1985/300001 [17:33:36<2637:00:04, 31.85s/it]training loss: 6.836e-03:   1%|          | 1986/300001 [17:34:08<2645:43:42, 31.96s/it]training loss: 6.836e-03:   1%|          | 1987/300001 [17:34:40<2635:35:49, 31.84s/it]training loss: 6.836e-03:   1%|          | 1988/300001 [17:35:11<2614:38:45, 31.58s/it]training loss: 6.836e-03:   1%|          | 1989/300001 [17:35:42<2599:40:02, 31.40s/it]training loss: 6.836e-03:   1%|          | 1990/300001 [17:36:14<2612:34:37, 31.56s/it]training loss: 6.836e-03:   1%|          | 1991/300001 [17:36:47<2656:04:20, 32.09s/it]training loss: 6.836e-03:   1%|          | 1992/300001 [17:37:17<2604:34:20, 31.46s/it]training loss: 6.836e-03:   1%|          | 1993/300001 [17:37:49<2607:40:28, 31.50s/it]training loss: 6.836e-03:   1%|          | 1994/300001 [17:38:20<2613:21:21, 31.57s/it]training loss: 6.836e-03:   1%|          | 1995/300001 [17:38:53<2630:31:05, 31.78s/it]training loss: 6.836e-03:   1%|          | 1996/300001 [17:39:25<2653:27:31, 32.05s/it]training loss: 6.836e-03:   1%|          | 1997/300001 [17:39:57<2645:45:34, 31.96s/it]training loss: 6.836e-03:   1%|          | 1998/300001 [17:40:28<2609:35:39, 31.52s/it]training loss: 6.836e-03:   1%|          | 1999/300001 [17:40:59<2605:33:17, 31.48s/it]training loss: 6.836e-03:   1%|          | 2000/300001 [17:41:31<2606:42:37, 31.49s/it]training loss: 6.558e-03:   1%|          | 2000/300001 [17:42:02<2606:42:37, 31.49s/it]training loss: 6.558e-03:   1%|          | 2001/300001 [17:42:06<2695:00:45, 32.56s/it]training loss: 6.558e-03:   1%|          | 2002/300001 [17:42:37<2670:33:51, 32.26s/it]training loss: 6.558e-03:   1%|          | 2003/300001 [17:43:09<2649:23:27, 32.01s/it]training loss: 6.558e-03:   1%|          | 2004/300001 [17:43:40<2643:28:33, 31.93s/it]training loss: 6.558e-03:   1%|          | 2005/300001 [17:44:12<2625:02:16, 31.71s/it]training loss: 6.558e-03:   1%|          | 2006/300001 [17:44:43<2629:28:30, 31.77s/it]training loss: 6.558e-03:   1%|          | 2007/300001 [17:45:16<2642:09:39, 31.92s/it]training loss: 6.558e-03:   1%|          | 2008/300001 [17:45:48<2639:39:33, 31.89s/it]training loss: 6.558e-03:   1%|          | 2009/300001 [17:46:20<2642:57:37, 31.93s/it]training loss: 6.558e-03:   1%|          | 2010/300001 [17:46:50<2615:08:46, 31.59s/it]training loss: 6.558e-03:   1%|          | 2011/300001 [17:47:23<2648:14:43, 31.99s/it]training loss: 6.558e-03:   1%|          | 2012/300001 [17:47:55<2643:13:03, 31.93s/it]training loss: 6.558e-03:   1%|          | 2013/300001 [17:48:26<2627:06:09, 31.74s/it]training loss: 6.558e-03:   1%|          | 2014/300001 [17:48:59<2655:19:05, 32.08s/it]training loss: 6.558e-03:   1%|          | 2015/300001 [17:49:30<2620:49:09, 31.66s/it]training loss: 6.558e-03:   1%|          | 2016/300001 [17:50:03<2659:08:31, 32.13s/it]training loss: 6.558e-03:   1%|          | 2017/300001 [17:50:35<2663:23:51, 32.18s/it]training loss: 6.558e-03:   1%|          | 2018/300001 [17:51:07<2635:05:36, 31.84s/it]training loss: 6.558e-03:   1%|          | 2019/300001 [17:51:39<2649:44:49, 32.01s/it]training loss: 6.558e-03:   1%|          | 2020/300001 [17:52:11<2641:32:16, 31.91s/it]training loss: 5.209e-03:   1%|          | 2020/300001 [17:52:42<2641:32:16, 31.91s/it]training loss: 5.209e-03:   1%|          | 2021/300001 [17:52:42<2628:09:25, 31.75s/it]training loss: 5.209e-03:   1%|          | 2022/300001 [17:53:14<2633:23:38, 31.82s/it]training loss: 5.209e-03:   1%|          | 2023/300001 [17:53:46<2647:22:37, 31.98s/it]training loss: 5.209e-03:   1%|          | 2024/300001 [17:54:17<2619:16:10, 31.64s/it]training loss: 5.209e-03:   1%|          | 2025/300001 [17:54:49<2621:54:12, 31.68s/it]training loss: 5.209e-03:   1%|          | 2026/300001 [17:55:21<2634:45:22, 31.83s/it]training loss: 5.209e-03:   1%|          | 2027/300001 [17:55:54<2652:10:45, 32.04s/it]training loss: 5.209e-03:   1%|          | 2028/300001 [17:56:26<2656:50:15, 32.10s/it]training loss: 5.209e-03:   1%|          | 2029/300001 [17:56:58<2662:00:16, 32.16s/it]training loss: 5.209e-03:   1%|          | 2030/300001 [17:57:29<2634:10:03, 31.83s/it]training loss: 5.209e-03:   1%|          | 2031/300001 [17:58:00<2619:31:39, 31.65s/it]training loss: 5.209e-03:   1%|          | 2032/300001 [17:58:32<2625:36:37, 31.72s/it]training loss: 5.209e-03:   1%|          | 2033/300001 [17:59:04<2625:52:07, 31.73s/it]training loss: 5.209e-03:   1%|          | 2034/300001 [17:59:35<2595:32:27, 31.36s/it]training loss: 5.209e-03:   1%|          | 2035/300001 [18:00:06<2589:41:34, 31.29s/it]training loss: 5.209e-03:   1%|          | 2036/300001 [18:00:38<2610:14:17, 31.54s/it]training loss: 5.209e-03:   1%|          | 2037/300001 [18:01:08<2586:28:45, 31.25s/it]training loss: 5.209e-03:   1%|          | 2038/300001 [18:01:41<2616:12:38, 31.61s/it]training loss: 5.209e-03:   1%|          | 2039/300001 [18:02:12<2599:22:43, 31.41s/it]training loss: 5.209e-03:   1%|          | 2040/300001 [18:02:44<2625:54:16, 31.73s/it]training loss: 6.654e-03:   1%|          | 2040/300001 [18:03:08<2625:54:16, 31.73s/it]training loss: 6.654e-03:   1%|          | 2041/300001 [18:03:08<2436:58:12, 29.44s/it]training loss: 6.654e-03:   1%|          | 2042/300001 [18:03:39<2462:34:30, 29.75s/it]training loss: 6.654e-03:   1%|          | 2043/300001 [18:04:11<2511:08:52, 30.34s/it]training loss: 6.654e-03:   1%|          | 2044/300001 [18:04:42<2529:06:20, 30.56s/it]training loss: 6.654e-03:   1%|          | 2045/300001 [18:05:13<2558:52:32, 30.92s/it]training loss: 6.654e-03:   1%|          | 2046/300001 [18:05:45<2582:23:12, 31.20s/it]training loss: 6.654e-03:   1%|          | 2047/300001 [18:06:18<2621:56:36, 31.68s/it]training loss: 6.654e-03:   1%|          | 2048/300001 [18:06:50<2619:43:53, 31.65s/it]training loss: 6.654e-03:   1%|          | 2049/300001 [18:07:21<2620:48:10, 31.67s/it]training loss: 6.654e-03:   1%|          | 2050/300001 [18:07:53<2625:03:45, 31.72s/it]training loss: 6.654e-03:   1%|          | 2051/300001 [18:08:25<2627:38:29, 31.75s/it]training loss: 6.654e-03:   1%|          | 2052/300001 [18:08:58<2664:22:32, 32.19s/it]training loss: 6.654e-03:   1%|          | 2053/300001 [18:09:31<2667:51:51, 32.23s/it]training loss: 6.654e-03:   1%|          | 2054/300001 [18:10:02<2655:31:01, 32.09s/it]training loss: 6.654e-03:   1%|          | 2055/300001 [18:10:35<2667:49:22, 32.23s/it]training loss: 6.654e-03:   1%|          | 2056/300001 [18:11:06<2644:39:47, 31.95s/it]training loss: 6.654e-03:   1%|          | 2057/300001 [18:11:37<2604:44:37, 31.47s/it]training loss: 6.654e-03:   1%|          | 2058/300001 [18:12:08<2611:40:57, 31.56s/it]training loss: 6.654e-03:   1%|          | 2059/300001 [18:12:43<2694:06:33, 32.55s/it]training loss: 6.654e-03:   1%|          | 2060/300001 [18:13:14<2653:44:39, 32.07s/it]training loss: 6.199e-03:   1%|          | 2060/300001 [18:13:47<2653:44:39, 32.07s/it]training loss: 6.199e-03:   1%|          | 2061/300001 [18:13:47<2667:27:34, 32.23s/it]training loss: 6.199e-03:   1%|          | 2062/300001 [18:14:18<2647:34:27, 31.99s/it]training loss: 6.199e-03:   1%|          | 2063/300001 [18:14:50<2641:31:50, 31.92s/it]training loss: 6.199e-03:   1%|          | 2064/300001 [18:15:22<2634:58:42, 31.84s/it]training loss: 6.199e-03:   1%|          | 2065/300001 [18:15:53<2622:08:14, 31.68s/it]training loss: 6.199e-03:   1%|          | 2066/300001 [18:16:25<2627:30:01, 31.75s/it]training loss: 6.199e-03:   1%|          | 2067/300001 [18:16:57<2627:32:21, 31.75s/it]training loss: 6.199e-03:   1%|          | 2068/300001 [18:17:28<2624:39:57, 31.71s/it]training loss: 6.199e-03:   1%|          | 2069/300001 [18:18:00<2617:49:28, 31.63s/it]training loss: 6.199e-03:   1%|          | 2070/300001 [18:18:30<2591:44:31, 31.32s/it]training loss: 6.199e-03:   1%|          | 2071/300001 [18:19:03<2617:04:50, 31.62s/it]training loss: 6.199e-03:   1%|          | 2072/300001 [18:19:34<2606:59:26, 31.50s/it]training loss: 6.199e-03:   1%|          | 2073/300001 [18:20:05<2612:09:54, 31.56s/it]training loss: 6.199e-03:   1%|          | 2074/300001 [18:20:38<2630:19:05, 31.78s/it]training loss: 6.199e-03:   1%|          | 2075/300001 [18:21:11<2660:56:52, 32.15s/it]training loss: 6.199e-03:   1%|          | 2076/300001 [18:21:42<2641:18:39, 31.92s/it]training loss: 6.199e-03:   1%|          | 2077/300001 [18:22:14<2649:53:54, 32.02s/it]training loss: 6.199e-03:   1%|          | 2078/300001 [18:22:47<2658:23:40, 32.12s/it]training loss: 6.199e-03:   1%|          | 2079/300001 [18:23:20<2677:02:11, 32.35s/it]training loss: 6.199e-03:   1%|          | 2080/300001 [18:23:51<2661:00:56, 32.16s/it]training loss: 6.131e-03:   1%|          | 2080/300001 [18:24:24<2661:00:56, 32.16s/it]training loss: 6.131e-03:   1%|          | 2081/300001 [18:24:24<2668:21:51, 32.24s/it]training loss: 6.131e-03:   1%|          | 2082/300001 [18:24:57<2687:48:17, 32.48s/it]training loss: 6.131e-03:   1%|          | 2083/300001 [18:25:29<2686:57:49, 32.47s/it]training loss: 6.131e-03:   1%|          | 2084/300001 [18:26:02<2688:15:24, 32.48s/it]training loss: 6.131e-03:   1%|          | 2085/300001 [18:26:35<2701:04:01, 32.64s/it]training loss: 6.131e-03:   1%|          | 2086/300001 [18:27:06<2677:23:04, 32.35s/it]training loss: 6.131e-03:   1%|          | 2087/300001 [18:27:39<2672:58:13, 32.30s/it]training loss: 6.131e-03:   1%|          | 2088/300001 [18:28:11<2663:39:12, 32.19s/it]training loss: 6.131e-03:   1%|          | 2089/300001 [18:28:43<2660:34:22, 32.15s/it]training loss: 6.131e-03:   1%|          | 2090/300001 [18:29:15<2655:14:06, 32.09s/it]training loss: 6.131e-03:   1%|          | 2091/300001 [18:29:47<2661:09:03, 32.16s/it]training loss: 6.131e-03:   1%|          | 2092/300001 [18:30:19<2655:45:43, 32.09s/it]training loss: 6.131e-03:   1%|          | 2093/300001 [18:30:49<2604:29:37, 31.47s/it]training loss: 6.131e-03:   1%|          | 2094/300001 [18:31:22<2635:41:53, 31.85s/it]training loss: 6.131e-03:   1%|          | 2095/300001 [18:31:52<2612:27:28, 31.57s/it]training loss: 6.131e-03:   1%|          | 2096/300001 [18:32:24<2618:36:56, 31.64s/it]training loss: 6.131e-03:   1%|          | 2097/300001 [18:32:55<2596:18:51, 31.37s/it]training loss: 6.131e-03:   1%|          | 2098/300001 [18:33:26<2583:08:16, 31.22s/it]training loss: 6.131e-03:   1%|          | 2099/300001 [18:33:58<2612:14:51, 31.57s/it]training loss: 6.131e-03:   1%|          | 2100/300001 [18:34:30<2614:23:17, 31.59s/it]training loss: 6.008e-03:   1%|          | 2100/300001 [18:35:02<2614:23:17, 31.59s/it]training loss: 6.008e-03:   1%|          | 2101/300001 [18:35:02<2621:48:04, 31.68s/it]training loss: 6.008e-03:   1%|          | 2102/300001 [18:35:34<2635:53:09, 31.85s/it]training loss: 6.008e-03:   1%|          | 2103/300001 [18:36:06<2646:04:55, 31.98s/it]training loss: 6.008e-03:   1%|          | 2104/300001 [18:36:38<2631:10:54, 31.80s/it]training loss: 6.008e-03:   1%|          | 2105/300001 [18:37:09<2622:07:26, 31.69s/it]training loss: 6.008e-03:   1%|          | 2106/300001 [18:37:40<2604:03:35, 31.47s/it]training loss: 6.008e-03:   1%|          | 2107/300001 [18:38:13<2630:01:47, 31.78s/it]training loss: 6.008e-03:   1%|          | 2108/300001 [18:38:45<2650:02:11, 32.03s/it]training loss: 6.008e-03:   1%|          | 2109/300001 [18:39:18<2669:52:14, 32.27s/it]training loss: 6.008e-03:   1%|          | 2110/300001 [18:39:50<2655:03:17, 32.09s/it]training loss: 6.008e-03:   1%|          | 2111/300001 [18:40:20<2620:24:18, 31.67s/it]training loss: 6.008e-03:   1%|          | 2112/300001 [18:40:52<2621:49:42, 31.68s/it]training loss: 6.008e-03:   1%|          | 2113/300001 [18:41:24<2624:29:33, 31.72s/it]training loss: 6.008e-03:   1%|          | 2114/300001 [18:41:55<2616:01:23, 31.61s/it]training loss: 6.008e-03:   1%|          | 2115/300001 [18:42:27<2610:52:57, 31.55s/it]training loss: 6.008e-03:   1%|          | 2116/300001 [18:42:59<2617:29:16, 31.63s/it]training loss: 6.008e-03:   1%|          | 2117/300001 [18:43:30<2602:04:40, 31.45s/it]training loss: 6.008e-03:   1%|          | 2118/300001 [18:44:00<2572:28:17, 31.09s/it]training loss: 6.008e-03:   1%|          | 2119/300001 [18:44:31<2574:56:33, 31.12s/it]training loss: 6.008e-03:   1%|          | 2120/300001 [18:45:02<2568:24:38, 31.04s/it]training loss: 5.963e-03:   1%|          | 2120/300001 [18:45:34<2568:24:38, 31.04s/it]training loss: 5.963e-03:   1%|          | 2121/300001 [18:45:34<2603:42:40, 31.47s/it]training loss: 5.963e-03:   1%|          | 2122/300001 [18:46:06<2617:21:07, 31.63s/it]training loss: 5.963e-03:   1%|          | 2123/300001 [18:46:39<2642:27:55, 31.94s/it]training loss: 5.963e-03:   1%|          | 2124/300001 [18:47:12<2658:52:08, 32.13s/it]training loss: 5.963e-03:   1%|          | 2125/300001 [18:47:44<2665:07:39, 32.21s/it]training loss: 5.963e-03:   1%|          | 2126/300001 [18:48:17<2676:34:59, 32.35s/it]training loss: 5.963e-03:   1%|          | 2127/300001 [18:48:47<2624:33:41, 31.72s/it]training loss: 5.963e-03:   1%|          | 2128/300001 [18:49:18<2606:56:25, 31.51s/it]training loss: 5.963e-03:   1%|          | 2129/300001 [18:49:50<2619:03:05, 31.65s/it]training loss: 5.963e-03:   1%|          | 2130/300001 [18:50:22<2642:31:44, 31.94s/it]training loss: 5.963e-03:   1%|          | 2131/300001 [18:50:55<2649:41:34, 32.02s/it]training loss: 5.963e-03:   1%|          | 2132/300001 [18:51:26<2623:36:51, 31.71s/it]training loss: 5.963e-03:   1%|          | 2133/300001 [18:51:57<2617:01:41, 31.63s/it]training loss: 5.963e-03:   1%|          | 2134/300001 [18:52:28<2607:48:34, 31.52s/it]training loss: 5.963e-03:   1%|          | 2135/300001 [18:53:01<2625:01:48, 31.73s/it]training loss: 5.963e-03:   1%|          | 2136/300001 [18:53:31<2599:57:45, 31.42s/it]training loss: 5.963e-03:   1%|          | 2137/300001 [18:54:03<2616:05:42, 31.62s/it]training loss: 5.963e-03:   1%|          | 2138/300001 [18:54:36<2637:26:20, 31.88s/it]training loss: 5.963e-03:   1%|          | 2139/300001 [18:55:08<2643:07:29, 31.95s/it]training loss: 5.963e-03:   1%|          | 2140/300001 [18:55:40<2644:15:05, 31.96s/it]training loss: 6.731e-03:   1%|          | 2140/300001 [18:56:12<2644:15:05, 31.96s/it]training loss: 6.731e-03:   1%|          | 2141/300001 [18:56:12<2646:42:09, 31.99s/it]training loss: 6.731e-03:   1%|          | 2142/300001 [18:56:45<2659:17:30, 32.14s/it]training loss: 6.731e-03:   1%|          | 2143/300001 [18:57:17<2656:11:16, 32.10s/it]training loss: 6.731e-03:   1%|          | 2144/300001 [18:57:48<2628:54:43, 31.77s/it]training loss: 6.731e-03:   1%|          | 2145/300001 [18:58:20<2645:27:10, 31.97s/it]training loss: 6.731e-03:   1%|          | 2146/300001 [18:58:52<2641:59:45, 31.93s/it]training loss: 6.731e-03:   1%|          | 2147/300001 [18:59:24<2643:25:32, 31.95s/it]training loss: 6.731e-03:   1%|          | 2148/300001 [18:59:55<2627:49:05, 31.76s/it]training loss: 6.731e-03:   1%|          | 2149/300001 [19:00:27<2642:34:17, 31.94s/it]training loss: 6.731e-03:   1%|          | 2150/300001 [19:00:59<2633:49:32, 31.83s/it]training loss: 6.731e-03:   1%|          | 2151/300001 [19:01:32<2649:36:09, 32.02s/it]training loss: 6.731e-03:   1%|          | 2152/300001 [19:02:03<2646:57:50, 31.99s/it]training loss: 6.731e-03:   1%|          | 2153/300001 [19:02:35<2642:30:18, 31.94s/it]training loss: 6.731e-03:   1%|          | 2154/300001 [19:03:07<2645:07:26, 31.97s/it]training loss: 6.731e-03:   1%|          | 2155/300001 [19:03:38<2610:41:55, 31.55s/it]training loss: 6.731e-03:   1%|          | 2156/300001 [19:04:10<2611:53:53, 31.57s/it]training loss: 6.731e-03:   1%|          | 2157/300001 [19:04:42<2627:41:22, 31.76s/it]training loss: 6.731e-03:   1%|          | 2158/300001 [19:05:14<2641:58:03, 31.93s/it]training loss: 6.731e-03:   1%|          | 2159/300001 [19:05:46<2645:02:45, 31.97s/it]training loss: 6.731e-03:   1%|          | 2160/300001 [19:06:18<2636:02:44, 31.86s/it]training loss: 5.385e-03:   1%|          | 2160/300001 [19:06:48<2636:02:44, 31.86s/it]training loss: 5.385e-03:   1%|          | 2161/300001 [19:06:48<2606:00:39, 31.50s/it]training loss: 5.385e-03:   1%|          | 2162/300001 [19:07:20<2614:03:00, 31.60s/it]training loss: 5.385e-03:   1%|          | 2163/300001 [19:07:52<2625:25:39, 31.73s/it]training loss: 5.385e-03:   1%|          | 2164/300001 [19:08:24<2620:13:13, 31.67s/it]training loss: 5.385e-03:   1%|          | 2165/300001 [19:08:56<2628:50:35, 31.78s/it]training loss: 5.385e-03:   1%|          | 2166/300001 [19:09:28<2628:03:35, 31.77s/it]training loss: 5.385e-03:   1%|          | 2167/300001 [19:09:59<2631:52:51, 31.81s/it]training loss: 5.385e-03:   1%|          | 2168/300001 [19:10:32<2648:32:01, 32.01s/it]training loss: 5.385e-03:   1%|          | 2169/300001 [19:11:04<2648:12:25, 32.01s/it]training loss: 5.385e-03:   1%|          | 2170/300001 [19:11:35<2624:45:22, 31.73s/it]training loss: 5.385e-03:   1%|          | 2171/300001 [19:12:07<2623:45:44, 31.71s/it]training loss: 5.385e-03:   1%|          | 2172/300001 [19:12:39<2635:13:05, 31.85s/it]training loss: 5.385e-03:   1%|          | 2173/300001 [19:13:10<2623:36:10, 31.71s/it]training loss: 5.385e-03:   1%|          | 2174/300001 [19:13:42<2621:47:16, 31.69s/it]training loss: 5.385e-03:   1%|          | 2175/300001 [19:14:14<2620:42:48, 31.68s/it]training loss: 5.385e-03:   1%|          | 2176/300001 [19:14:45<2619:17:05, 31.66s/it]training loss: 5.385e-03:   1%|          | 2177/300001 [19:15:17<2632:13:31, 31.82s/it]training loss: 5.385e-03:   1%|          | 2178/300001 [19:15:49<2635:40:34, 31.86s/it]training loss: 5.385e-03:   1%|          | 2179/300001 [19:16:20<2612:09:27, 31.58s/it]training loss: 5.385e-03:   1%|          | 2180/300001 [19:16:52<2606:41:22, 31.51s/it]training loss: 5.929e-03:   1%|          | 2180/300001 [19:17:23<2606:41:22, 31.51s/it]training loss: 5.929e-03:   1%|          | 2181/300001 [19:17:23<2608:05:58, 31.53s/it]training loss: 5.929e-03:   1%|          | 2182/300001 [19:17:55<2625:38:41, 31.74s/it]training loss: 5.929e-03:   1%|          | 2183/300001 [19:18:27<2633:03:18, 31.83s/it]training loss: 5.929e-03:   1%|          | 2184/300001 [19:18:58<2609:00:23, 31.54s/it]training loss: 5.929e-03:   1%|          | 2185/300001 [19:19:31<2626:26:28, 31.75s/it]training loss: 5.929e-03:   1%|          | 2186/300001 [19:20:03<2644:48:42, 31.97s/it]training loss: 5.929e-03:   1%|          | 2187/300001 [19:20:36<2661:57:46, 32.18s/it]training loss: 5.929e-03:   1%|          | 2188/300001 [19:21:06<2624:59:20, 31.73s/it]training loss: 5.929e-03:   1%|          | 2189/300001 [19:21:38<2615:53:23, 31.62s/it]training loss: 5.929e-03:   1%|          | 2190/300001 [19:22:10<2629:14:33, 31.78s/it]training loss: 5.929e-03:   1%|          | 2191/300001 [19:22:42<2629:24:21, 31.78s/it]training loss: 5.929e-03:   1%|          | 2192/300001 [19:23:14<2630:58:24, 31.80s/it]training loss: 5.929e-03:   1%|          | 2193/300001 [19:23:45<2614:51:40, 31.61s/it]training loss: 5.929e-03:   1%|          | 2194/300001 [19:24:17<2633:57:46, 31.84s/it]training loss: 5.929e-03:   1%|          | 2195/300001 [19:24:50<2652:04:05, 32.06s/it]training loss: 5.929e-03:   1%|          | 2196/300001 [19:25:22<2655:09:38, 32.10s/it]training loss: 5.929e-03:   1%|          | 2197/300001 [19:25:54<2655:14:23, 32.10s/it]training loss: 5.929e-03:   1%|          | 2198/300001 [19:26:16<2405:13:00, 29.08s/it]training loss: 5.929e-03:   1%|          | 2199/300001 [19:26:48<2473:45:23, 29.90s/it]training loss: 5.929e-03:   1%|          | 2200/300001 [19:27:19<2513:10:39, 30.38s/it]training loss: 6.044e-03:   1%|          | 2200/300001 [19:27:51<2513:10:39, 30.38s/it]training loss: 6.044e-03:   1%|          | 2201/300001 [19:27:51<2544:36:06, 30.76s/it]training loss: 6.044e-03:   1%|          | 2202/300001 [19:28:24<2591:27:41, 31.33s/it]training loss: 6.044e-03:   1%|          | 2203/300001 [19:28:55<2586:43:08, 31.27s/it]training loss: 6.044e-03:   1%|          | 2204/300001 [19:29:26<2597:32:20, 31.40s/it]training loss: 6.044e-03:   1%|          | 2205/300001 [19:29:57<2585:15:47, 31.25s/it]training loss: 6.044e-03:   1%|          | 2206/300001 [19:30:29<2604:05:13, 31.48s/it]training loss: 6.044e-03:   1%|          | 2207/300001 [19:31:01<2611:45:20, 31.57s/it]training loss: 6.044e-03:   1%|          | 2208/300001 [19:31:34<2649:54:31, 32.03s/it]training loss: 6.044e-03:   1%|          | 2209/300001 [19:32:07<2665:27:39, 32.22s/it]training loss: 6.044e-03:   1%|          | 2210/300001 [19:32:39<2659:56:03, 32.16s/it]training loss: 6.044e-03:   1%|          | 2211/300001 [19:33:10<2643:19:26, 31.96s/it]training loss: 6.044e-03:   1%|          | 2212/300001 [19:33:42<2632:41:09, 31.83s/it]training loss: 6.044e-03:   1%|          | 2213/300001 [19:34:13<2608:57:18, 31.54s/it]training loss: 6.044e-03:   1%|          | 2214/300001 [19:34:44<2609:26:55, 31.55s/it]training loss: 6.044e-03:   1%|          | 2215/300001 [19:35:15<2587:57:50, 31.29s/it]training loss: 6.044e-03:   1%|          | 2216/300001 [19:35:46<2581:54:32, 31.21s/it]training loss: 6.044e-03:   1%|          | 2217/300001 [19:36:18<2595:00:18, 31.37s/it]training loss: 6.044e-03:   1%|          | 2218/300001 [19:36:51<2631:35:19, 31.81s/it]training loss: 6.044e-03:   1%|          | 2219/300001 [19:37:23<2646:41:34, 32.00s/it]training loss: 6.044e-03:   1%|          | 2220/300001 [19:37:56<2667:06:53, 32.24s/it]training loss: 5.496e-03:   1%|          | 2220/300001 [19:38:27<2667:06:53, 32.24s/it]training loss: 5.496e-03:   1%|          | 2221/300001 [19:38:27<2649:45:00, 32.03s/it]training loss: 5.496e-03:   1%|          | 2222/300001 [19:38:59<2636:21:41, 31.87s/it]training loss: 5.496e-03:   1%|          | 2223/300001 [19:39:31<2632:17:37, 31.82s/it]training loss: 5.496e-03:   1%|          | 2224/300001 [19:40:02<2629:18:53, 31.79s/it]training loss: 5.496e-03:   1%|          | 2225/300001 [19:40:33<2613:21:03, 31.59s/it]training loss: 5.496e-03:   1%|          | 2226/300001 [19:41:06<2640:11:22, 31.92s/it]training loss: 5.496e-03:   1%|          | 2227/300001 [19:41:37<2617:51:38, 31.65s/it]training loss: 5.496e-03:   1%|          | 2228/300001 [19:42:10<2641:27:23, 31.93s/it]training loss: 5.496e-03:   1%|          | 2229/300001 [19:42:40<2601:09:35, 31.45s/it]training loss: 5.496e-03:   1%|          | 2230/300001 [19:43:11<2600:01:13, 31.43s/it]training loss: 5.496e-03:   1%|          | 2231/300001 [19:43:44<2619:21:32, 31.67s/it]training loss: 5.496e-03:   1%|          | 2232/300001 [19:44:15<2621:49:06, 31.70s/it]training loss: 5.496e-03:   1%|          | 2233/300001 [19:44:48<2642:10:44, 31.94s/it]training loss: 5.496e-03:   1%|          | 2234/300001 [19:45:19<2615:10:30, 31.62s/it]training loss: 5.496e-03:   1%|          | 2235/300001 [19:45:51<2618:35:40, 31.66s/it]training loss: 5.496e-03:   1%|          | 2236/300001 [19:46:23<2642:50:07, 31.95s/it]training loss: 5.496e-03:   1%|          | 2237/300001 [19:46:55<2630:44:36, 31.81s/it]training loss: 5.496e-03:   1%|          | 2238/300001 [19:47:26<2614:41:48, 31.61s/it]training loss: 5.496e-03:   1%|          | 2239/300001 [19:47:58<2619:39:53, 31.67s/it]training loss: 5.496e-03:   1%|          | 2240/300001 [19:48:29<2622:29:58, 31.71s/it]training loss: 5.694e-03:   1%|          | 2240/300001 [19:49:01<2622:29:58, 31.71s/it]training loss: 5.694e-03:   1%|          | 2241/300001 [19:49:01<2630:27:46, 31.80s/it]training loss: 5.694e-03:   1%|          | 2242/300001 [19:49:33<2620:22:49, 31.68s/it]training loss: 5.694e-03:   1%|          | 2243/300001 [19:50:04<2602:36:01, 31.47s/it]training loss: 5.694e-03:   1%|          | 2244/300001 [19:50:36<2611:13:11, 31.57s/it]training loss: 5.694e-03:   1%|          | 2245/300001 [19:51:08<2633:32:13, 31.84s/it]training loss: 5.694e-03:   1%|          | 2246/300001 [19:51:38<2594:44:40, 31.37s/it]training loss: 5.694e-03:   1%|          | 2247/300001 [19:52:10<2598:05:32, 31.41s/it]training loss: 5.694e-03:   1%|          | 2248/300001 [19:52:42<2626:18:59, 31.75s/it]training loss: 5.694e-03:   1%|          | 2249/300001 [19:53:14<2612:46:46, 31.59s/it]training loss: 5.694e-03:   1%|          | 2250/300001 [19:53:44<2593:18:29, 31.35s/it]training loss: 5.694e-03:   1%|          | 2251/300001 [19:54:16<2601:38:56, 31.46s/it]training loss: 5.694e-03:   1%|          | 2252/300001 [19:54:48<2615:23:56, 31.62s/it]training loss: 5.694e-03:   1%|          | 2253/300001 [19:55:20<2630:09:18, 31.80s/it]training loss: 5.694e-03:   1%|          | 2254/300001 [19:55:52<2632:45:42, 31.83s/it]training loss: 5.694e-03:   1%|          | 2255/300001 [19:56:24<2622:56:39, 31.71s/it]training loss: 5.694e-03:   1%|          | 2256/300001 [19:56:54<2597:32:39, 31.41s/it]training loss: 5.694e-03:   1%|          | 2257/300001 [19:57:26<2601:49:02, 31.46s/it]training loss: 5.694e-03:   1%|          | 2258/300001 [19:57:57<2600:29:15, 31.44s/it]training loss: 5.694e-03:   1%|          | 2259/300001 [19:58:30<2618:31:40, 31.66s/it]training loss: 5.694e-03:   1%|          | 2260/300001 [19:59:01<2622:29:49, 31.71s/it]slurmstepd: error: *** JOB 9913543 ON gpu018 CANCELLED AT 2026-05-15T12:03:35 DUE TO TIME LIMIT ***
diff --git a/slurm/logs/pidm_darcy_diffusion_9913543.out b/slurm/logs/pidm_darcy_diffusion_9913543.out
deleted file mode 100644
index 4b80c77..0000000
--- a/slurm/logs/pidm_darcy_diffusion_9913543.out
+++ /dev/null
@@ -1 +0,0 @@
-Number of trainable parameters: 10386482
diff --git a/slurm/logs/pidm_darcy_diffusion_9940441.err b/slurm/logs/pidm_darcy_diffusion_9940441.err
deleted file mode 100644
index 7daadb6..0000000
--- a/slurm/logs/pidm_darcy_diffusion_9940441.err
+++ /dev/null
@@ -1,11 +0,0 @@
-Traceback (most recent call last):
-  File "<string>", line 1, in <module>
-  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/torch/cuda/__init__.py", line 491, in get_device_name
-    return get_device_properties(device).name
-           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/torch/cuda/__init__.py", line 523, in get_device_properties
-    _lazy_init()  # will define _get_device_properties
-    ^^^^^^^^^^^^
-  File "/home/dstoyanova/miniconda3/envs/pidm/lib/python3.11/site-packages/torch/cuda/__init__.py", line 310, in _lazy_init
-    raise AssertionError("Torch not compiled with CUDA enabled")
-AssertionError: Torch not compiled with CUDA enabled
diff --git a/slurm/logs/pidm_darcy_diffusion_9940441.out b/slurm/logs/pidm_darcy_diffusion_9940441.out
deleted file mode 100644
index bc59c12..0000000
--- a/slurm/logs/pidm_darcy_diffusion_9940441.out
+++ /dev/null
@@ -1 +0,0 @@
-False
diff --git a/slurm/logs/pidm_darcy_pg_9913376.err b/slurm/logs/pidm_darcy_pg_9913376.err
deleted file mode 100644
index 8b6b7cd..0000000
--- a/slurm/logs/pidm_darcy_pg_9913376.err
+++ /dev/null
@@ -1,6 +0,0 @@
-  0%|          | 0/300001 [00:00<?, ?it/s]training loss: 3.411e+00:   0%|          | 0/300001 [00:33<?, ?it/s]training loss: 3.411e+00:   0%|          | 1/300001 [04:18<21507:19:42, 258.09s/it]/cm/local/apps/slurm/var/spool/job9913376/slurm_script: line 29: 2618595 Killed                  python -c "
-import os
-code = open('main.py').read().replace(\"name = 'run_1'\", \"name = '\" + os.environ['PIDM_RUN_NAME'] + \"'\")
-exec(compile(code, 'main.py', 'exec'))
-"
-slurmstepd: error: Detected 1 oom-kill event(s) in StepId=9913376.batch. Some of your processes may have been killed by the cgroup out-of-memory handler.
diff --git a/slurm/logs/pidm_darcy_pg_9913376.out b/slurm/logs/pidm_darcy_pg_9913376.out
deleted file mode 100644
index 4b80c77..0000000
--- a/slurm/logs/pidm_darcy_pg_9913376.out
+++ /dev/null
@@ -1 +0,0 @@
-Number of trainable parameters: 10386482
diff --git a/slurm/logs/pidm_darcy_pg_9913544.err b/slurm/logs/pidm_darcy_pg_9913544.err
deleted file mode 100644
index e40b4b8..0000000
--- a/slurm/logs/pidm_darcy_pg_9913544.err
+++ /dev/null
@@ -1 +0,0 @@
-  0%|          | 0/300001 [00:00<?, ?it/s]training loss: 4.021e+00:   0%|          | 0/300001 [01:33<?, ?it/s]training loss: 4.021e+00:   0%|          | 1/300001 [18:06<90503:40:22, 1086.04s/it]training loss: 4.021e+00:   0%|          | 2/300001 [19:12<40535:38:50, 486.43s/it] training loss: 4.021e+00:   0%|          | 3/300001 [20:14<24358:08:47, 292.30s/it]training loss: 4.021e+00:   0%|          | 4/300001 [21:31<17277:21:38, 207.33s/it]training loss: 4.021e+00:   0%|          | 5/300001 [22:47<13333:54:01, 160.01s/it]training loss: 4.021e+00:   0%|          | 6/300001 [23:34<10139:29:29, 121.68s/it]training loss: 4.021e+00:   0%|          | 7/300001 [24:24<8199:10:52, 98.39s/it]  training loss: 4.021e+00:   0%|          | 8/300001 [25:07<6721:38:59, 80.66s/it]training loss: 4.021e+00:   0%|          | 9/300001 [25:51<5768:08:28, 69.22s/it]training loss: 4.021e+00:   0%|          | 10/300001 [26:42<5298:26:17, 63.58s/it]training loss: 4.021e+00:   0%|          | 11/300001 [27:40<5152:56:31, 61.84s/it]training loss: 4.021e+00:   0%|          | 12/300001 [28:38<5066:06:23, 60.80s/it]training loss: 4.021e+00:   0%|          | 13/300001 [29:28<4786:15:50, 57.44s/it]training loss: 4.021e+00:   0%|          | 14/300001 [30:20<4643:03:44, 55.72s/it]training loss: 4.021e+00:   0%|          | 15/300001 [31:07<4414:16:18, 52.97s/it]training loss: 4.021e+00:   0%|          | 16/300001 [32:21<4954:44:38, 59.46s/it]training loss: 4.021e+00:   0%|          | 17/300001 [33:22<4992:07:49, 59.91s/it]training loss: 4.021e+00:   0%|          | 18/300001 [34:12<4744:36:32, 56.94s/it]training loss: 4.021e+00:   0%|          | 19/300001 [34:57<4438:26:24, 53.26s/it]training loss: 4.021e+00:   0%|          | 20/300001 [35:45<4305:56:08, 51.67s/it]training loss: 1.848e-01:   0%|          | 20/300001 [36:25<4305:56:08, 51.67s/it]training loss: 1.848e-01:   0%|          | 21/300001 [36:26<4035:02:46, 48.42s/it]training loss: 1.848e-01:   0%|          | 22/300001 [37:10<3938:38:45, 47.27s/it]training loss: 1.848e-01:   0%|          | 23/300001 [37:52<3800:39:13, 45.61s/it]training loss: 1.848e-01:   0%|          | 24/300001 [38:38<3821:54:44, 45.87s/it]training loss: 1.848e-01:   0%|          | 25/300001 [39:21<3737:25:31, 44.85s/it]training loss: 1.848e-01:   0%|          | 26/300001 [40:13<3933:04:34, 47.20s/it]training loss: 1.848e-01:   0%|          | 27/300001 [40:58<3874:25:39, 46.50s/it]training loss: 1.848e-01:   0%|          | 28/300001 [41:42<3812:31:26, 45.75s/it]training loss: 1.848e-01:   0%|          | 29/300001 [42:25<3745:45:40, 44.95s/it]training loss: 1.848e-01:   0%|          | 30/300001 [43:25<4106:29:37, 49.28s/it]training loss: 1.848e-01:   0%|          | 31/300001 [45:00<5252:01:23, 63.03s/it]training loss: 1.848e-01:   0%|          | 32/300001 [46:06<5323:37:07, 63.89s/it]training loss: 1.848e-01:   0%|          | 33/300001 [47:04<5188:12:17, 62.27s/it]training loss: 1.848e-01:   0%|          | 34/300001 [48:03<5095:30:14, 61.15s/it]training loss: 1.848e-01:   0%|          | 35/300001 [50:22<7037:08:59, 84.46s/it]training loss: 1.848e-01:   0%|          | 36/300001 [51:35<6755:19:22, 81.07s/it]training loss: 1.848e-01:   0%|          | 37/300001 [52:34<6196:22:28, 74.37s/it]training loss: 1.848e-01:   0%|          | 38/300001 [53:28<5693:37:22, 68.33s/it]training loss: 1.848e-01:   0%|          | 39/300001 [54:15<5159:25:04, 61.92s/it]training loss: 1.848e-01:   0%|          | 40/300001 [55:49<5977:39:45, 71.74s/it]training loss: 6.546e-02:   0%|          | 40/300001 [56:57<5977:39:45, 71.74s/it]training loss: 6.546e-02:   0%|          | 41/300001 [56:57<5882:46:10, 70.60s/it]training loss: 6.546e-02:   0%|          | 42/300001 [57:57<5613:03:42, 67.37s/it]training loss: 6.546e-02:   0%|          | 43/300001 [58:45<5124:39:41, 61.50s/it]training loss: 6.546e-02:   0%|          | 44/300001 [59:29<4685:47:34, 56.24s/it]training loss: 6.546e-02:   0%|          | 45/300001 [1:00:10<4313:15:50, 51.77s/it]training loss: 6.546e-02:   0%|          | 46/300001 [1:01:21<4794:00:46, 57.54s/it]training loss: 6.546e-02:   0%|          | 47/300001 [1:02:33<5148:49:06, 61.80s/it]training loss: 6.546e-02:   0%|          | 48/300001 [1:03:20<4782:58:52, 57.40s/it]training loss: 6.546e-02:   0%|          | 49/300001 [1:04:03<4427:16:58, 53.14s/it]training loss: 6.546e-02:   0%|          | 50/300001 [1:04:48<4226:31:30, 50.73s/it]training loss: 6.546e-02:   0%|          | 51/300001 [1:05:35<4112:42:36, 49.36s/it]training loss: 6.546e-02:   0%|          | 52/300001 [1:06:20<4000:21:45, 48.01s/it]training loss: 6.546e-02:   0%|          | 53/300001 [1:07:05<3934:05:50, 47.22s/it]training loss: 6.546e-02:   0%|          | 54/300001 [1:07:49<3854:36:00, 46.26s/it]training loss: 6.546e-02:   0%|          | 55/300001 [1:08:33<3807:27:36, 45.70s/it]training loss: 6.546e-02:   0%|          | 56/300001 [1:09:21<3845:00:22, 46.15s/it]training loss: 6.546e-02:   0%|          | 57/300001 [1:10:18<4131:12:03, 49.58s/it]training loss: 6.546e-02:   0%|          | 58/300001 [1:11:03<4008:54:15, 48.12s/it]training loss: 6.546e-02:   0%|          | 59/300001 [1:11:49<3959:14:37, 47.52s/it]training loss: 6.546e-02:   0%|          | 60/300001 [1:12:36<3949:39:02, 47.41s/it]training loss: 4.493e-02:   0%|          | 60/300001 [1:13:32<3949:39:02, 47.41s/it]training loss: 4.493e-02:   0%|          | 61/300001 [1:13:32<4160:20:56, 49.93s/it]training loss: 4.493e-02:   0%|          | 62/300001 [1:14:18<4066:33:45, 48.81s/it]training loss: 4.493e-02:   0%|          | 63/300001 [1:15:14<4232:41:06, 50.80s/it]training loss: 4.493e-02:   0%|          | 64/300001 [1:16:23<4708:47:16, 56.52s/it]training loss: 4.493e-02:   0%|          | 65/300001 [1:17:19<4685:35:16, 56.24s/it]training loss: 4.493e-02:   0%|          | 66/300001 [1:18:01<4332:48:04, 52.00s/it]training loss: 4.493e-02:   0%|          | 67/300001 [1:18:57<4429:33:16, 53.17s/it]training loss: 4.493e-02:   0%|          | 68/300001 [1:19:45<4304:33:31, 51.67s/it]training loss: 4.493e-02:   0%|          | 69/300001 [1:20:29<4101:27:28, 49.23s/it]training loss: 4.493e-02:   0%|          | 70/300001 [1:21:17<4086:27:31, 49.05s/it]training loss: 4.493e-02:   0%|          | 71/300001 [1:22:14<4284:40:12, 51.43s/it]training loss: 4.493e-02:   0%|          | 72/300001 [1:23:05<4255:57:28, 51.08s/it]training loss: 4.493e-02:   0%|          | 73/300001 [1:23:47<4030:39:45, 48.38s/it]training loss: 4.493e-02:   0%|          | 74/300001 [1:24:31<3933:47:25, 47.22s/it]training loss: 4.493e-02:   0%|          | 75/300001 [1:25:17<3902:08:23, 46.84s/it]training loss: 4.493e-02:   0%|          | 76/300001 [1:26:12<4098:19:39, 49.19s/it]training loss: 4.493e-02:   0%|          | 77/300001 [1:27:17<4510:38:13, 54.14s/it]training loss: 4.493e-02:   0%|          | 78/300001 [1:28:15<4597:30:35, 55.18s/it]training loss: 4.493e-02:   0%|          | 79/300001 [1:29:20<4848:33:50, 58.20s/it]training loss: 4.493e-02:   0%|          | 80/300001 [1:30:25<4998:04:46, 59.99s/it]training loss: 3.425e-02:   0%|          | 80/300001 [1:31:11<4998:04:46, 59.99s/it]training loss: 3.425e-02:   0%|          | 81/300001 [1:31:11<4665:09:22, 56.00s/it]training loss: 3.425e-02:   0%|          | 82/300001 [1:32:10<4723:17:06, 56.69s/it]training loss: 3.425e-02:   0%|          | 83/300001 [1:32:57<4486:56:23, 53.86s/it]training loss: 3.425e-02:   0%|          | 84/300001 [1:33:48<4417:54:12, 53.03s/it]training loss: 3.425e-02:   0%|          | 85/300001 [1:34:44<4507:30:39, 54.11s/it]training loss: 3.425e-02:   0%|          | 86/300001 [1:35:42<4590:33:23, 55.10s/it]training loss: 3.425e-02:   0%|          | 87/300001 [1:36:22<4220:09:47, 50.66s/it]training loss: 3.425e-02:   0%|          | 88/300001 [1:37:19<4377:35:25, 52.55s/it]training loss: 3.425e-02:   0%|          | 89/300001 [1:38:06<4248:25:13, 51.00s/it]training loss: 3.425e-02:   0%|          | 90/300001 [1:39:00<4319:59:21, 51.86s/it]training loss: 3.425e-02:   0%|          | 91/300001 [1:39:44<4116:40:30, 49.41s/it]training loss: 3.425e-02:   0%|          | 92/300001 [1:40:26<3934:47:22, 47.23s/it]training loss: 3.425e-02:   0%|          | 93/300001 [1:41:07<3766:55:38, 45.22s/it]training loss: 3.425e-02:   0%|          | 94/300001 [1:41:49<3694:52:59, 44.35s/it]training loss: 3.425e-02:   0%|          | 95/300001 [1:42:35<3743:35:23, 44.94s/it]training loss: 3.425e-02:   0%|          | 96/300001 [1:43:25<3855:51:21, 46.28s/it]training loss: 3.425e-02:   0%|          | 97/300001 [1:44:09<3792:17:06, 45.52s/it]training loss: 3.425e-02:   0%|          | 98/300001 [1:44:54<3781:56:23, 45.40s/it]training loss: 3.425e-02:   0%|          | 99/300001 [1:45:50<4045:15:23, 48.56s/it]training loss: 3.425e-02:   0%|          | 100/300001 [1:46:52<4394:23:03, 52.75s/it]training loss: 2.690e-02:   0%|          | 100/300001 [1:47:56<4394:23:03, 52.75s/it]training loss: 2.690e-02:   0%|          | 101/300001 [1:47:56<4681:06:43, 56.19s/it]training loss: 2.690e-02:   0%|          | 102/300001 [1:48:49<4586:32:04, 55.06s/it]training loss: 2.690e-02:   0%|          | 103/300001 [1:49:45<4606:50:03, 55.30s/it]training loss: 2.690e-02:   0%|          | 104/300001 [1:50:49<4844:56:33, 58.16s/it]training loss: 2.690e-02:   0%|          | 105/300001 [1:51:35<4526:36:21, 54.34s/it]training loss: 2.690e-02:   0%|          | 106/300001 [1:52:39<4772:57:23, 57.30s/it]training loss: 2.690e-02:   0%|          | 107/300001 [1:53:34<4712:25:43, 56.57s/it]training loss: 2.690e-02:   0%|          | 108/300001 [1:54:31<4719:59:39, 56.66s/it]training loss: 2.690e-02:   0%|          | 109/300001 [1:55:15<4401:25:42, 52.84s/it]training loss: 2.690e-02:   0%|          | 110/300001 [1:56:14<4551:03:33, 54.63s/it]training loss: 2.690e-02:   0%|          | 111/300001 [1:57:26<5001:00:10, 60.03s/it]training loss: 2.690e-02:   0%|          | 112/300001 [1:58:14<4687:44:57, 56.27s/it]training loss: 2.690e-02:   0%|          | 113/300001 [1:58:58<4376:44:03, 52.54s/it]training loss: 2.690e-02:   0%|          | 114/300001 [1:59:48<4320:43:56, 51.87s/it]training loss: 2.690e-02:   0%|          | 115/300001 [2:00:39<4302:47:19, 51.65s/it]training loss: 2.690e-02:   0%|          | 116/300001 [2:01:33<4370:31:26, 52.47s/it]training loss: 2.690e-02:   0%|          | 117/300001 [2:02:24<4325:17:56, 51.92s/it]training loss: 2.690e-02:   0%|          | 118/300001 [2:03:13<4249:06:23, 51.01s/it]training loss: 2.690e-02:   0%|          | 119/300001 [2:04:01<4182:06:12, 50.20s/it]training loss: 2.690e-02:   0%|          | 120/300001 [2:04:47<4075:52:27, 48.93s/it]training loss: 2.829e-02:   0%|          | 120/300001 [2:05:42<4075:52:27, 48.93s/it]training loss: 2.829e-02:   0%|          | 121/300001 [2:05:42<4219:53:45, 50.66s/it]training loss: 2.829e-02:   0%|          | 122/300001 [2:06:29<4125:18:52, 49.52s/it]training loss: 2.829e-02:   0%|          | 123/300001 [2:07:23<4240:06:48, 50.90s/it]training loss: 2.829e-02:   0%|          | 124/300001 [2:08:16<4289:16:27, 51.49s/it]training loss: 2.829e-02:   0%|          | 125/300001 [2:09:03<4190:55:02, 50.31s/it]training loss: 2.829e-02:   0%|          | 126/300001 [2:09:55<4237:09:27, 50.87s/it]training loss: 2.829e-02:   0%|          | 127/300001 [2:10:57<4508:20:34, 54.12s/it]training loss: 2.829e-02:   0%|          | 128/300001 [2:11:47<4400:52:12, 52.83s/it]training loss: 2.829e-02:   0%|          | 129/300001 [2:12:36<4306:59:52, 51.71s/it]training loss: 2.829e-02:   0%|          | 130/300001 [2:13:19<4086:34:49, 49.06s/it]training loss: 2.829e-02:   0%|          | 131/300001 [2:14:10<4144:11:45, 49.75s/it]training loss: 2.829e-02:   0%|          | 132/300001 [2:14:56<4043:15:17, 48.54s/it]training loss: 2.829e-02:   0%|          | 133/300001 [2:15:44<4029:04:23, 48.37s/it]training loss: 2.829e-02:   0%|          | 134/300001 [2:16:26<3875:11:44, 46.52s/it]training loss: 2.829e-02:   0%|          | 135/300001 [2:17:15<3944:33:36, 47.36s/it]training loss: 2.829e-02:   0%|          | 136/300001 [2:18:07<4053:50:41, 48.67s/it]training loss: 2.829e-02:   0%|          | 137/300001 [2:18:52<3952:33:44, 47.45s/it]training loss: 2.829e-02:   0%|          | 138/300001 [2:19:36<3869:33:12, 46.46s/it]training loss: 2.829e-02:   0%|          | 139/300001 [2:20:21<3840:06:10, 46.10s/it]training loss: 2.829e-02:   0%|          | 140/300001 [2:21:05<3779:56:04, 45.38s/it]training loss: 2.207e-02:   0%|          | 140/300001 [2:21:54<3779:56:04, 45.38s/it]training loss: 2.207e-02:   0%|          | 141/300001 [2:21:54<3873:54:14, 46.51s/it]training loss: 2.207e-02:   0%|          | 142/300001 [2:22:51<4123:07:01, 49.50s/it]training loss: 2.207e-02:   0%|          | 143/300001 [2:23:37<4058:50:39, 48.73s/it]training loss: 2.207e-02:   0%|          | 144/300001 [2:24:32<4206:43:33, 50.50s/it]training loss: 2.207e-02:   0%|          | 145/300001 [2:25:18<4097:21:23, 49.19s/it]training loss: 2.207e-02:   0%|          | 146/300001 [2:26:23<4473:35:08, 53.71s/it]training loss: 2.207e-02:   0%|          | 147/300001 [2:27:21<4602:01:17, 55.25s/it]training loss: 2.207e-02:   0%|          | 148/300001 [2:28:04<4290:16:07, 51.51s/it]training loss: 2.207e-02:   0%|          | 149/300001 [2:28:53<4228:54:50, 50.77s/it]training loss: 2.207e-02:   0%|          | 150/300001 [2:29:36<4031:20:37, 48.40s/it]training loss: 2.207e-02:   0%|          | 151/300001 [2:30:21<3935:40:54, 47.25s/it]training loss: 2.207e-02:   0%|          | 152/300001 [2:31:05<3864:00:14, 46.39s/it]training loss: 2.207e-02:   0%|          | 153/300001 [2:31:48<3771:56:28, 45.29s/it]training loss: 2.207e-02:   0%|          | 154/300001 [2:32:31<3711:43:35, 44.56s/it]training loss: 2.207e-02:   0%|          | 155/300001 [2:33:15<3699:52:33, 44.42s/it]training loss: 2.207e-02:   0%|          | 156/300001 [2:34:00<3718:45:57, 44.65s/it]training loss: 2.207e-02:   0%|          | 157/300001 [2:34:36<3511:18:41, 42.16s/it]training loss: 2.207e-02:   0%|          | 158/300001 [2:35:37<3966:16:19, 47.62s/it]training loss: 2.207e-02:   0%|          | 159/300001 [2:36:22<3901:47:51, 46.85s/it]training loss: 2.207e-02:   0%|          | 160/300001 [2:37:09<3925:57:46, 47.14s/it]training loss: 1.893e-02:   0%|          | 160/300001 [2:37:54<3925:57:46, 47.14s/it]training loss: 1.893e-02:   0%|          | 161/300001 [2:37:54<3866:14:42, 46.42s/it]training loss: 1.893e-02:   0%|          | 162/300001 [2:38:38<3808:36:16, 45.73s/it]training loss: 1.893e-02:   0%|          | 163/300001 [2:39:43<4287:24:28, 51.48s/it]training loss: 1.893e-02:   0%|          | 164/300001 [2:40:39<4383:49:33, 52.63s/it]training loss: 1.893e-02:   0%|          | 165/300001 [2:41:29<4320:23:37, 51.87s/it]training loss: 1.893e-02:   0%|          | 166/300001 [2:42:31<4591:37:41, 55.13s/it]training loss: 1.893e-02:   0%|          | 167/300001 [2:43:24<4527:24:18, 54.36s/it]training loss: 1.893e-02:   0%|          | 168/300001 [2:44:12<4380:02:23, 52.59s/it]training loss: 1.893e-02:   0%|          | 169/300001 [2:45:10<4518:05:17, 54.25s/it]training loss: 1.893e-02:   0%|          | 170/300001 [2:45:54<4255:19:02, 51.09s/it]training loss: 1.893e-02:   0%|          | 171/300001 [2:46:38<4084:17:31, 49.04s/it]training loss: 1.893e-02:   0%|          | 172/300001 [2:47:31<4174:44:34, 50.13s/it]training loss: 1.893e-02:   0%|          | 173/300001 [2:48:41<4673:39:13, 56.12s/it]training loss: 1.893e-02:   0%|          | 174/300001 [2:50:01<5262:43:18, 63.19s/it]training loss: 1.893e-02:   0%|          | 175/300001 [2:50:56<5058:15:40, 60.73s/it]training loss: 1.893e-02:   0%|          | 176/300001 [2:51:36<4552:38:52, 54.66s/it]training loss: 1.893e-02:   0%|          | 177/300001 [2:52:21<4293:26:10, 51.55s/it]training loss: 1.893e-02:   0%|          | 178/300001 [2:53:18<4446:56:07, 53.39s/it]training loss: 1.893e-02:   0%|          | 179/300001 [2:54:02<4209:50:32, 50.55s/it]training loss: 1.893e-02:   0%|          | 180/300001 [2:54:45<4018:43:59, 48.25s/it]training loss: 1.954e-02:   0%|          | 180/300001 [2:55:29<4018:43:59, 48.25s/it]training loss: 1.954e-02:   0%|          | 181/300001 [2:55:29<3904:47:27, 46.89s/it]training loss: 1.954e-02:   0%|          | 182/300001 [2:56:17<3935:43:23, 47.26s/it]training loss: 1.954e-02:   0%|          | 183/300001 [2:57:11<4113:02:35, 49.39s/it]training loss: 1.954e-02:   0%|          | 184/300001 [2:58:04<4186:36:01, 50.27s/it]training loss: 1.954e-02:   0%|          | 185/300001 [2:58:53<4174:07:25, 50.12s/it]training loss: 1.954e-02:   0%|          | 186/300001 [2:59:34<3934:48:46, 47.25s/it]training loss: 1.954e-02:   0%|          | 187/300001 [3:00:22<3940:52:41, 47.32s/it]training loss: 1.954e-02:   0%|          | 188/300001 [3:01:33<4552:17:27, 54.66s/it]training loss: 1.954e-02:   0%|          | 189/300001 [3:02:35<4731:20:30, 56.81s/it]training loss: 1.954e-02:   0%|          | 190/300001 [3:03:24<4520:49:17, 54.28s/it]training loss: 1.954e-02:   0%|          | 191/300001 [3:04:26<4723:38:01, 56.72s/it]training loss: 1.954e-02:   0%|          | 192/300001 [3:05:15<4537:40:54, 54.49s/it]training loss: 1.954e-02:   0%|          | 193/300001 [3:06:00<4306:02:06, 51.71s/it]training loss: 1.954e-02:   0%|          | 194/300001 [3:06:41<4036:28:01, 48.47s/it]training loss: 1.954e-02:   0%|          | 195/300001 [3:07:24<3888:26:38, 46.69s/it]training loss: 1.954e-02:   0%|          | 196/300001 [3:08:12<3925:31:47, 47.14s/it]training loss: 1.954e-02:   0%|          | 197/300001 [3:08:56<3844:08:10, 46.16s/it]training loss: 1.954e-02:   0%|          | 198/300001 [3:09:57<4209:16:54, 50.54s/it]training loss: 1.954e-02:   0%|          | 199/300001 [3:10:54<4368:29:41, 52.46s/it]training loss: 1.954e-02:   0%|          | 200/300001 [3:11:43<4284:12:03, 51.44s/it]training loss: 1.875e-02:   0%|          | 200/300001 [3:12:36<4284:12:03, 51.44s/it]training loss: 1.875e-02:   0%|          | 201/300001 [3:12:36<4336:37:41, 52.07s/it]training loss: 1.875e-02:   0%|          | 202/300001 [3:14:01<5155:04:30, 61.90s/it]training loss: 1.875e-02:   0%|          | 203/300001 [3:14:45<4698:54:40, 56.42s/it]training loss: 1.875e-02:   0%|          | 204/300001 [3:15:36<4566:07:08, 54.83s/it]training loss: 1.875e-02:   0%|          | 205/300001 [3:16:22<4360:59:48, 52.37s/it]training loss: 1.875e-02:   0%|          | 206/300001 [3:17:05<4114:40:32, 49.41s/it]training loss: 1.875e-02:   0%|          | 207/300001 [3:17:46<3907:17:56, 46.92s/it]training loss: 1.875e-02:   0%|          | 208/300001 [3:18:27<3748:51:52, 45.02s/it]training loss: 1.875e-02:   0%|          | 209/300001 [3:19:09<3672:54:13, 44.11s/it]training loss: 1.875e-02:   0%|          | 210/300001 [3:19:51<3637:57:32, 43.69s/it]training loss: 1.875e-02:   0%|          | 211/300001 [3:20:32<3563:35:02, 42.79s/it]training loss: 1.875e-02:   0%|          | 212/300001 [3:21:28<3883:07:58, 46.63s/it]training loss: 1.875e-02:   0%|          | 213/300001 [3:22:13<3846:31:55, 46.19s/it]training loss: 1.875e-02:   0%|          | 214/300001 [3:22:59<3846:04:24, 46.19s/it]training loss: 1.875e-02:   0%|          | 215/300001 [3:23:44<3826:58:42, 45.96s/it]training loss: 1.875e-02:   0%|          | 216/300001 [3:24:40<4062:23:09, 48.78s/it]training loss: 1.875e-02:   0%|          | 217/300001 [3:25:26<4003:18:12, 48.07s/it]training loss: 1.875e-02:   0%|          | 218/300001 [3:26:12<3944:42:26, 47.37s/it]training loss: 1.875e-02:   0%|          | 219/300001 [3:27:12<4269:55:31, 51.28s/it]training loss: 1.875e-02:   0%|          | 220/300001 [3:28:19<4657:21:16, 55.93s/it]training loss: 1.955e-02:   0%|          | 220/300001 [3:29:12<4657:21:16, 55.93s/it]training loss: 1.955e-02:   0%|          | 221/300001 [3:29:12<4591:25:25, 55.14s/it]training loss: 1.955e-02:   0%|          | 222/300001 [3:30:08<4594:24:32, 55.17s/it]training loss: 1.955e-02:   0%|          | 223/300001 [3:31:05<4649:08:44, 55.83s/it]training loss: 1.955e-02:   0%|          | 224/300001 [3:32:14<4969:59:33, 59.68s/it]training loss: 1.955e-02:   0%|          | 225/300001 [3:33:00<4637:39:31, 55.69s/it]training loss: 1.955e-02:   0%|          | 226/300001 [3:33:48<4444:01:46, 53.37s/it]training loss: 1.955e-02:   0%|          | 227/300001 [3:34:33<4238:24:32, 50.90s/it]training loss: 1.955e-02:   0%|          | 228/300001 [3:35:20<4137:17:05, 49.69s/it]training loss: 1.955e-02:   0%|          | 229/300001 [3:36:20<4386:41:10, 52.68s/it]training loss: 1.955e-02:   0%|          | 230/300001 [3:37:12<4368:39:54, 52.46s/it]training loss: 1.955e-02:   0%|          | 231/300001 [3:37:55<4139:46:55, 49.72s/it]training loss: 1.955e-02:   0%|          | 232/300001 [3:38:45<4143:19:21, 49.76s/it]training loss: 1.955e-02:   0%|          | 233/300001 [3:39:30<4018:17:33, 48.26s/it]training loss: 1.955e-02:   0%|          | 234/300001 [3:40:22<4123:43:52, 49.52s/it]training loss: 1.955e-02:   0%|          | 235/300001 [3:41:17<4269:00:11, 51.27s/it]training loss: 1.955e-02:   0%|          | 236/300001 [3:42:27<4720:34:10, 56.69s/it]training loss: 1.955e-02:   0%|          | 237/300001 [3:43:12<4428:19:12, 53.18s/it]training loss: 1.955e-02:   0%|          | 238/300001 [3:44:01<4328:57:24, 51.99s/it]training loss: 1.955e-02:   0%|          | 239/300001 [3:44:44<4098:03:54, 49.22s/it]training loss: 1.955e-02:   0%|          | 240/300001 [3:45:36<4165:46:20, 50.03s/it]training loss: 1.593e-02:   0%|          | 240/300001 [3:46:19<4165:46:20, 50.03s/it]training loss: 1.593e-02:   0%|          | 241/300001 [3:46:19<4008:26:10, 48.14s/it]training loss: 1.593e-02:   0%|          | 242/300001 [3:47:05<3941:06:29, 47.33s/it]training loss: 1.593e-02:   0%|          | 243/300001 [3:47:53<3973:09:21, 47.72s/it]training loss: 1.593e-02:   0%|          | 244/300001 [3:48:44<4049:16:23, 48.63s/it]training loss: 1.593e-02:   0%|          | 245/300001 [3:49:46<4380:01:28, 52.60s/it]training loss: 1.593e-02:   0%|          | 246/300001 [3:51:05<5045:43:27, 60.60s/it]training loss: 1.593e-02:   0%|          | 247/300001 [3:52:20<5408:38:45, 64.96s/it]training loss: 1.593e-02:   0%|          | 248/300001 [3:53:37<5705:22:47, 68.52s/it]training loss: 1.593e-02:   0%|          | 249/300001 [3:54:34<5417:08:10, 65.06s/it]training loss: 1.593e-02:   0%|          | 250/300001 [3:55:21<4950:22:51, 59.45s/it]training loss: 1.593e-02:   0%|          | 251/300001 [3:56:05<4574:58:32, 54.95s/it]training loss: 1.593e-02:   0%|          | 252/300001 [3:56:57<4498:45:02, 54.03s/it]training loss: 1.593e-02:   0%|          | 253/300001 [3:58:03<4804:33:22, 57.70s/it]training loss: 1.593e-02:   0%|          | 254/300001 [3:58:49<4497:50:37, 54.02s/it]training loss: 1.593e-02:   0%|          | 255/300001 [3:59:35<4316:43:26, 51.84s/it]training loss: 1.593e-02:   0%|          | 256/300001 [4:00:35<4512:14:53, 54.19s/it]training loss: 1.593e-02:   0%|          | 257/300001 [4:02:06<5430:36:57, 65.22s/it]training loss: 1.593e-02:   0%|          | 258/300001 [4:03:09<5366:10:46, 64.45s/it]training loss: 1.593e-02:   0%|          | 259/300001 [4:04:24<5629:18:09, 67.61s/it]training loss: 1.593e-02:   0%|          | 260/300001 [4:05:15<5235:10:04, 62.88s/it]training loss: 1.372e-02:   0%|          | 260/300001 [4:06:03<5235:10:04, 62.88s/it]training loss: 1.372e-02:   0%|          | 261/300001 [4:06:03<4854:22:01, 58.30s/it]training loss: 1.372e-02:   0%|          | 262/300001 [4:07:27<5483:07:38, 65.85s/it]training loss: 1.372e-02:   0%|          | 263/300001 [4:08:38<5626:03:15, 67.57s/it]training loss: 1.372e-02:   0%|          | 264/300001 [4:09:24<5076:22:56, 60.97s/it]training loss: 1.372e-02:   0%|          | 265/300001 [4:10:09<4677:37:17, 56.18s/it]training loss: 1.372e-02:   0%|          | 266/300001 [4:10:51<4339:38:16, 52.12s/it]training loss: 1.372e-02:   0%|          | 267/300001 [4:11:42<4297:51:58, 51.62s/it]training loss: 1.372e-02:   0%|          | 268/300001 [4:12:34<4308:26:17, 51.75s/it]training loss: 1.372e-02:   0%|          | 269/300001 [4:13:42<4724:10:56, 56.74s/it]training loss: 1.372e-02:   0%|          | 270/300001 [4:14:36<4642:43:12, 55.76s/it]training loss: 1.372e-02:   0%|          | 271/300001 [4:15:23<4430:23:54, 53.21s/it]training loss: 1.372e-02:   0%|          | 272/300001 [4:16:19<4506:30:19, 54.13s/it]training loss: 1.372e-02:   0%|          | 273/300001 [4:17:04<4260:15:15, 51.17s/it]training loss: 1.372e-02:   0%|          | 274/300001 [4:18:22<4939:45:04, 59.33s/it]training loss: 1.372e-02:   0%|          | 275/300001 [4:19:04<4511:44:59, 54.19s/it]training loss: 1.372e-02:   0%|          | 276/300001 [4:20:03<4617:56:09, 55.47s/it]training loss: 1.372e-02:   0%|          | 277/300001 [4:21:02<4721:41:31, 56.71s/it]training loss: 1.372e-02:   0%|          | 278/300001 [4:22:10<5010:22:05, 60.18s/it]training loss: 1.372e-02:   0%|          | 279/300001 [4:23:07<4910:12:38, 58.98s/it]training loss: 1.372e-02:   0%|          | 280/300001 [4:24:06<4922:35:45, 59.13s/it]training loss: 1.207e-02:   0%|          | 280/300001 [4:25:32<4922:35:45, 59.13s/it]training loss: 1.207e-02:   0%|          | 281/300001 [4:25:32<5598:28:38, 67.24s/it]training loss: 1.207e-02:   0%|          | 282/300001 [4:27:01<6130:18:02, 73.63s/it]training loss: 1.207e-02:   0%|          | 283/300001 [4:28:08<5971:10:33, 71.72s/it]training loss: 1.207e-02:   0%|          | 284/300001 [4:28:57<5405:36:36, 64.93s/it]training loss: 1.207e-02:   0%|          | 285/300001 [4:29:45<4968:05:31, 59.67s/it]training loss: 1.207e-02:   0%|          | 286/300001 [4:30:37<4786:10:13, 57.49s/it]training loss: 1.207e-02:   0%|          | 287/300001 [4:31:31<4698:08:23, 56.43s/it]training loss: 1.207e-02:   0%|          | 288/300001 [4:32:46<5175:00:02, 62.16s/it]training loss: 1.207e-02:   0%|          | 289/300001 [4:33:34<4805:40:56, 57.72s/it]training loss: 1.207e-02:   0%|          | 290/300001 [4:34:21<4532:47:17, 54.45s/it]training loss: 1.207e-02:   0%|          | 291/300001 [4:35:08<4364:44:58, 52.43s/it]training loss: 1.207e-02:   0%|          | 292/300001 [4:35:58<4291:31:36, 51.55s/it]training loss: 1.207e-02:   0%|          | 293/300001 [4:37:04<4665:11:44, 56.04s/it]training loss: 1.207e-02:   0%|          | 294/300001 [4:38:23<5235:42:08, 62.89s/it]training loss: 1.207e-02:   0%|          | 295/300001 [4:39:15<4968:41:42, 59.68s/it]training loss: 1.207e-02:   0%|          | 296/300001 [4:40:11<4873:09:00, 58.54s/it]training loss: 1.207e-02:   0%|          | 297/300001 [4:41:00<4621:06:07, 55.51s/it]training loss: 1.207e-02:   0%|          | 298/300001 [4:41:41<4264:00:06, 51.22s/it]training loss: 1.207e-02:   0%|          | 299/300001 [4:42:22<3999:10:50, 48.04s/it]training loss: 1.207e-02:   0%|          | 300/300001 [4:43:15<4146:27:39, 49.81s/it]training loss: 1.109e-02:   0%|          | 300/300001 [4:43:57<4146:27:39, 49.81s/it]training loss: 1.109e-02:   0%|          | 301/300001 [4:43:57<3935:41:26, 47.28s/it]training loss: 1.109e-02:   0%|          | 302/300001 [4:45:00<4341:57:05, 52.16s/it]training loss: 1.109e-02:   0%|          | 303/300001 [4:46:08<4717:57:19, 56.67s/it]training loss: 1.109e-02:   0%|          | 304/300001 [4:47:08<4819:53:22, 57.90s/it]training loss: 1.109e-02:   0%|          | 305/300001 [4:48:05<4794:34:13, 57.59s/it]training loss: 1.109e-02:   0%|          | 306/300001 [4:49:12<5034:49:49, 60.48s/it]training loss: 1.109e-02:   0%|          | 307/300001 [4:50:17<5131:14:09, 61.64s/it]training loss: 1.109e-02:   0%|          | 308/300001 [4:51:22<5210:39:45, 62.59s/it]training loss: 1.109e-02:   0%|          | 309/300001 [4:52:27<5292:10:48, 63.57s/it]training loss: 1.109e-02:   0%|          | 310/300001 [4:53:18<4976:51:11, 59.78s/it]training loss: 1.109e-02:   0%|          | 311/300001 [4:54:05<4654:53:39, 55.92s/it]training loss: 1.109e-02:   0%|          | 312/300001 [4:54:50<4380:30:35, 52.62s/it]training loss: 1.109e-02:   0%|          | 313/300001 [4:55:37<4234:56:37, 50.87s/it]training loss: 1.109e-02:   0%|          | 314/300001 [4:56:27<4206:08:06, 50.53s/it]training loss: 1.109e-02:   0%|          | 315/300001 [4:57:43<4837:02:58, 58.11s/it]training loss: 1.109e-02:   0%|          | 316/300001 [4:59:12<5614:54:10, 67.45s/it]training loss: 1.109e-02:   0%|          | 317/300001 [5:00:29<5862:27:43, 70.42s/it]training loss: 1.109e-02:   0%|          | 318/300001 [5:01:26<5526:25:05, 66.39s/it]training loss: 1.109e-02:   0%|          | 319/300001 [5:02:20<5217:40:20, 62.68s/it]training loss: 1.109e-02:   0%|          | 320/300001 [5:03:22<5188:22:20, 62.33s/it]training loss: 9.777e-03:   0%|          | 320/300001 [5:04:04<5188:22:20, 62.33s/it]training loss: 9.777e-03:   0%|          | 321/300001 [5:04:04<4681:12:08, 56.23s/it]training loss: 9.777e-03:   0%|          | 322/300001 [5:04:48<4381:13:43, 52.63s/it]training loss: 9.777e-03:   0%|          | 323/300001 [5:05:43<4452:41:03, 53.49s/it]training loss: 9.777e-03:   0%|          | 324/300001 [5:06:34<4379:16:08, 52.61s/it]training loss: 9.777e-03:   0%|          | 325/300001 [5:07:19<4182:30:49, 50.24s/it]training loss: 9.777e-03:   0%|          | 326/300001 [5:08:46<5106:39:39, 61.35s/it]training loss: 9.777e-03:   0%|          | 327/300001 [5:09:45<5051:31:53, 60.68s/it]training loss: 9.777e-03:   0%|          | 328/300001 [5:10:36<4802:15:29, 57.69s/it]training loss: 9.777e-03:   0%|          | 329/300001 [5:11:35<4842:05:07, 58.17s/it]training loss: 9.777e-03:   0%|          | 330/300001 [5:13:19<5982:21:35, 71.87s/it]training loss: 9.777e-03:   0%|          | 331/300001 [5:14:41<6229:18:56, 74.83s/it]training loss: 9.777e-03:   0%|          | 332/300001 [5:15:41<5869:02:46, 70.51s/it]training loss: 9.777e-03:   0%|          | 333/300001 [5:17:43<7163:14:31, 86.05s/it]training loss: 9.777e-03:   0%|          | 334/300001 [5:19:34<7765:57:15, 93.30s/it]training loss: 9.777e-03:   0%|          | 335/300001 [5:21:05<7713:07:13, 92.66s/it]training loss: 9.777e-03:   0%|          | 336/300001 [5:22:26<7423:02:01, 89.18s/it]training loss: 9.777e-03:   0%|          | 337/300001 [5:24:32<8342:16:42, 100.22s/it]training loss: 9.777e-03:   0%|          | 338/300001 [5:25:31<7312:19:21, 87.85s/it] training loss: 9.777e-03:   0%|          | 339/300001 [5:27:10<7603:13:47, 91.34s/it]training loss: 9.777e-03:   0%|          | 340/300001 [5:28:00<6552:48:31, 78.72s/it]training loss: 1.052e-02:   0%|          | 340/300001 [5:28:54<6552:48:31, 78.72s/it]training loss: 1.052e-02:   0%|          | 341/300001 [5:28:55<5959:30:05, 71.60s/it]training loss: 1.052e-02:   0%|          | 342/300001 [5:30:15<6174:24:32, 74.18s/it]training loss: 1.052e-02:   0%|          | 343/300001 [5:31:10<5708:41:18, 68.58s/it]training loss: 1.052e-02:   0%|          | 344/300001 [5:31:58<5192:16:35, 62.38s/it]training loss: 1.052e-02:   0%|          | 345/300001 [5:33:01<5201:24:19, 62.49s/it]training loss: 1.052e-02:   0%|          | 346/300001 [5:34:01<5147:13:23, 61.84s/it]training loss: 1.052e-02:   0%|          | 347/300001 [5:34:58<5018:15:40, 60.29s/it]training loss: 1.052e-02:   0%|          | 348/300001 [5:35:55<4927:24:57, 59.20s/it]training loss: 1.052e-02:   0%|          | 349/300001 [5:36:41<4611:54:52, 55.41s/it]training loss: 1.052e-02:   0%|          | 350/300001 [5:37:30<4454:13:24, 53.51s/it]training loss: 1.052e-02:   0%|          | 351/300001 [5:38:24<4463:27:21, 53.62s/it]training loss: 1.052e-02:   0%|          | 352/300001 [5:39:23<4597:25:12, 55.23s/it]training loss: 1.052e-02:   0%|          | 353/300001 [5:40:06<4301:41:19, 51.68s/it]training loss: 1.052e-02:   0%|          | 354/300001 [5:40:53<4166:56:30, 50.06s/it]training loss: 1.052e-02:   0%|          | 355/300001 [5:41:47<4284:12:12, 51.47s/it]training loss: 1.052e-02:   0%|          | 356/300001 [5:43:04<4899:18:06, 58.86s/it]training loss: 1.052e-02:   0%|          | 357/300001 [5:45:02<6390:22:04, 76.78s/it]training loss: 1.052e-02:   0%|          | 358/300001 [5:46:25<6542:26:53, 78.60s/it]training loss: 1.052e-02:   0%|          | 359/300001 [5:47:16<5856:22:50, 70.36s/it]training loss: 1.052e-02:   0%|          | 360/300001 [5:48:08<5383:12:36, 64.68s/it]training loss: 1.182e-02:   0%|          | 360/300001 [5:49:04<5383:12:36, 64.68s/it]training loss: 1.182e-02:   0%|          | 361/300001 [5:49:04<5169:52:30, 62.11s/it]training loss: 1.182e-02:   0%|          | 362/300001 [5:49:59<5001:44:19, 60.09s/it]training loss: 1.182e-02:   0%|          | 363/300001 [5:50:53<4856:02:58, 58.34s/it]training loss: 1.182e-02:   0%|          | 364/300001 [5:51:44<4661:03:40, 56.00s/it]training loss: 1.182e-02:   0%|          | 365/300001 [5:52:32<4474:27:22, 53.76s/it]training loss: 1.182e-02:   0%|          | 366/300001 [5:53:30<4568:21:15, 54.89s/it]training loss: 1.182e-02:   0%|          | 367/300001 [5:54:34<4787:42:37, 57.52s/it]training loss: 1.182e-02:   0%|          | 368/300001 [5:55:23<4574:03:52, 54.96s/it]training loss: 1.182e-02:   0%|          | 369/300001 [5:56:17<4563:18:21, 54.83s/it]training loss: 1.182e-02:   0%|          | 370/300001 [5:57:05<4380:28:33, 52.63s/it]training loss: 1.182e-02:   0%|          | 371/300001 [5:58:15<4816:06:50, 57.86s/it]training loss: 1.182e-02:   0%|          | 372/300001 [5:59:45<5631:45:41, 67.66s/it]training loss: 1.182e-02:   0%|          | 373/300001 [6:00:35<5173:34:14, 62.16s/it]training loss: 1.182e-02:   0%|          | 374/300001 [6:01:46<5397:36:21, 64.85s/it]training loss: 1.182e-02:   0%|          | 375/300001 [6:03:12<5938:22:44, 71.35s/it]training loss: 1.182e-02:   0%|          | 376/300001 [6:04:25<5985:15:01, 71.91s/it]training loss: 1.182e-02:   0%|          | 377/300001 [6:05:16<5441:19:40, 65.38s/it]training loss: 1.182e-02:   0%|          | 378/300001 [6:06:39<5902:53:17, 70.92s/it]training loss: 1.182e-02:   0%|          | 379/300001 [6:07:47<5821:59:21, 69.95s/it]training loss: 1.182e-02:   0%|          | 380/300001 [6:09:01<5931:33:44, 71.27s/it]training loss: 1.102e-02:   0%|          | 380/300001 [6:09:53<5931:33:44, 71.27s/it]training loss: 1.102e-02:   0%|          | 381/300001 [6:09:53<5436:29:51, 65.32s/it]training loss: 1.102e-02:   0%|          | 382/300001 [6:11:25<6102:47:12, 73.33s/it]training loss: 1.102e-02:   0%|          | 383/300001 [6:13:25<7259:15:39, 87.22s/it]training loss: 1.102e-02:   0%|          | 384/300001 [6:14:13<6298:17:35, 75.68s/it]training loss: 1.102e-02:   0%|          | 385/300001 [6:15:29<6300:08:34, 75.70s/it]training loss: 1.102e-02:   0%|          | 386/300001 [6:16:24<5795:41:19, 69.64s/it]training loss: 1.102e-02:   0%|          | 387/300001 [6:17:09<5177:16:01, 62.21s/it]training loss: 1.102e-02:   0%|          | 388/300001 [6:18:02<4926:36:14, 59.20s/it]training loss: 1.102e-02:   0%|          | 389/300001 [6:18:52<4719:16:18, 56.70s/it]training loss: 1.102e-02:   0%|          | 390/300001 [6:20:01<5010:18:38, 60.20s/it]training loss: 1.102e-02:   0%|          | 391/300001 [6:21:07<5167:52:51, 62.10s/it]training loss: 1.102e-02:   0%|          | 392/300001 [6:21:59<4905:58:12, 58.95s/it]training loss: 1.102e-02:   0%|          | 393/300001 [6:23:18<5410:30:44, 65.01s/it]training loss: 1.102e-02:   0%|          | 394/300001 [6:24:29<5547:37:01, 66.66s/it]training loss: 1.102e-02:   0%|          | 395/300001 [6:25:31<5435:23:06, 65.31s/it]training loss: 1.102e-02:   0%|          | 396/300001 [6:27:02<6083:09:49, 73.09s/it]training loss: 1.102e-02:   0%|          | 397/300001 [6:28:24<6309:02:14, 75.81s/it]training loss: 1.102e-02:   0%|          | 398/300001 [6:29:20<5818:36:38, 69.92s/it]training loss: 1.102e-02:   0%|          | 399/300001 [6:30:06<5208:23:41, 62.58s/it]training loss: 1.102e-02:   0%|          | 400/300001 [6:30:54<4841:04:28, 58.17s/it]training loss: 1.221e-02:   0%|          | 400/300001 [6:32:01<4841:04:28, 58.17s/it]training loss: 1.221e-02:   0%|          | 401/300001 [6:32:01<5062:55:49, 60.84s/it]training loss: 1.221e-02:   0%|          | 402/300001 [6:32:53<4839:25:57, 58.15s/it]training loss: 1.221e-02:   0%|          | 403/300001 [6:34:29<5789:33:20, 69.57s/it]training loss: 1.221e-02:   0%|          | 404/300001 [6:35:17<5244:12:46, 63.02s/it]training loss: 1.221e-02:   0%|          | 405/300001 [6:36:10<4996:10:40, 60.03s/it]training loss: 1.221e-02:   0%|          | 406/300001 [6:37:28<5466:35:33, 65.69s/it]training loss: 1.221e-02:   0%|          | 407/300001 [6:39:11<6393:03:41, 76.82s/it]training loss: 1.221e-02:   0%|          | 408/300001 [6:40:17<6104:48:28, 73.36s/it]training loss: 1.221e-02:   0%|          | 409/300001 [6:41:13<5683:07:36, 68.29s/it]training loss: 1.221e-02:   0%|          | 410/300001 [6:42:12<5458:08:05, 65.59s/it]training loss: 1.221e-02:   0%|          | 411/300001 [6:42:57<4935:03:18, 59.30s/it]training loss: 1.221e-02:   0%|          | 412/300001 [6:43:46<4690:50:46, 56.37s/it]training loss: 1.221e-02:   0%|          | 413/300001 [6:44:45<4757:41:30, 57.17s/it]training loss: 1.221e-02:   0%|          | 414/300001 [6:45:30<4449:07:40, 53.46s/it]training loss: 1.221e-02:   0%|          | 415/300001 [6:46:15<4237:06:00, 50.92s/it]training loss: 1.221e-02:   0%|          | 416/300001 [6:47:02<4132:09:35, 49.65s/it]training loss: 1.221e-02:   0%|          | 417/300001 [6:48:21<4863:17:22, 58.44s/it]training loss: 1.221e-02:   0%|          | 418/300001 [6:49:19<4863:52:49, 58.45s/it]training loss: 1.221e-02:   0%|          | 419/300001 [6:50:05<4542:16:49, 54.58s/it]training loss: 1.221e-02:   0%|          | 420/300001 [6:50:46<4202:51:34, 50.50s/it]training loss: 1.275e-02:   0%|          | 420/300001 [6:51:26<4202:51:34, 50.50s/it]training loss: 1.275e-02:   0%|          | 421/300001 [6:51:26<3933:29:04, 47.27s/it]training loss: 1.275e-02:   0%|          | 422/300001 [6:52:29<4325:03:15, 51.97s/it]training loss: 1.275e-02:   0%|          | 423/300001 [6:53:16<4203:44:05, 50.52s/it]training loss: 1.275e-02:   0%|          | 424/300001 [6:54:16<4441:05:57, 53.37s/it]training loss: 1.275e-02:   0%|          | 425/300001 [6:55:28<4914:32:19, 59.06s/it]training loss: 1.275e-02:   0%|          | 426/300001 [6:57:04<5825:02:45, 70.00s/it]training loss: 1.275e-02:   0%|          | 427/300001 [6:57:51<5256:58:54, 63.17s/it]training loss: 1.275e-02:   0%|          | 428/300001 [6:58:53<5226:53:43, 62.81s/it]training loss: 1.275e-02:   0%|          | 429/300001 [7:00:33<6151:20:40, 73.92s/it]training loss: 1.275e-02:   0%|          | 430/300001 [7:01:43<6054:17:27, 72.76s/it]training loss: 1.275e-02:   0%|          | 431/300001 [7:02:28<5376:08:27, 64.61s/it]training loss: 1.275e-02:   0%|          | 432/300001 [7:03:14<4901:01:30, 58.90s/it]training loss: 1.275e-02:   0%|          | 433/300001 [7:04:07<4745:46:39, 57.03s/it]training loss: 1.275e-02:   0%|          | 434/300001 [7:04:56<4554:38:05, 54.73s/it]training loss: 1.275e-02:   0%|          | 435/300001 [7:05:42<4343:26:38, 52.20s/it]training loss: 1.275e-02:   0%|          | 436/300001 [7:06:51<4761:51:37, 57.23s/it]training loss: 1.275e-02:   0%|          | 437/300001 [7:07:54<4905:09:18, 58.95s/it]training loss: 1.275e-02:   0%|          | 438/300001 [7:08:52<4866:11:30, 58.48s/it]training loss: 1.275e-02:   0%|          | 439/300001 [7:10:19<5595:03:45, 67.24s/it]training loss: 1.275e-02:   0%|          | 440/300001 [7:11:08<5128:16:41, 61.63s/it]training loss: 8.467e-03:   0%|          | 440/300001 [7:12:42<5128:16:41, 61.63s/it]training loss: 8.467e-03:   0%|          | 441/300001 [7:12:42<5945:50:14, 71.45s/it]training loss: 8.467e-03:   0%|          | 442/300001 [7:14:14<6451:19:11, 77.53s/it]training loss: 8.467e-03:   0%|          | 443/300001 [7:15:08<5878:13:18, 70.64s/it]training loss: 8.467e-03:   0%|          | 444/300001 [7:15:56<5293:16:51, 63.61s/it]training loss: 8.467e-03:   0%|          | 445/300001 [7:16:42<4864:02:15, 58.45s/it]training loss: 8.467e-03:   0%|          | 446/300001 [7:17:32<4656:48:04, 55.96s/it]training loss: 8.467e-03:   0%|          | 447/300001 [7:18:24<4552:53:03, 54.72s/it]training loss: 8.467e-03:   0%|          | 448/300001 [7:19:09<4312:25:53, 51.83s/it]training loss: 8.467e-03:   0%|          | 449/300001 [7:19:58<4245:07:23, 51.02s/it]training loss: 8.467e-03:   0%|          | 450/300001 [7:20:45<4149:21:38, 49.87s/it]training loss: 8.467e-03:   0%|          | 451/300001 [7:22:02<4828:05:55, 58.02s/it]training loss: 8.467e-03:   0%|          | 452/300001 [7:23:21<5333:20:46, 64.10s/it]training loss: 8.467e-03:   0%|          | 453/300001 [7:24:05<4842:06:48, 58.19s/it]training loss: 8.467e-03:   0%|          | 454/300001 [7:24:48<4471:12:09, 53.74s/it]training loss: 8.467e-03:   0%|          | 455/300001 [7:26:07<5098:28:50, 61.27s/it]training loss: 8.467e-03:   0%|          | 456/300001 [7:27:05<5018:47:52, 60.32s/it]training loss: 8.467e-03:   0%|          | 457/300001 [7:28:25<5495:35:50, 66.05s/it]training loss: 8.467e-03:   0%|          | 458/300001 [7:29:10<4971:17:14, 59.75s/it]training loss: 8.467e-03:   0%|          | 459/300001 [7:29:56<4641:29:33, 55.78s/it]training loss: 8.467e-03:   0%|          | 460/300001 [7:30:41<4351:59:23, 52.30s/it]training loss: 9.491e-03:   0%|          | 460/300001 [7:31:51<4351:59:23, 52.30s/it]training loss: 9.491e-03:   0%|          | 461/300001 [7:31:51<4809:46:18, 57.81s/it]training loss: 9.491e-03:   0%|          | 462/300001 [7:32:53<4909:58:05, 59.01s/it]training loss: 9.491e-03:   0%|          | 463/300001 [7:33:38<4563:25:22, 54.85s/it]training loss: 9.491e-03:   0%|          | 464/300001 [7:34:31<4514:11:42, 54.25s/it]training loss: 9.491e-03:   0%|          | 465/300001 [7:35:31<4665:37:51, 56.07s/it]training loss: 9.491e-03:   0%|          | 466/300001 [7:36:24<4569:00:51, 54.91s/it]training loss: 9.491e-03:   0%|          | 467/300001 [7:37:15<4492:32:35, 53.99s/it]training loss: 9.491e-03:   0%|          | 468/300001 [7:38:20<4752:32:00, 57.12s/it]training loss: 9.491e-03:   0%|          | 469/300001 [7:39:06<4470:45:39, 53.73s/it]training loss: 9.491e-03:   0%|          | 470/300001 [7:39:53<4311:07:38, 51.81s/it]training loss: 9.491e-03:   0%|          | 471/300001 [7:40:28<3895:04:56, 46.81s/it]training loss: 9.491e-03:   0%|          | 472/300001 [7:41:23<4097:14:01, 49.24s/it]training loss: 9.491e-03:   0%|          | 473/300001 [7:42:21<4312:14:51, 51.83s/it]training loss: 9.491e-03:   0%|          | 474/300001 [7:43:37<4920:11:27, 59.14s/it]training loss: 9.491e-03:   0%|          | 475/300001 [7:44:26<4655:45:43, 55.96s/it]training loss: 9.491e-03:   0%|          | 476/300001 [7:45:40<5124:11:20, 61.59s/it]training loss: 9.491e-03:   0%|          | 477/300001 [7:46:44<5175:11:48, 62.20s/it]training loss: 9.491e-03:   0%|          | 478/300001 [7:47:39<4994:14:26, 60.03s/it]training loss: 9.491e-03:   0%|          | 479/300001 [7:48:25<4639:31:16, 55.76s/it]training loss: 9.491e-03:   0%|          | 480/300001 [7:49:19<4611:55:18, 55.43s/it]training loss: 9.263e-03:   0%|          | 480/300001 [7:50:29<4611:55:18, 55.43s/it]training loss: 9.263e-03:   0%|          | 481/300001 [7:50:29<4970:55:52, 59.75s/it]training loss: 9.263e-03:   0%|          | 482/300001 [7:51:19<4732:03:05, 56.88s/it]training loss: 9.263e-03:   0%|          | 483/300001 [7:52:13<4648:41:13, 55.87s/it]training loss: 9.263e-03:   0%|          | 484/300001 [7:53:06<4579:03:48, 55.04s/it]training loss: 9.263e-03:   0%|          | 485/300001 [7:54:00<4548:37:27, 54.67s/it]training loss: 9.263e-03:   0%|          | 486/300001 [7:54:51<4465:07:21, 53.67s/it]training loss: 9.263e-03:   0%|          | 487/300001 [7:55:58<4805:12:02, 57.76s/it]training loss: 9.263e-03:   0%|          | 488/300001 [7:57:28<5604:11:34, 67.36s/it]training loss: 9.263e-03:   0%|          | 489/300001 [7:58:44<5815:52:08, 69.90s/it]training loss: 9.263e-03:   0%|          | 490/300001 [7:59:51<5751:34:04, 69.13s/it]training loss: 9.263e-03:   0%|          | 491/300001 [8:00:48<5435:20:56, 65.33s/it]training loss: 9.263e-03:   0%|          | 492/300001 [8:01:38<5056:18:19, 60.78s/it]training loss: 9.263e-03:   0%|          | 493/300001 [8:02:25<4718:21:13, 56.71s/it]training loss: 9.263e-03:   0%|          | 494/300001 [8:03:11<4453:52:36, 53.53s/it]training loss: 9.263e-03:   0%|          | 495/300001 [8:04:09<4560:09:54, 54.81s/it]training loss: 9.263e-03:   0%|          | 496/300001 [8:05:42<5510:35:34, 66.24s/it]training loss: 9.263e-03:   0%|          | 497/300001 [8:07:06<5945:14:09, 71.46s/it]training loss: 9.263e-03:   0%|          | 498/300001 [8:08:13<5847:53:24, 70.29s/it]training loss: 9.263e-03:   0%|          | 499/300001 [8:09:46<6409:37:55, 77.04s/it]training loss: 9.263e-03:   0%|          | 500/300001 [8:11:00<6331:55:08, 76.11s/it]training loss: 7.550e-03:   0%|          | 500/300001 [8:12:09<6331:55:08, 76.11s/it]training loss: 7.550e-03:   0%|          | 501/300001 [8:12:30<6672:09:08, 80.20s/it]training loss: 7.550e-03:   0%|          | 502/300001 [8:13:13<5758:27:18, 69.22s/it]training loss: 7.550e-03:   0%|          | 503/300001 [8:13:59<5173:39:32, 62.19s/it]training loss: 7.550e-03:   0%|          | 504/300001 [8:14:45<4755:51:49, 57.17s/it]training loss: 7.550e-03:   0%|          | 505/300001 [8:15:31<4478:22:24, 53.83s/it]training loss: 7.550e-03:   0%|          | 506/300001 [8:16:15<4244:44:36, 51.02s/it]training loss: 7.550e-03:   0%|          | 507/300001 [8:16:59<4071:41:57, 48.94s/it]training loss: 7.550e-03:   0%|          | 508/300001 [8:17:51<4142:23:08, 49.79s/it]training loss: 7.550e-03:   0%|          | 509/300001 [8:18:38<4075:38:55, 48.99s/it]training loss: 7.550e-03:   0%|          | 510/300001 [8:19:30<4139:55:11, 49.76s/it]training loss: 7.550e-03:   0%|          | 511/300001 [8:20:13<3987:56:26, 47.94s/it]training loss: 7.550e-03:   0%|          | 512/300001 [8:21:00<3949:38:43, 47.48s/it]training loss: 7.550e-03:   0%|          | 513/300001 [8:21:44<3871:03:17, 46.53s/it]training loss: 7.550e-03:   0%|          | 514/300001 [8:22:36<3994:08:47, 48.01s/it]training loss: 7.550e-03:   0%|          | 515/300001 [8:23:33<4238:52:42, 50.95s/it]training loss: 7.550e-03:   0%|          | 516/300001 [8:24:18<4083:36:54, 49.09s/it]training loss: 7.550e-03:   0%|          | 517/300001 [8:25:03<3983:09:38, 47.88s/it]training loss: 7.550e-03:   0%|          | 518/300001 [8:26:01<4236:52:32, 50.93s/it]training loss: 7.550e-03:   0%|          | 519/300001 [8:27:07<4618:57:09, 55.52s/it]training loss: 7.550e-03:   0%|          | 520/300001 [8:28:04<4643:38:18, 55.82s/it]training loss: 8.955e-03:   0%|          | 520/300001 [8:28:59<4643:38:18, 55.82s/it]training loss: 8.955e-03:   0%|          | 521/300001 [8:28:59<4634:24:31, 55.71s/it]training loss: 8.955e-03:   0%|          | 522/300001 [8:29:44<4348:12:25, 52.27s/it]training loss: 8.955e-03:   0%|          | 523/300001 [8:30:55<4814:48:55, 57.88s/it]training loss: 8.955e-03:   0%|          | 524/300001 [8:31:41<4526:54:26, 54.42s/it]training loss: 8.955e-03:   0%|          | 525/300001 [8:32:43<4718:38:00, 56.72s/it]training loss: 8.955e-03:   0%|          | 526/300001 [8:33:45<4845:11:42, 58.24s/it]training loss: 8.955e-03:   0%|          | 527/300001 [8:34:31<4549:37:18, 54.69s/it]training loss: 8.955e-03:   0%|          | 528/300001 [8:35:46<5040:59:42, 60.60s/it]training loss: 8.955e-03:   0%|          | 529/300001 [8:37:20<5888:40:37, 70.79s/it]training loss: 8.955e-03:   0%|          | 530/300001 [8:38:35<5981:07:49, 71.90s/it]training loss: 8.955e-03:   0%|          | 531/300001 [8:39:35<5699:32:26, 68.52s/it]training loss: 8.955e-03:   0%|          | 532/300001 [8:41:06<6248:18:26, 75.11s/it]training loss: 8.955e-03:   0%|          | 533/300001 [8:42:34<6571:23:27, 79.00s/it]training loss: 8.955e-03:   0%|          | 534/300001 [8:44:06<6899:15:36, 82.94s/it]training loss: 8.955e-03:   0%|          | 535/300001 [8:45:19<6662:48:01, 80.10s/it]training loss: 8.955e-03:   0%|          | 536/300001 [8:47:15<7545:43:54, 90.71s/it]training loss: 8.955e-03:   0%|          | 537/300001 [8:48:31<7190:09:20, 86.44s/it]training loss: 8.955e-03:   0%|          | 538/300001 [8:49:28<6449:14:35, 77.53s/it]training loss: 8.955e-03:   0%|          | 539/300001 [8:50:19<5778:19:40, 69.46s/it]training loss: 8.955e-03:   0%|          | 540/300001 [8:51:10<5327:44:40, 64.05s/it]training loss: 8.234e-03:   0%|          | 540/300001 [8:52:22<5327:44:40, 64.05s/it]training loss: 8.234e-03:   0%|          | 541/300001 [8:52:22<5530:08:59, 66.48s/it]training loss: 8.234e-03:   0%|          | 542/300001 [8:53:14<5147:16:35, 61.88s/it]training loss: 8.234e-03:   0%|          | 543/300001 [8:54:11<5027:24:10, 60.44s/it]training loss: 8.234e-03:   0%|          | 544/300001 [8:54:59<4733:29:23, 56.90s/it]training loss: 8.234e-03:   0%|          | 545/300001 [8:56:08<5033:17:08, 60.51s/it]training loss: 8.234e-03:   0%|          | 546/300001 [8:57:46<5959:30:17, 71.64s/it]training loss: 8.234e-03:   0%|          | 547/300001 [8:58:46<5686:01:35, 68.36s/it]training loss: 8.234e-03:   0%|          | 548/300001 [8:59:39<5293:20:53, 63.64s/it]training loss: 8.234e-03:   0%|          | 549/300001 [9:00:32<5026:15:35, 60.43s/it]training loss: 8.234e-03:   0%|          | 550/300001 [9:01:23<4784:40:27, 57.52s/it]training loss: 8.234e-03:   0%|          | 551/300001 [9:02:18<4737:16:35, 56.95s/it]training loss: 8.234e-03:   0%|          | 552/300001 [9:03:17<4769:55:40, 57.34s/it]training loss: 8.234e-03:   0%|          | 553/300001 [9:04:12<4726:16:50, 56.82s/it]training loss: 8.234e-03:   0%|          | 554/300001 [9:05:14<4852:55:49, 58.34s/it]training loss: 8.234e-03:   0%|          | 555/300001 [9:06:21<5065:28:41, 60.90s/it]training loss: 8.234e-03:   0%|          | 556/300001 [9:07:14<4858:18:20, 58.41s/it]training loss: 8.234e-03:   0%|          | 557/300001 [9:08:19<5033:25:19, 60.51s/it]training loss: 8.234e-03:   0%|          | 558/300001 [9:09:17<4958:10:16, 59.61s/it]training loss: 8.234e-03:   0%|          | 559/300001 [9:10:14<4904:50:55, 58.97s/it]training loss: 8.234e-03:   0%|          | 560/300001 [9:11:02<4641:48:24, 55.81s/it]training loss: 8.382e-03:   0%|          | 560/300001 [9:11:57<4641:48:24, 55.81s/it]training loss: 8.382e-03:   0%|          | 561/300001 [9:11:57<4614:34:14, 55.48s/it]training loss: 8.382e-03:   0%|          | 562/300001 [9:12:41<4332:49:00, 52.09s/it]training loss: 8.382e-03:   0%|          | 563/300001 [9:13:24<4091:04:17, 49.18s/it]training loss: 8.382e-03:   0%|          | 564/300001 [9:14:12<4068:46:27, 48.92s/it]training loss: 8.382e-03:   0%|          | 565/300001 [9:14:55<3927:10:12, 47.21s/it]training loss: 8.382e-03:   0%|          | 566/300001 [9:15:40<3865:13:21, 46.47s/it]training loss: 8.382e-03:   0%|          | 567/300001 [9:16:34<4051:38:00, 48.71s/it]training loss: 8.382e-03:   0%|          | 568/300001 [9:17:27<4170:46:47, 50.14s/it]training loss: 8.382e-03:   0%|          | 569/300001 [9:18:18<4172:30:18, 50.17s/it]training loss: 8.382e-03:   0%|          | 570/300001 [9:19:05<4102:42:35, 49.33s/it]training loss: 8.382e-03:   0%|          | 571/300001 [9:20:04<4333:22:26, 52.10s/it]training loss: 8.382e-03:   0%|          | 572/300001 [9:21:22<5000:22:03, 60.12s/it]training loss: 8.382e-03:   0%|          | 573/300001 [9:22:33<5272:44:24, 63.39s/it]training loss: 8.382e-03:   0%|          | 574/300001 [9:23:33<5178:11:27, 62.26s/it]training loss: 8.382e-03:   0%|          | 575/300001 [9:24:20<4788:01:42, 57.57s/it]training loss: 8.382e-03:   0%|          | 576/300001 [9:25:05<4481:08:22, 53.88s/it]training loss: 8.382e-03:   0%|          | 577/300001 [9:25:50<4254:48:58, 51.16s/it]training loss: 8.382e-03:   0%|          | 578/300001 [9:26:32<4039:56:45, 48.57s/it]training loss: 8.382e-03:   0%|          | 579/300001 [9:27:17<3946:55:20, 47.45s/it]training loss: 8.382e-03:   0%|          | 580/300001 [9:28:05<3949:06:14, 47.48s/it]training loss: 8.041e-03:   0%|          | 580/300001 [9:28:52<3949:06:14, 47.48s/it]training loss: 8.041e-03:   0%|          | 581/300001 [9:28:52<3951:55:17, 47.51s/it]training loss: 8.041e-03:   0%|          | 582/300001 [9:29:37<3880:51:53, 46.66s/it]training loss: 8.041e-03:   0%|          | 583/300001 [9:31:01<4815:00:21, 57.89s/it]training loss: 8.041e-03:   0%|          | 584/300001 [9:32:05<4955:51:02, 59.59s/it]training loss: 8.041e-03:   0%|          | 585/300001 [9:32:51<4626:04:36, 55.62s/it]training loss: 8.041e-03:   0%|          | 586/300001 [9:33:38<4411:08:30, 53.04s/it]training loss: 8.041e-03:   0%|          | 587/300001 [9:34:34<4495:49:46, 54.06s/it]training loss: 8.041e-03:   0%|          | 588/300001 [9:36:18<5724:40:08, 68.83s/it]training loss: 8.041e-03:   0%|          | 589/300001 [9:37:07<5227:27:13, 62.85s/it]training loss: 8.041e-03:   0%|          | 590/300001 [9:38:01<5010:19:59, 60.24s/it]training loss: 8.041e-03:   0%|          | 591/300001 [9:38:47<4663:32:19, 56.07s/it]training loss: 8.041e-03:   0%|          | 592/300001 [9:39:38<4521:57:27, 54.37s/it]training loss: 8.041e-03:   0%|          | 593/300001 [9:40:29<4448:45:49, 53.49s/it]training loss: 8.041e-03:   0%|          | 594/300001 [9:41:22<4432:40:35, 53.30s/it]training loss: 8.041e-03:   0%|          | 595/300001 [9:42:11<4331:50:38, 52.09s/it]training loss: 8.041e-03:   0%|          | 596/300001 [9:43:00<4247:35:51, 51.07s/it]training loss: 8.041e-03:   0%|          | 597/300001 [9:44:11<4738:38:11, 56.98s/it]training loss: 8.041e-03:   0%|          | 598/300001 [9:44:59<4518:05:23, 54.33s/it]training loss: 8.041e-03:   0%|          | 599/300001 [9:45:51<4480:06:29, 53.87s/it]training loss: 8.041e-03:   0%|          | 600/300001 [9:46:36<4251:48:19, 51.12s/it]training loss: 9.452e-03:   0%|          | 600/300001 [9:47:21<4251:48:19, 51.12s/it]training loss: 9.452e-03:   0%|          | 601/300001 [9:47:21<4098:13:04, 49.28s/it]training loss: 9.452e-03:   0%|          | 602/300001 [9:48:54<5197:04:02, 62.49s/it]training loss: 9.452e-03:   0%|          | 603/300001 [9:50:21<5802:56:17, 69.78s/it]training loss: 9.452e-03:   0%|          | 604/300001 [9:51:24<5639:53:47, 67.82s/it]training loss: 9.452e-03:   0%|          | 605/300001 [9:52:45<5966:33:49, 71.74s/it]training loss: 9.452e-03:   0%|          | 606/300001 [9:54:00<6037:08:15, 72.59s/it]training loss: 9.452e-03:   0%|          | 607/300001 [9:54:54<5564:21:33, 66.91s/it]training loss: 9.452e-03:   0%|          | 608/300001 [9:55:39<5023:27:30, 60.40s/it]training loss: 9.452e-03:   0%|          | 609/300001 [9:56:25<4660:04:21, 56.03s/it]training loss: 9.452e-03:   0%|          | 610/300001 [9:57:10<4386:55:44, 52.75s/it]training loss: 9.452e-03:   0%|          | 611/300001 [9:58:11<4594:10:59, 55.24s/it]training loss: 9.452e-03:   0%|          | 612/300001 [9:59:01<4465:13:53, 53.69s/it]training loss: 9.452e-03:   0%|          | 613/300001 [10:00:07<4769:43:47, 57.35s/it]training loss: 9.452e-03:   0%|          | 614/300001 [10:01:05<4779:57:06, 57.48s/it]training loss: 9.452e-03:   0%|          | 615/300001 [10:01:53<4558:11:26, 54.81s/it]training loss: 9.452e-03:   0%|          | 616/300001 [10:02:48<4552:55:00, 54.75s/it]training loss: 9.452e-03:   0%|          | 617/300001 [10:04:14<5345:05:00, 64.27s/it]training loss: 9.452e-03:   0%|          | 618/300001 [10:05:09<5101:59:03, 61.35s/it]training loss: 9.452e-03:   0%|          | 619/300001 [10:06:40<5852:48:14, 70.38s/it]training loss: 9.452e-03:   0%|          | 620/300001 [10:07:52<5884:30:58, 70.76s/it]training loss: 9.456e-03:   0%|          | 620/300001 [10:08:42<5884:30:58, 70.76s/it]training loss: 9.456e-03:   0%|          | 621/300001 [10:08:42<5375:37:54, 64.64s/it]training loss: 9.456e-03:   0%|          | 622/300001 [10:10:07<5882:32:10, 70.74s/it]training loss: 9.456e-03:   0%|          | 623/300001 [10:11:21<5970:34:21, 71.80s/it]training loss: 9.456e-03:   0%|          | 624/300001 [10:12:28<5846:30:51, 70.30s/it]training loss: 9.456e-03:   0%|          | 625/300001 [10:13:26<5530:16:21, 66.50s/it]training loss: 9.456e-03:   0%|          | 626/300001 [10:14:16<5120:02:43, 61.57s/it]training loss: 9.456e-03:   0%|          | 627/300001 [10:15:04<4783:34:27, 57.52s/it]training loss: 9.456e-03:   0%|          | 628/300001 [10:16:07<4917:13:32, 59.13s/it]training loss: 9.456e-03:   0%|          | 629/300001 [10:17:23<5349:11:01, 64.32s/it]training loss: 9.456e-03:   0%|          | 630/300001 [10:18:14<5016:06:31, 60.32s/it]training loss: 9.456e-03:   0%|          | 631/300001 [10:19:36<5554:28:41, 66.79s/it]training loss: 9.456e-03:   0%|          | 632/300001 [10:20:48<5689:19:00, 68.42s/it]training loss: 9.456e-03:   0%|          | 633/300001 [10:22:49<6986:41:33, 84.02s/it]training loss: 9.456e-03:   0%|          | 634/300001 [10:24:11<6945:48:34, 83.53s/it]training loss: 9.456e-03:   0%|          | 635/300001 [10:25:37<7010:32:00, 84.30s/it]training loss: 9.456e-03:   0%|          | 636/300001 [10:26:57<6892:40:27, 82.89s/it]training loss: 9.456e-03:   0%|          | 637/300001 [10:28:43<7472:27:15, 89.86s/it]training loss: 9.456e-03:   0%|          | 638/300001 [10:29:51<6928:40:25, 83.32s/it]training loss: 9.456e-03:   0%|          | 639/300001 [10:31:18<7006:53:36, 84.26s/it]training loss: 9.456e-03:   0%|          | 640/300001 [10:32:39<6934:28:31, 83.39s/it]training loss: 7.615e-03:   0%|          | 640/300001 [10:34:24<6934:28:31, 83.39s/it]training loss: 7.615e-03:   0%|          | 641/300001 [10:34:24<7477:49:57, 89.93s/it]training loss: 7.615e-03:   0%|          | 642/300001 [10:35:56<7521:16:36, 90.45s/it]training loss: 7.615e-03:   0%|          | 643/300001 [10:37:26<7508:16:48, 90.29s/it]training loss: 7.615e-03:   0%|          | 644/300001 [10:38:22<6652:11:27, 80.00s/it]training loss: 7.615e-03:   0%|          | 645/300001 [10:39:52<6909:55:59, 83.10s/it]training loss: 7.615e-03:   0%|          | 646/300001 [10:40:38<5981:30:19, 71.93s/it]training loss: 7.615e-03:   0%|          | 647/300001 [10:41:25<5349:02:06, 64.33s/it]training loss: 7.615e-03:   0%|          | 648/300001 [10:42:12<4920:43:43, 59.18s/it]training loss: 7.615e-03:   0%|          | 649/300001 [10:43:38<5605:37:41, 67.41s/it]training loss: 7.615e-03:   0%|          | 650/300001 [10:44:41<5476:32:18, 65.86s/it]training loss: 7.615e-03:   0%|          | 651/300001 [10:45:53<5649:43:12, 67.94s/it]training loss: 7.615e-03:   0%|          | 652/300001 [10:46:47<5281:56:41, 63.52s/it]training loss: 7.615e-03:   0%|          | 653/300001 [10:47:34<4880:07:13, 58.69s/it]training loss: 7.615e-03:   0%|          | 654/300001 [10:48:20<4573:10:39, 55.00s/it]training loss: 7.615e-03:   0%|          | 655/300001 [10:49:12<4477:34:06, 53.85s/it]training loss: 7.615e-03:   0%|          | 656/300001 [10:50:01<4375:12:23, 52.62s/it]training loss: 7.615e-03:   0%|          | 657/300001 [10:50:49<4247:35:21, 51.08s/it]training loss: 7.615e-03:   0%|          | 658/300001 [10:51:54<4597:00:06, 55.29s/it]training loss: 7.615e-03:   0%|          | 659/300001 [10:53:03<4952:55:19, 59.57s/it]training loss: 7.615e-03:   0%|          | 660/300001 [10:53:58<4819:31:11, 57.96s/it]training loss: 8.086e-03:   0%|          | 660/300001 [10:54:40<4819:31:11, 57.96s/it]training loss: 8.086e-03:   0%|          | 661/300001 [10:54:40<4421:12:31, 53.17s/it]training loss: 8.086e-03:   0%|          | 662/300001 [10:55:26<4260:36:23, 51.24s/it]training loss: 8.086e-03:   0%|          | 663/300001 [10:56:18<4265:05:25, 51.29s/it]training loss: 8.086e-03:   0%|          | 664/300001 [10:57:30<4791:21:04, 57.62s/it]training loss: 8.086e-03:   0%|          | 665/300001 [10:58:46<5238:53:47, 63.01s/it]training loss: 8.086e-03:   0%|          | 666/300001 [10:59:39<5007:20:57, 60.22s/it]training loss: 8.086e-03:   0%|          | 667/300001 [11:00:32<4810:53:01, 57.86s/it]training loss: 8.086e-03:   0%|          | 668/300001 [11:01:43<5145:36:26, 61.88s/it]training loss: 8.086e-03:   0%|          | 669/300001 [11:02:34<4863:30:23, 58.49s/it]training loss: 8.086e-03:   0%|          | 670/300001 [11:03:42<5114:26:17, 61.51s/it]training loss: 8.086e-03:   0%|          | 671/300001 [11:04:50<5267:03:25, 63.35s/it]training loss: 8.086e-03:   0%|          | 672/300001 [11:05:44<5041:03:34, 60.63s/it]training loss: 8.086e-03:   0%|          | 673/300001 [11:06:46<5072:42:04, 61.01s/it]training loss: 8.086e-03:   0%|          | 674/300001 [11:07:49<5131:28:41, 61.72s/it]training loss: 8.086e-03:   0%|          | 675/300001 [11:08:47<5028:29:09, 60.48s/it]training loss: 8.086e-03:   0%|          | 676/300001 [11:10:35<6202:20:59, 74.60s/it]training loss: 8.086e-03:   0%|          | 677/300001 [11:12:35<7349:19:58, 88.39s/it]training loss: 8.086e-03:   0%|          | 678/300001 [11:13:43<6847:19:34, 82.35s/it]training loss: 8.086e-03:   0%|          | 679/300001 [11:14:49<6436:37:52, 77.41s/it]training loss: 8.086e-03:   0%|          | 680/300001 [11:15:37<5700:03:42, 68.56s/it]training loss: 8.547e-03:   0%|          | 680/300001 [11:16:31<5700:03:42, 68.56s/it]training loss: 8.547e-03:   0%|          | 681/300001 [11:16:31<5332:26:05, 64.13s/it]training loss: 8.547e-03:   0%|          | 682/300001 [11:17:44<5550:55:57, 66.76s/it]training loss: 8.547e-03:   0%|          | 683/300001 [11:18:57<5721:44:45, 68.82s/it]training loss: 8.547e-03:   0%|          | 684/300001 [11:20:01<5583:31:12, 67.16s/it]training loss: 8.547e-03:   0%|          | 685/300001 [11:20:53<5207:43:51, 62.64s/it]training loss: 8.547e-03:   0%|          | 686/300001 [11:21:38<4780:47:04, 57.50s/it]training loss: 8.547e-03:   0%|          | 687/300001 [11:22:39<4859:52:34, 58.45s/it]training loss: 8.547e-03:   0%|          | 688/300001 [11:23:47<5109:38:45, 61.46s/it]training loss: 8.547e-03:   0%|          | 689/300001 [11:25:05<5510:51:40, 66.28s/it]training loss: 8.547e-03:   0%|          | 690/300001 [11:26:29<5941:38:29, 71.46s/it]training loss: 8.547e-03:   0%|          | 691/300001 [11:27:57<6360:07:45, 76.50s/it]training loss: 8.547e-03:   0%|          | 692/300001 [11:29:17<6440:21:19, 77.46s/it]training loss: 8.547e-03:   0%|          | 693/300001 [11:30:12<5879:27:44, 70.72s/it]training loss: 8.547e-03:   0%|          | 694/300001 [11:31:35<6201:56:16, 74.60s/it]training loss: 8.547e-03:   0%|          | 695/300001 [11:32:42<6005:31:38, 72.23s/it]training loss: 8.547e-03:   0%|          | 696/300001 [11:33:48<5863:12:37, 70.52s/it]training loss: 8.547e-03:   0%|          | 697/300001 [11:34:57<5814:17:59, 69.93s/it]training loss: 8.547e-03:   0%|          | 698/300001 [11:36:47<6814:06:06, 81.96s/it]training loss: 8.547e-03:   0%|          | 699/300001 [11:37:57<6511:51:25, 78.32s/it]training loss: 8.547e-03:   0%|          | 700/300001 [11:39:09<6352:45:21, 76.41s/it]training loss: 7.364e-03:   0%|          | 700/300001 [11:40:32<6352:45:21, 76.41s/it]training loss: 7.364e-03:   0%|          | 701/300001 [11:40:32<6521:24:43, 78.44s/it]training loss: 7.364e-03:   0%|          | 702/300001 [11:41:35<6138:31:39, 73.83s/it]training loss: 7.364e-03:   0%|          | 703/300001 [11:42:18<5362:15:20, 64.50s/it]training loss: 7.364e-03:   0%|          | 704/300001 [11:42:59<4794:16:03, 57.67s/it]training loss: 7.364e-03:   0%|          | 705/300001 [11:43:45<4493:13:11, 54.05s/it]training loss: 7.364e-03:   0%|          | 706/300001 [11:44:30<4273:37:29, 51.40s/it]training loss: 7.364e-03:   0%|          | 707/300001 [11:45:19<4198:03:16, 50.50s/it]training loss: 7.364e-03:   0%|          | 708/300001 [11:46:08<4171:07:27, 50.17s/it]training loss: 7.364e-03:   0%|          | 709/300001 [11:47:17<4626:50:19, 55.65s/it]training loss: 7.364e-03:   0%|          | 710/300001 [11:48:54<5657:49:13, 68.05s/it]training loss: 7.364e-03:   0%|          | 711/300001 [11:50:15<5997:28:00, 72.14s/it]training loss: 7.364e-03:   0%|          | 712/300001 [11:51:24<5906:53:13, 71.05s/it]training loss: 7.364e-03:   0%|          | 713/300001 [11:52:30<5790:49:23, 69.66s/it]training loss: 7.364e-03:   0%|          | 714/300001 [11:53:46<5942:03:32, 71.47s/it]training loss: 7.364e-03:   0%|          | 715/300001 [11:54:41<5532:34:51, 66.55s/it]training loss: 7.364e-03:   0%|          | 716/300001 [11:55:39<5331:35:09, 64.13s/it]training loss: 7.364e-03:   0%|          | 717/300001 [11:56:39<5213:00:18, 62.71s/it]training loss: 7.364e-03:   0%|          | 718/300001 [11:57:34<5028:05:20, 60.48s/it]training loss: 7.364e-03:   0%|          | 719/300001 [11:58:35<5038:10:05, 60.60s/it]training loss: 7.364e-03:   0%|          | 720/300001 [11:59:25<4778:32:30, 57.48s/it]training loss: 7.611e-03:   0%|          | 720/300001 [12:00:52<4778:32:30, 57.48s/it]training loss: 7.611e-03:   0%|          | 721/300001 [12:00:52<5522:05:40, 66.42s/it]training loss: 7.611e-03:   0%|          | 722/300001 [12:02:23<6115:41:47, 73.57s/it]training loss: 7.611e-03:   0%|          | 723/300001 [12:03:32<5998:07:35, 72.15s/it]training loss: 7.611e-03:   0%|          | 724/300001 [12:05:09<6623:14:18, 79.67s/it]training loss: 7.611e-03:   0%|          | 725/300001 [12:06:41<6938:58:03, 83.47s/it]training loss: 7.611e-03:   0%|          | 726/300001 [12:07:41<6359:43:11, 76.50s/it]training loss: 7.611e-03:   0%|          | 727/300001 [12:08:26<5565:13:43, 66.94s/it]training loss: 7.611e-03:   0%|          | 728/300001 [12:09:27<5423:59:05, 65.25s/it]training loss: 7.611e-03:   0%|          | 729/300001 [12:10:32<5417:34:57, 65.17s/it]training loss: 7.611e-03:   0%|          | 730/300001 [12:11:27<5163:02:40, 62.11s/it]training loss: 7.611e-03:   0%|          | 731/300001 [12:12:26<5078:08:59, 61.09s/it]training loss: 7.611e-03:   0%|          | 732/300001 [12:13:40<5406:42:15, 65.04s/it]training loss: 7.611e-03:   0%|          | 733/300001 [12:14:39<5253:39:03, 63.20s/it]training loss: 7.611e-03:   0%|          | 734/300001 [12:16:00<5692:05:20, 68.47s/it]training loss: 7.611e-03:   0%|          | 735/300001 [12:17:04<5578:24:33, 67.11s/it]training loss: 7.611e-03:   0%|          | 736/300001 [12:18:16<5699:26:42, 68.56s/it]training loss: 7.611e-03:   0%|          | 737/300001 [12:19:34<5944:24:48, 71.51s/it]training loss: 7.611e-03:   0%|          | 738/300001 [12:20:46<5943:11:05, 71.49s/it]training loss: 7.611e-03:   0%|          | 739/300001 [12:21:33<5337:40:27, 64.21s/it]training loss: 7.611e-03:   0%|          | 740/300001 [12:22:20<4920:07:28, 59.19s/it]training loss: 7.225e-03:   0%|          | 740/300001 [12:23:17<4920:07:28, 59.19s/it]training loss: 7.225e-03:   0%|          | 741/300001 [12:23:17<4853:40:19, 58.39s/it]training loss: 7.225e-03:   0%|          | 742/300001 [12:24:21<5000:49:04, 60.16s/it]training loss: 7.225e-03:   0%|          | 743/300001 [12:25:16<4859:23:04, 58.46s/it]training loss: 7.225e-03:   0%|          | 744/300001 [12:26:03<4579:53:05, 55.10s/it]training loss: 7.225e-03:   0%|          | 745/300001 [12:27:11<4894:55:30, 58.89s/it]training loss: 7.225e-03:   0%|          | 746/300001 [12:28:22<5204:21:02, 62.61s/it]training loss: 7.225e-03:   0%|          | 747/300001 [12:29:24<5188:56:09, 62.42s/it]training loss: 7.225e-03:   0%|          | 748/300001 [12:30:47<5705:12:30, 68.63s/it]training loss: 7.225e-03:   0%|          | 749/300001 [12:31:39<5297:59:56, 63.73s/it]training loss: 7.225e-03:   0%|          | 750/300001 [12:32:40<5230:10:02, 62.92s/it]training loss: 7.225e-03:   0%|          | 751/300001 [12:33:34<4993:48:36, 60.08s/it]training loss: 7.225e-03:   0%|          | 752/300001 [12:34:47<5315:31:54, 63.95s/it]training loss: 7.225e-03:   0%|          | 753/300001 [12:35:50<5293:30:19, 63.68s/it]training loss: 7.225e-03:   0%|          | 754/300001 [12:36:53<5293:33:44, 63.68s/it]training loss: 7.225e-03:   0%|          | 755/300001 [12:37:46<5019:25:19, 60.38s/it]training loss: 7.225e-03:   0%|          | 756/300001 [12:38:59<5330:51:31, 64.13s/it]training loss: 7.225e-03:   0%|          | 757/300001 [12:40:17<5669:31:17, 68.21s/it]training loss: 7.225e-03:   0%|          | 758/300001 [12:41:03<5124:17:42, 61.65s/it]training loss: 7.225e-03:   0%|          | 759/300001 [12:41:53<4826:42:37, 58.07s/it]training loss: 7.225e-03:   0%|          | 760/300001 [12:42:55<4923:28:40, 59.23s/it]training loss: 6.461e-03:   0%|          | 760/300001 [12:44:04<4923:28:40, 59.23s/it]training loss: 6.461e-03:   0%|          | 761/300001 [12:44:04<5166:48:13, 62.16s/it]training loss: 6.461e-03:   0%|          | 762/300001 [12:45:23<5587:31:42, 67.22s/it]training loss: 6.461e-03:   0%|          | 763/300001 [12:46:52<6137:07:42, 73.83s/it]training loss: 6.461e-03:   0%|          | 764/300001 [12:48:10<6251:18:49, 75.21s/it]training loss: 6.461e-03:   0%|          | 765/300001 [12:49:10<5852:31:36, 70.41s/it]training loss: 6.461e-03:   0%|          | 766/300001 [12:50:24<5944:34:00, 71.52s/it]training loss: 6.461e-03:   0%|          | 767/300001 [12:51:43<6149:55:52, 73.99s/it]training loss: 6.461e-03:   0%|          | 768/300001 [12:52:58<6163:56:14, 74.16s/it]training loss: 6.461e-03:   0%|          | 769/300001 [12:53:48<5566:07:32, 66.96s/it]training loss: 6.461e-03:   0%|          | 770/300001 [12:54:36<5087:56:20, 61.21s/it]training loss: 6.461e-03:   0%|          | 771/300001 [12:55:36<5062:33:03, 60.91s/it]training loss: 6.461e-03:   0%|          | 772/300001 [12:56:33<4955:58:38, 59.62s/it]training loss: 6.461e-03:   0%|          | 773/300001 [12:57:20<4644:23:43, 55.88s/it]training loss: 6.461e-03:   0%|          | 774/300001 [12:58:10<4505:19:02, 54.20s/it]training loss: 6.461e-03:   0%|          | 775/300001 [12:58:56<4291:34:20, 51.63s/it]training loss: 6.461e-03:   0%|          | 776/300001 [12:59:42<4146:08:13, 49.88s/it]training loss: 6.461e-03:   0%|          | 777/300001 [13:00:41<4382:56:43, 52.73s/it]training loss: 6.461e-03:   0%|          | 778/300001 [13:01:30<4300:37:41, 51.74s/it]training loss: 6.461e-03:   0%|          | 779/300001 [13:02:35<4629:54:16, 55.70s/it]training loss: 6.461e-03:   0%|          | 780/300001 [13:03:47<5034:56:37, 60.58s/it]training loss: 6.563e-03:   0%|          | 780/300001 [13:04:49<5034:56:37, 60.58s/it]training loss: 6.563e-03:   0%|          | 781/300001 [13:04:49<5063:36:04, 60.92s/it]training loss: 6.563e-03:   0%|          | 782/300001 [13:05:44<4924:18:11, 59.25s/it]training loss: 6.563e-03:   0%|          | 783/300001 [13:06:31<4604:23:02, 55.40s/it]training loss: 6.563e-03:   0%|          | 784/300001 [13:07:15<4331:09:19, 52.11s/it]training loss: 6.563e-03:   0%|          | 785/300001 [13:08:05<4276:39:58, 51.45s/it]training loss: 6.563e-03:   0%|          | 786/300001 [13:09:19<4839:45:15, 58.23s/it]training loss: 6.563e-03:   0%|          | 787/300001 [13:10:55<5780:14:27, 69.55s/it]training loss: 6.563e-03:   0%|          | 788/300001 [13:12:48<6855:14:42, 82.48s/it]training loss: 6.563e-03:   0%|          | 789/300001 [13:13:55<6479:23:54, 77.96s/it]training loss: 6.563e-03:   0%|          | 790/300001 [13:15:16<6558:06:51, 78.90s/it]training loss: 6.563e-03:   0%|          | 791/300001 [13:16:13<5995:15:28, 72.13s/it]training loss: 6.563e-03:   0%|          | 792/300001 [13:17:16<5786:21:13, 69.62s/it]training loss: 6.563e-03:   0%|          | 793/300001 [13:18:28<5838:23:49, 70.25s/it]training loss: 6.563e-03:   0%|          | 794/300001 [13:20:14<6714:13:07, 80.78s/it]training loss: 6.563e-03:   0%|          | 795/300001 [13:21:03<5941:33:13, 71.49s/it]training loss: 6.563e-03:   0%|          | 796/300001 [13:21:48<5264:29:19, 63.34s/it]training loss: 6.563e-03:   0%|          | 797/300001 [13:22:29<4709:52:48, 56.67s/it]training loss: 6.563e-03:   0%|          | 798/300001 [13:23:25<4688:06:42, 56.41s/it]training loss: 6.563e-03:   0%|          | 799/300001 [13:24:36<5057:17:57, 60.85s/it]training loss: 6.563e-03:   0%|          | 800/300001 [13:25:30<4901:21:49, 58.97s/it]training loss: 7.561e-03:   0%|          | 800/300001 [13:26:29<4901:21:49, 58.97s/it]training loss: 7.561e-03:   0%|          | 801/300001 [13:26:29<4895:33:42, 58.90s/it]training loss: 7.561e-03:   0%|          | 802/300001 [13:27:13<4513:11:57, 54.30s/it]training loss: 7.561e-03:   0%|          | 803/300001 [13:27:56<4248:12:07, 51.12s/it]training loss: 7.561e-03:   0%|          | 804/300001 [13:28:38<4018:57:47, 48.36s/it]training loss: 7.561e-03:   0%|          | 805/300001 [13:29:22<3895:36:21, 46.87s/it]training loss: 7.561e-03:   0%|          | 806/300001 [13:30:07<3861:48:01, 46.47s/it]training loss: 7.561e-03:   0%|          | 807/300001 [13:30:49<3737:32:50, 44.97s/it]training loss: 7.561e-03:   0%|          | 808/300001 [13:31:33<3726:11:25, 44.83s/it]training loss: 7.561e-03:   0%|          | 809/300001 [13:32:16<3686:19:50, 44.36s/it]training loss: 7.561e-03:   0%|          | 810/300001 [13:33:36<4557:35:55, 54.84s/it]training loss: 7.561e-03:   0%|          | 811/300001 [13:34:26<4444:25:01, 53.48s/it]training loss: 7.561e-03:   0%|          | 812/300001 [13:35:27<4640:05:36, 55.83s/it]training loss: 7.561e-03:   0%|          | 813/300001 [13:36:11<4323:55:59, 52.03s/it]training loss: 7.561e-03:   0%|          | 814/300001 [13:36:54<4101:17:30, 49.35s/it]training loss: 7.561e-03:   0%|          | 815/300001 [13:37:48<4229:14:42, 50.89s/it]training loss: 7.561e-03:   0%|          | 816/300001 [13:38:30<4001:40:39, 48.15s/it]training loss: 7.561e-03:   0%|          | 817/300001 [13:39:13<3883:41:24, 46.73s/it]training loss: 7.561e-03:   0%|          | 818/300001 [13:39:56<3793:16:10, 45.64s/it]training loss: 7.561e-03:   0%|          | 819/300001 [13:40:41<3755:54:31, 45.19s/it]training loss: 7.561e-03:   0%|          | 820/300001 [13:41:22<3651:51:59, 43.94s/it]training loss: 8.347e-03:   0%|          | 820/300001 [13:42:16<3651:51:59, 43.94s/it]training loss: 8.347e-03:   0%|          | 821/300001 [13:42:16<3905:56:10, 47.00s/it]training loss: 8.347e-03:   0%|          | 822/300001 [13:43:05<3962:07:52, 47.68s/it]training loss: 8.347e-03:   0%|          | 823/300001 [13:43:47<3810:43:54, 45.85s/it]training loss: 8.347e-03:   0%|          | 824/300001 [13:44:34<3860:00:58, 46.45s/it]training loss: 8.347e-03:   0%|          | 825/300001 [13:45:49<4570:59:58, 55.00s/it]training loss: 8.347e-03:   0%|          | 826/300001 [13:46:43<4547:24:18, 54.72s/it]training loss: 8.347e-03:   0%|          | 827/300001 [13:47:27<4263:18:47, 51.30s/it]training loss: 8.347e-03:   0%|          | 828/300001 [13:48:54<5169:32:00, 62.21s/it]training loss: 8.347e-03:   0%|          | 829/300001 [13:50:18<5714:16:15, 68.76s/it]training loss: 8.347e-03:   0%|          | 830/300001 [13:51:06<5188:24:51, 62.43s/it]training loss: 8.347e-03:   0%|          | 831/300001 [13:51:59<4953:51:43, 59.61s/it]training loss: 8.347e-03:   0%|          | 832/300001 [13:52:51<4747:50:25, 57.13s/it]training loss: 8.347e-03:   0%|          | 833/300001 [13:54:30<5792:07:30, 69.70s/it]training loss: 8.347e-03:   0%|          | 834/300001 [13:55:17<5226:04:27, 62.89s/it]training loss: 8.347e-03:   0%|          | 835/300001 [13:56:04<4840:09:19, 58.24s/it]training loss: 8.347e-03:   0%|          | 836/300001 [13:57:18<5230:38:14, 62.94s/it]training loss: 8.347e-03:   0%|          | 837/300001 [13:58:33<5545:25:20, 66.73s/it]training loss: 8.347e-03:   0%|          | 838/300001 [13:59:20<5047:44:21, 60.74s/it]training loss: 8.347e-03:   0%|          | 839/300001 [14:00:07<4704:46:58, 56.62s/it]training loss: 8.347e-03:   0%|          | 840/300001 [14:01:31<5388:06:28, 64.84s/it]training loss: 9.889e-03:   0%|          | 840/300001 [14:02:47<5388:06:28, 64.84s/it]training loss: 9.889e-03:   0%|          | 841/300001 [14:02:47<5673:59:50, 68.28s/it]training loss: 9.889e-03:   0%|          | 842/300001 [14:03:34<5124:18:19, 61.66s/it]training loss: 9.889e-03:   0%|          | 843/300001 [14:04:29<4957:03:22, 59.65s/it]training loss: 9.889e-03:   0%|          | 844/300001 [14:05:57<5673:31:42, 68.27s/it]training loss: 9.889e-03:   0%|          | 845/300001 [14:07:12<5851:25:13, 70.42s/it]training loss: 9.889e-03:   0%|          | 846/300001 [14:08:08<5491:02:41, 66.08s/it]training loss: 9.889e-03:   0%|          | 847/300001 [14:09:08<5336:13:13, 64.22s/it]training loss: 9.889e-03:   0%|          | 848/300001 [14:10:13<5357:21:11, 64.47s/it]training loss: 9.889e-03:   0%|          | 849/300001 [14:11:20<5403:34:23, 65.03s/it]training loss: 9.889e-03:   0%|          | 850/300001 [14:12:33<5612:19:59, 67.54s/it]training loss: 9.889e-03:   0%|          | 851/300001 [14:13:18<5047:00:38, 60.74s/it]training loss: 9.889e-03:   0%|          | 852/300001 [14:14:09<4794:53:32, 57.70s/it]training loss: 9.889e-03:   0%|          | 853/300001 [14:15:34<5483:39:54, 65.99s/it]training loss: 9.889e-03:   0%|          | 854/300001 [14:17:19<6469:09:25, 77.85s/it]training loss: 9.889e-03:   0%|          | 855/300001 [14:18:35<6418:20:30, 77.24s/it]training loss: 9.889e-03:   0%|          | 856/300001 [14:19:32<5895:54:04, 70.95s/it]training loss: 9.889e-03:   0%|          | 857/300001 [14:20:31<5613:55:26, 67.56s/it]training loss: 9.889e-03:   0%|          | 858/300001 [14:21:42<5690:10:18, 68.48s/it]training loss: 9.889e-03:   0%|          | 859/300001 [14:22:27<5103:11:26, 61.41s/it]training loss: 9.889e-03:   0%|          | 860/300001 [14:23:22<4958:21:26, 59.67s/it]training loss: 7.202e-03:   0%|          | 860/300001 [14:24:50<4958:21:26, 59.67s/it]training loss: 7.202e-03:   0%|          | 861/300001 [14:24:50<5646:41:27, 67.96s/it]training loss: 7.202e-03:   0%|          | 862/300001 [14:26:05<5834:03:39, 70.21s/it]training loss: 7.202e-03:   0%|          | 863/300001 [14:27:20<5946:22:19, 71.56s/it]training loss: 7.202e-03:   0%|          | 864/300001 [14:28:13<5500:19:45, 66.19s/it]training loss: 7.202e-03:   0%|          | 865/300001 [14:29:12<5311:10:08, 63.92s/it]training loss: 7.202e-03:   0%|          | 866/300001 [14:30:41<5927:28:53, 71.34s/it]training loss: 7.202e-03:   0%|          | 867/300001 [14:31:41<5639:57:28, 67.88s/it]training loss: 7.202e-03:   0%|          | 868/300001 [14:32:38<5386:18:55, 64.82s/it]training loss: 7.202e-03:   0%|          | 869/300001 [14:33:29<5041:50:10, 60.68s/it]training loss: 7.202e-03:   0%|          | 870/300001 [14:34:18<4757:03:06, 57.25s/it]training loss: 7.202e-03:   0%|          | 871/300001 [14:35:04<4472:51:42, 53.83s/it]training loss: 7.202e-03:   0%|          | 872/300001 [14:36:06<4668:03:25, 56.18s/it]training loss: 7.202e-03:   0%|          | 873/300001 [14:37:20<5124:01:20, 61.67s/it]training loss: 7.202e-03:   0%|          | 874/300001 [14:39:21<6584:05:03, 79.24s/it]training loss: 7.202e-03:   0%|          | 875/300001 [14:40:41<6613:39:53, 79.60s/it]training loss: 7.202e-03:   0%|          | 876/300001 [14:41:40<6103:30:39, 73.46s/it]training loss: 7.202e-03:   0%|          | 877/300001 [14:42:53<6073:20:07, 73.09s/it]training loss: 7.202e-03:   0%|          | 878/300001 [14:43:49<5651:48:36, 68.02s/it]training loss: 7.202e-03:   0%|          | 879/300001 [14:45:11<6007:41:44, 72.30s/it]training loss: 7.202e-03:   0%|          | 880/300001 [14:46:04<5523:12:44, 66.47s/it]training loss: 6.681e-03:   0%|          | 880/300001 [14:47:10<5523:12:44, 66.47s/it]training loss: 6.681e-03:   0%|          | 881/300001 [14:47:10<5517:19:12, 66.40s/it]training loss: 6.681e-03:   0%|          | 882/300001 [14:48:37<6030:36:43, 72.58s/it]training loss: 6.681e-03:   0%|          | 883/300001 [14:49:50<6028:50:42, 72.56s/it]training loss: 6.681e-03:   0%|          | 884/300001 [14:50:54<5837:14:29, 70.25s/it]training loss: 6.681e-03:   0%|          | 885/300001 [14:52:20<6210:09:08, 74.74s/it]training loss: 6.681e-03:   0%|          | 886/300001 [14:53:18<5796:31:03, 69.76s/it]training loss: 6.681e-03:   0%|          | 887/300001 [14:54:04<5208:57:29, 62.69s/it]training loss: 6.681e-03:   0%|          | 888/300001 [14:54:50<4788:04:39, 57.63s/it]training loss: 6.681e-03:   0%|          | 889/300001 [14:55:35<4472:06:14, 53.82s/it]training loss: 6.681e-03:   0%|          | 890/300001 [14:56:18<4217:10:00, 50.76s/it]training loss: 6.681e-03:   0%|          | 891/300001 [14:57:24<4597:57:15, 55.34s/it]training loss: 6.681e-03:   0%|          | 892/300001 [14:58:17<4533:54:54, 54.57s/it]training loss: 6.681e-03:   0%|          | 893/300001 [14:59:23<4818:13:34, 57.99s/it]training loss: 6.681e-03:   0%|          | 894/300001 [15:00:14<4642:05:33, 55.87s/it]training loss: 6.681e-03:   0%|          | 895/300001 [15:01:27<5060:13:54, 60.90s/it]training loss: 6.681e-03:   0%|          | 896/300001 [15:02:58<5822:53:17, 70.08s/it]training loss: 6.681e-03:   0%|          | 897/300001 [15:04:04<5714:25:38, 68.78s/it]training loss: 6.681e-03:   0%|          | 898/300001 [15:04:55<5269:22:47, 63.42s/it]training loss: 6.681e-03:   0%|          | 899/300001 [15:05:42<4859:04:00, 58.48s/it]training loss: 6.681e-03:   0%|          | 900/300001 [15:06:30<4593:42:32, 55.29s/it]training loss: 6.935e-03:   0%|          | 900/300001 [15:07:37<4593:42:32, 55.29s/it]training loss: 6.935e-03:   0%|          | 901/300001 [15:07:37<4900:48:05, 58.99s/it]training loss: 6.935e-03:   0%|          | 902/300001 [15:08:35<4857:36:30, 58.47s/it]training loss: 6.935e-03:   0%|          | 903/300001 [15:09:25<4655:07:15, 56.03s/it]training loss: 6.935e-03:   0%|          | 904/300001 [15:10:21<4657:19:28, 56.06s/it]training loss: 6.935e-03:   0%|          | 905/300001 [15:11:53<5560:41:32, 66.93s/it]training loss: 6.935e-03:   0%|          | 906/300001 [15:12:58<5511:07:31, 66.33s/it]training loss: 6.935e-03:   0%|          | 907/300001 [15:14:02<5455:39:53, 65.67s/it]training loss: 6.935e-03:   0%|          | 908/300001 [15:15:08<5466:07:44, 65.79s/it]training loss: 6.935e-03:   0%|          | 909/300001 [15:16:40<6097:29:04, 73.39s/it]training loss: 6.935e-03:   0%|          | 910/300001 [15:18:07<6446:17:07, 77.59s/it]training loss: 6.935e-03:   0%|          | 911/300001 [15:18:57<5746:48:16, 69.17s/it]training loss: 6.935e-03:   0%|          | 912/300001 [15:21:05<7236:48:27, 87.11s/it]training loss: 6.935e-03:   0%|          | 913/300001 [15:22:39<7408:24:53, 89.17s/it]training loss: 6.935e-03:   0%|          | 914/300001 [15:23:28<6396:11:21, 76.99s/it]training loss: 6.935e-03:   0%|          | 915/300001 [15:24:19<5744:36:10, 69.15s/it]training loss: 6.935e-03:   0%|          | 916/300001 [15:25:13<5368:17:44, 64.62s/it]training loss: 6.935e-03:   0%|          | 917/300001 [15:26:14<5270:06:45, 63.44s/it]training loss: 6.935e-03:   0%|          | 918/300001 [15:27:21<5375:00:22, 64.70s/it]training loss: 6.935e-03:   0%|          | 919/300001 [15:28:27<5409:02:03, 65.11s/it]training loss: 6.935e-03:   0%|          | 920/300001 [15:30:20<6590:31:22, 79.33s/it]training loss: 6.445e-03:   0%|          | 920/300001 [15:31:08<6590:31:22, 79.33s/it]training loss: 6.445e-03:   0%|          | 921/300001 [15:31:08<5825:36:54, 70.12s/it]training loss: 6.445e-03:   0%|          | 922/300001 [15:32:09<5582:30:39, 67.20s/it]training loss: 6.445e-03:   0%|          | 923/300001 [15:33:01<5201:58:45, 62.62s/it]training loss: 6.445e-03:   0%|          | 924/300001 [15:34:02<5177:59:39, 62.33s/it]training loss: 6.445e-03:   0%|          | 925/300001 [15:35:31<5822:07:49, 70.08s/it]training loss: 6.445e-03:   0%|          | 926/300001 [15:36:18<5248:06:07, 63.17s/it]training loss: 6.445e-03:   0%|          | 927/300001 [15:37:08<4929:19:59, 59.34s/it]training loss: 6.445e-03:   0%|          | 928/300001 [15:38:14<5091:54:55, 61.29s/it]training loss: 6.445e-03:   0%|          | 929/300001 [15:39:29<5431:57:25, 65.39s/it]training loss: 6.445e-03:   0%|          | 930/300001 [15:40:27<5252:18:09, 63.22s/it]training loss: 6.445e-03:   0%|          | 931/300001 [15:41:20<4998:04:21, 60.16s/it]training loss: 6.445e-03:   0%|          | 932/300001 [15:42:17<4919:51:39, 59.22s/it]training loss: 6.445e-03:   0%|          | 933/300001 [15:43:26<5172:45:20, 62.27s/it]training loss: 6.445e-03:   0%|          | 934/300001 [15:44:37<5371:56:20, 64.66s/it]training loss: 6.445e-03:   0%|          | 935/300001 [15:45:34<5195:05:39, 62.54s/it]training loss: 6.445e-03:   0%|          | 936/300001 [15:47:51<7037:58:11, 84.72s/it]training loss: 6.445e-03:   0%|          | 937/300001 [15:49:38<7595:47:21, 91.43s/it]training loss: 6.445e-03:   0%|          | 938/300001 [15:50:53<7180:14:12, 86.43s/it]training loss: 6.445e-03:   0%|          | 939/300001 [15:52:13<7038:34:02, 84.73s/it]training loss: 6.445e-03:   0%|          | 940/300001 [15:53:49<7301:55:12, 87.90s/it]training loss: 7.748e-03:   0%|          | 940/300001 [15:55:37<7301:55:12, 87.90s/it]training loss: 7.748e-03:   0%|          | 941/300001 [15:55:37<7804:27:58, 93.95s/it]training loss: 7.748e-03:   0%|          | 942/300001 [15:56:33<6862:58:44, 82.61s/it]training loss: 7.748e-03:   0%|          | 943/300001 [15:58:35<7844:34:14, 94.43s/it]training loss: 7.748e-03:   0%|          | 944/300001 [16:00:13<7927:30:19, 95.43s/it]training loss: 7.748e-03:   0%|          | 945/300001 [16:02:10<8478:03:57, 102.06s/it]training loss: 7.748e-03:   0%|          | 946/300001 [16:03:45<8304:59:28, 99.97s/it] training loss: 7.748e-03:   0%|          | 947/300001 [16:04:34<7037:02:37, 84.71s/it]training loss: 7.748e-03:   0%|          | 948/300001 [16:06:04<7166:27:26, 86.27s/it]training loss: 7.748e-03:   0%|          | 949/300001 [16:07:30<7158:07:08, 86.17s/it]training loss: 7.748e-03:   0%|          | 950/300001 [16:08:21<6265:50:59, 75.43s/it]training loss: 7.748e-03:   0%|          | 951/300001 [16:09:56<6753:29:41, 81.30s/it]training loss: 7.748e-03:   0%|          | 952/300001 [16:10:53<6163:56:40, 74.20s/it]training loss: 7.748e-03:   0%|          | 953/300001 [16:12:33<6800:24:13, 81.86s/it]training loss: 7.748e-03:   0%|          | 954/300001 [16:13:41<6449:26:54, 77.64s/it]training loss: 7.748e-03:   0%|          | 955/300001 [16:15:38<7438:12:10, 89.54s/it]training loss: 7.748e-03:   0%|          | 956/300001 [16:17:02<7305:41:34, 87.95s/it]training loss: 7.748e-03:   0%|          | 957/300001 [16:17:56<6464:24:10, 77.82s/it]training loss: 7.748e-03:   0%|          | 958/300001 [16:19:24<6710:12:40, 80.78s/it]training loss: 7.748e-03:   0%|          | 959/300001 [16:20:22<6131:01:38, 73.81s/it]training loss: 7.748e-03:   0%|          | 960/300001 [16:21:41<6266:36:22, 75.44s/it]training loss: 6.207e-03:   0%|          | 960/300001 [16:23:31<6266:36:22, 75.44s/it]training loss: 6.207e-03:   0%|          | 961/300001 [16:23:31<7132:41:53, 85.87s/it]training loss: 6.207e-03:   0%|          | 962/300001 [16:24:24<6298:45:17, 75.83s/it]training loss: 6.207e-03:   0%|          | 963/300001 [16:25:24<5907:33:39, 71.12s/it]training loss: 6.207e-03:   0%|          | 964/300001 [16:26:30<5799:35:07, 69.82s/it]training loss: 6.207e-03:   0%|          | 965/300001 [16:28:11<6565:12:28, 79.04s/it]training loss: 6.207e-03:   0%|          | 966/300001 [16:29:08<6005:41:04, 72.30s/it]training loss: 6.207e-03:   0%|          | 967/300001 [16:30:16<5904:50:37, 71.09s/it]training loss: 6.207e-03:   0%|          | 968/300001 [16:31:51<6494:11:33, 78.18s/it]training loss: 6.207e-03:   0%|          | 969/300001 [16:32:56<6169:28:57, 74.27s/it]training loss: 6.207e-03:   0%|          | 970/300001 [16:33:46<5581:25:05, 67.19s/it]training loss: 6.207e-03:   0%|          | 971/300001 [16:34:33<5067:24:53, 61.01s/it]training loss: 6.207e-03:   0%|          | 972/300001 [16:35:36<5113:47:38, 61.56s/it]training loss: 6.207e-03:   0%|          | 973/300001 [16:36:48<5379:53:14, 64.77s/it]training loss: 6.207e-03:   0%|          | 974/300001 [16:38:05<5681:15:23, 68.40s/it]training loss: 6.207e-03:   0%|          | 975/300001 [16:38:49<5075:02:30, 61.10s/it]training loss: 6.207e-03:   0%|          | 976/300001 [16:39:38<4773:23:27, 57.47s/it]training loss: 6.207e-03:   0%|          | 977/300001 [16:40:25<4513:38:43, 54.34s/it]training loss: 6.207e-03:   0%|          | 978/300001 [16:41:24<4622:09:58, 55.65s/it]training loss: 6.207e-03:   0%|          | 979/300001 [16:42:43<5217:25:02, 62.81s/it]training loss: 6.207e-03:   0%|          | 980/300001 [16:43:24<4677:03:56, 56.31s/it]training loss: 6.293e-03:   0%|          | 980/300001 [16:44:09<4677:03:56, 56.31s/it]training loss: 6.293e-03:   0%|          | 981/300001 [16:44:09<4383:40:22, 52.78s/it]training loss: 6.293e-03:   0%|          | 982/300001 [16:44:58<4283:20:26, 51.57s/it]training loss: 6.293e-03:   0%|          | 983/300001 [16:45:44<4143:12:21, 49.88s/it]training loss: 6.293e-03:   0%|          | 984/300001 [16:46:38<4257:31:00, 51.26s/it]training loss: 6.293e-03:   0%|          | 985/300001 [16:47:38<4484:20:37, 53.99s/it]training loss: 6.293e-03:   0%|          | 986/300001 [16:48:20<4182:52:39, 50.36s/it]training loss: 6.293e-03:   0%|          | 987/300001 [16:49:07<4089:33:49, 49.24s/it]training loss: 6.293e-03:   0%|          | 988/300001 [16:49:51<3947:02:23, 47.52s/it]training loss: 6.293e-03:   0%|          | 989/300001 [16:50:36<3890:25:49, 46.84s/it]training loss: 6.293e-03:   0%|          | 990/300001 [16:51:19<3793:17:24, 45.67s/it]training loss: 6.293e-03:   0%|          | 991/300001 [16:52:14<4039:27:05, 48.63s/it]training loss: 6.293e-03:   0%|          | 992/300001 [16:52:56<3871:56:27, 46.62s/it]training loss: 6.293e-03:   0%|          | 993/300001 [16:53:42<3846:58:33, 46.32s/it]training loss: 6.293e-03:   0%|          | 994/300001 [16:54:38<4091:17:05, 49.26s/it]training loss: 6.293e-03:   0%|          | 995/300001 [16:55:33<4226:56:03, 50.89s/it]training loss: 6.293e-03:   0%|          | 996/300001 [16:56:40<4641:35:16, 55.88s/it]training loss: 6.293e-03:   0%|          | 997/300001 [16:57:38<4678:38:31, 56.33s/it]training loss: 6.293e-03:   0%|          | 998/300001 [16:58:44<4933:03:02, 59.39s/it]training loss: 6.293e-03:   0%|          | 999/300001 [16:59:39<4814:16:50, 57.96s/it]training loss: 6.293e-03:   0%|          | 1000/300001 [17:00:38<4852:09:39, 58.42s/it]training loss: 6.783e-03:   0%|          | 1000/300001 [17:01:27<4852:09:39, 58.42s/it]training loss: 6.783e-03:   0%|          | 1001/300001 [17:01:38<4894:58:48, 58.94s/it]training loss: 6.783e-03:   0%|          | 1002/300001 [17:02:51<5244:25:27, 63.14s/it]training loss: 6.783e-03:   0%|          | 1003/300001 [17:03:42<4945:32:26, 59.55s/it]training loss: 6.783e-03:   0%|          | 1004/300001 [17:04:58<5344:01:02, 64.34s/it]training loss: 6.783e-03:   0%|          | 1005/300001 [17:05:53<5106:06:24, 61.48s/it]training loss: 6.783e-03:   0%|          | 1006/300001 [17:07:16<5647:44:52, 68.00s/it]training loss: 6.783e-03:   0%|          | 1007/300001 [17:08:24<5643:19:45, 67.95s/it]training loss: 6.783e-03:   0%|          | 1008/300001 [17:09:48<6043:06:39, 72.76s/it]training loss: 6.783e-03:   0%|          | 1009/300001 [17:10:59<6000:10:50, 72.24s/it]training loss: 6.783e-03:   0%|          | 1010/300001 [17:11:55<5597:31:16, 67.40s/it]training loss: 6.783e-03:   0%|          | 1011/300001 [17:13:06<5676:48:21, 68.35s/it]training loss: 6.783e-03:   0%|          | 1012/300001 [17:13:50<5072:11:48, 61.07s/it]training loss: 6.783e-03:   0%|          | 1013/300001 [17:14:32<4617:42:04, 55.60s/it]training loss: 6.783e-03:   0%|          | 1014/300001 [17:15:39<4889:46:29, 58.88s/it]training loss: 6.783e-03:   0%|          | 1015/300001 [17:17:00<5452:03:25, 65.65s/it]training loss: 6.783e-03:   0%|          | 1016/300001 [17:17:46<4956:20:26, 59.68s/it]training loss: 6.783e-03:   0%|          | 1017/300001 [17:18:32<4619:57:01, 55.63s/it]training loss: 6.783e-03:   0%|          | 1018/300001 [17:19:48<5110:40:57, 61.54s/it]training loss: 6.783e-03:   0%|          | 1019/300001 [17:20:37<4804:41:15, 57.85s/it]training loss: 6.783e-03:   0%|          | 1020/300001 [17:21:34<4790:20:03, 57.68s/it]training loss: 7.805e-03:   0%|          | 1020/300001 [17:22:23<4790:20:03, 57.68s/it]training loss: 7.805e-03:   0%|          | 1021/300001 [17:22:23<4565:32:27, 54.97s/it]training loss: 7.805e-03:   0%|          | 1022/300001 [17:23:12<4412:56:15, 53.14s/it]training loss: 7.805e-03:   0%|          | 1023/300001 [17:24:15<4667:01:51, 56.20s/it]training loss: 7.805e-03:   0%|          | 1024/300001 [17:25:33<5213:39:20, 62.78s/it]training loss: 7.805e-03:   0%|          | 1025/300001 [17:26:32<5119:11:51, 61.64s/it]training loss: 7.805e-03:   0%|          | 1026/300001 [17:27:50<5526:02:37, 66.54s/it]training loss: 7.805e-03:   0%|          | 1027/300001 [17:29:00<5614:47:50, 67.61s/it]training loss: 7.805e-03:   0%|          | 1028/300001 [17:30:09<5651:31:09, 68.05s/it]training loss: 7.805e-03:   0%|          | 1029/300001 [17:31:33<6031:39:03, 72.63s/it]training loss: 7.805e-03:   0%|          | 1030/300001 [17:32:21<5425:19:49, 65.33s/it]training loss: 7.805e-03:   0%|          | 1031/300001 [17:33:21<5285:35:37, 63.65s/it]training loss: 7.805e-03:   0%|          | 1032/300001 [17:34:35<5553:16:31, 66.87s/it]training loss: 7.805e-03:   0%|          | 1033/300001 [17:35:51<5792:33:42, 69.75s/it]training loss: 7.805e-03:   0%|          | 1034/300001 [17:37:13<6087:18:19, 73.30s/it]training loss: 7.805e-03:   0%|          | 1035/300001 [17:38:01<5450:44:39, 65.64s/it]training loss: 7.805e-03:   0%|          | 1036/300001 [17:38:48<5003:00:26, 60.24s/it]training loss: 7.805e-03:   0%|          | 1037/300001 [17:39:38<4747:07:29, 57.16s/it]training loss: 7.805e-03:   0%|          | 1038/300001 [17:41:10<5601:43:23, 67.45s/it]training loss: 7.805e-03:   0%|          | 1039/300001 [17:41:57<5099:25:03, 61.41s/it]training loss: 7.805e-03:   0%|          | 1040/300001 [17:42:45<4747:59:29, 57.17s/it]training loss: 6.563e-03:   0%|          | 1040/300001 [17:43:39<4747:59:29, 57.17s/it]training loss: 6.563e-03:   0%|          | 1041/300001 [17:43:39<4677:37:52, 56.33s/it]training loss: 6.563e-03:   0%|          | 1042/300001 [17:44:22<4347:51:18, 52.36s/it]training loss: 6.563e-03:   0%|          | 1043/300001 [17:45:30<4744:04:03, 57.13s/it]training loss: 6.563e-03:   0%|          | 1044/300001 [17:46:19<4528:15:08, 54.53s/it]training loss: 6.563e-03:   0%|          | 1045/300001 [17:47:05<4334:51:53, 52.20s/it]training loss: 6.563e-03:   0%|          | 1046/300001 [17:47:56<4282:40:48, 51.57s/it]training loss: 6.563e-03:   0%|          | 1047/300001 [17:48:44<4194:03:21, 50.50s/it]training loss: 6.563e-03:   0%|          | 1048/300001 [17:49:30<4086:13:31, 49.21s/it]training loss: 6.563e-03:   0%|          | 1049/300001 [17:50:17<4032:28:51, 48.56s/it]training loss: 6.563e-03:   0%|          | 1050/300001 [17:51:27<4564:13:21, 54.96s/it]training loss: 6.563e-03:   0%|          | 1051/300001 [17:52:53<5352:43:11, 64.46s/it]training loss: 6.563e-03:   0%|          | 1052/300001 [17:53:36<4805:11:47, 57.87s/it]training loss: 6.563e-03:   0%|          | 1053/300001 [17:54:32<4773:01:51, 57.48s/it]training loss: 6.563e-03:   0%|          | 1054/300001 [17:55:48<5214:41:34, 62.80s/it]training loss: 6.563e-03:   0%|          | 1055/300001 [17:56:32<4764:54:36, 57.38s/it]training loss: 6.563e-03:   0%|          | 1056/300001 [17:57:33<4855:40:24, 58.47s/it]training loss: 6.563e-03:   0%|          | 1057/300001 [17:58:31<4847:14:56, 58.37s/it]training loss: 6.563e-03:   0%|          | 1058/300001 [17:59:20<4594:07:16, 55.32s/it]training loss: 6.563e-03:   0%|          | 1059/300001 [18:00:35<5087:29:13, 61.27s/it]training loss: 6.563e-03:   0%|          | 1060/300001 [18:02:08<5890:23:25, 70.94s/it]training loss: 6.508e-03:   0%|          | 1060/300001 [18:03:23<5890:23:25, 70.94s/it]training loss: 6.508e-03:   0%|          | 1061/300001 [18:03:23<5991:45:32, 72.16s/it]training loss: 6.508e-03:   0%|          | 1062/300001 [18:04:05<5242:05:37, 63.13s/it]training loss: 6.508e-03:   0%|          | 1063/300001 [18:04:49<4762:08:42, 57.35s/it]training loss: 6.508e-03:   0%|          | 1064/300001 [18:05:35<4463:32:26, 53.75s/it]training loss: 6.508e-03:   0%|          | 1065/300001 [18:06:19<4220:09:41, 50.82s/it]training loss: 6.508e-03:   0%|          | 1066/300001 [18:07:20<4487:52:19, 54.05s/it]training loss: 6.508e-03:   0%|          | 1067/300001 [18:08:06<4284:30:32, 51.60s/it]training loss: 6.508e-03:   0%|          | 1068/300001 [18:08:50<4085:10:48, 49.20s/it]training loss: 6.508e-03:   0%|          | 1069/300001 [18:09:36<4007:07:19, 48.26s/it]training loss: 6.508e-03:   0%|          | 1070/300001 [18:10:23<3994:35:23, 48.11s/it]training loss: 6.508e-03:   0%|          | 1071/300001 [18:11:10<3964:49:34, 47.75s/it]training loss: 6.508e-03:   0%|          | 1072/300001 [18:12:05<4125:42:47, 49.69s/it]training loss: 6.508e-03:   0%|          | 1073/300001 [18:12:51<4046:00:56, 48.73s/it]training loss: 6.508e-03:   0%|          | 1074/300001 [18:13:37<3964:20:36, 47.74s/it]training loss: 6.508e-03:   0%|          | 1075/300001 [18:14:27<4037:54:40, 48.63s/it]training loss: 6.508e-03:   0%|          | 1076/300001 [18:15:14<4000:36:39, 48.18s/it]training loss: 6.508e-03:   0%|          | 1077/300001 [18:16:03<4009:08:40, 48.28s/it]training loss: 6.508e-03:   0%|          | 1078/300001 [18:16:50<3989:34:52, 48.05s/it]training loss: 6.508e-03:   0%|          | 1079/300001 [18:17:42<4082:57:59, 49.17s/it]training loss: 6.508e-03:   0%|          | 1080/300001 [18:19:05<4933:22:00, 59.41s/it]training loss: 5.949e-03:   0%|          | 1080/300001 [18:19:51<4933:22:00, 59.41s/it]training loss: 5.949e-03:   0%|          | 1081/300001 [18:19:51<4591:30:56, 55.30s/it]training loss: 5.949e-03:   0%|          | 1082/300001 [18:20:43<4515:26:46, 54.38s/it]training loss: 5.949e-03:   0%|          | 1083/300001 [18:22:04<5175:24:27, 62.33s/it]training loss: 5.949e-03:   0%|          | 1084/300001 [18:23:06<5163:01:19, 62.18s/it]training loss: 5.949e-03:   0%|          | 1085/300001 [18:24:07<5138:54:59, 61.89s/it]training loss: 5.949e-03:   0%|          | 1086/300001 [18:25:11<5186:38:38, 62.47s/it]training loss: 5.949e-03:   0%|          | 1087/300001 [18:26:04<4941:59:17, 59.52s/it]training loss: 5.949e-03:   0%|          | 1088/300001 [18:27:09<5085:47:34, 61.25s/it]training loss: 5.949e-03:   0%|          | 1089/300001 [18:28:04<4917:28:09, 59.22s/it]training loss: 5.949e-03:   0%|          | 1090/300001 [18:29:11<5122:04:04, 61.69s/it]training loss: 5.949e-03:   0%|          | 1091/300001 [18:29:59<4779:11:31, 57.56s/it]training loss: 5.949e-03:   0%|          | 1092/300001 [18:30:45<4481:24:05, 53.97s/it]training loss: 5.949e-03:   0%|          | 1093/300001 [18:31:30<4269:26:34, 51.42s/it]training loss: 5.949e-03:   0%|          | 1094/300001 [18:32:18<4180:26:12, 50.35s/it]training loss: 5.949e-03:   0%|          | 1095/300001 [18:33:01<4006:53:02, 48.26s/it]training loss: 5.949e-03:   0%|          | 1096/300001 [18:33:47<3944:04:55, 47.50s/it]training loss: 5.949e-03:   0%|          | 1097/300001 [18:34:34<3929:00:53, 47.32s/it]training loss: 5.949e-03:   0%|          | 1098/300001 [18:35:23<3973:14:29, 47.85s/it]training loss: 5.949e-03:   0%|          | 1099/300001 [18:36:09<3919:08:28, 47.20s/it]training loss: 5.949e-03:   0%|          | 1100/300001 [18:37:27<4688:12:30, 56.47s/it]training loss: 6.656e-03:   0%|          | 1100/300001 [18:38:50<4688:12:30, 56.47s/it]training loss: 6.656e-03:   0%|          | 1101/300001 [18:38:50<5346:24:10, 64.39s/it]training loss: 6.656e-03:   0%|          | 1102/300001 [18:40:17<5927:04:44, 71.39s/it]training loss: 6.656e-03:   0%|          | 1103/300001 [18:41:14<5553:36:28, 66.89s/it]training loss: 6.656e-03:   0%|          | 1104/300001 [18:42:09<5265:01:42, 63.41s/it]training loss: 6.656e-03:   0%|          | 1105/300001 [18:43:12<5243:32:47, 63.15s/it]training loss: 6.656e-03:   0%|          | 1106/300001 [18:44:05<4992:54:26, 60.14s/it]training loss: 6.656e-03:   0%|          | 1107/300001 [18:45:11<5159:11:52, 62.14s/it]training loss: 6.656e-03:   0%|          | 1108/300001 [18:46:17<5255:05:06, 63.29s/it]training loss: 6.656e-03:   0%|          | 1109/300001 [18:47:10<4995:26:14, 60.17s/it]training loss: 6.656e-03:   0%|          | 1110/300001 [18:48:28<5430:01:32, 65.40s/it]training loss: 6.656e-03:   0%|          | 1111/300001 [18:49:40<5595:45:19, 67.40s/it]training loss: 6.656e-03:   0%|          | 1112/300001 [18:50:59<5888:20:01, 70.92s/it]training loss: 6.656e-03:   0%|          | 1113/300001 [18:52:04<5724:36:05, 68.95s/it]training loss: 6.656e-03:   0%|          | 1114/300001 [18:53:16<5802:35:39, 69.89s/it]training loss: 6.656e-03:   0%|          | 1115/300001 [18:54:27<5836:20:02, 70.30s/it]training loss: 6.656e-03:   0%|          | 1116/300001 [18:55:40<5904:52:08, 71.12s/it]training loss: 6.656e-03:   0%|          | 1117/300001 [18:57:02<6173:27:02, 74.36s/it]training loss: 6.656e-03:   0%|          | 1118/300001 [18:58:00<5760:03:56, 69.38s/it]training loss: 6.656e-03:   0%|          | 1119/300001 [18:59:14<5876:18:18, 70.78s/it]training loss: 6.656e-03:   0%|          | 1120/300001 [18:59:58<5208:50:06, 62.74s/it]training loss: 6.259e-03:   0%|          | 1120/300001 [19:00:56<5208:50:06, 62.74s/it]training loss: 6.259e-03:   0%|          | 1121/300001 [19:00:57<5128:40:22, 61.77s/it]training loss: 6.259e-03:   0%|          | 1122/300001 [19:01:45<4791:33:22, 57.71s/it]training loss: 6.259e-03:   0%|          | 1123/300001 [19:03:10<5458:32:25, 65.75s/it]training loss: 6.259e-03:   0%|          | 1124/300001 [19:04:45<6197:16:38, 74.65s/it]training loss: 6.259e-03:   0%|          | 1125/300001 [19:05:44<5807:43:29, 69.95s/it]training loss: 6.259e-03:   0%|          | 1126/300001 [19:06:51<5734:33:40, 69.07s/it]training loss: 6.259e-03:   0%|          | 1127/300001 [19:08:22<6265:19:28, 75.47s/it]training loss: 6.259e-03:   0%|          | 1128/300001 [19:09:09<5569:51:41, 67.09s/it]training loss: 6.259e-03:   0%|          | 1129/300001 [19:10:01<5188:35:02, 62.50s/it]training loss: 6.259e-03:   0%|          | 1130/300001 [19:10:56<4996:32:53, 60.19s/it]training loss: 6.259e-03:   0%|          | 1131/300001 [19:11:59<5076:40:44, 61.15s/it]training loss: 6.259e-03:   0%|          | 1132/300001 [19:13:21<5588:09:22, 67.31s/it]training loss: 6.259e-03:   0%|          | 1133/300001 [19:14:23<5458:49:16, 65.75s/it]training loss: 6.259e-03:   0%|          | 1134/300001 [19:15:37<5676:42:50, 68.38s/it]training loss: 6.259e-03:   0%|          | 1135/300001 [19:16:57<5961:27:52, 71.81s/it]training loss: 6.259e-03:   0%|          | 1136/300001 [19:18:34<6589:38:19, 79.38s/it]training loss: 6.259e-03:   0%|          | 1137/300001 [19:19:35<6115:20:25, 73.66s/it]training loss: 6.259e-03:   0%|          | 1138/300001 [19:20:31<5679:40:19, 68.42s/it]training loss: 6.259e-03:   0%|          | 1139/300001 [19:21:22<5238:15:28, 63.10s/it]training loss: 6.259e-03:   0%|          | 1140/300001 [19:22:10<4875:49:37, 58.73s/it]training loss: 6.939e-03:   0%|          | 1140/300001 [19:23:03<4875:49:37, 58.73s/it]training loss: 6.939e-03:   0%|          | 1141/300001 [19:23:03<4732:18:44, 57.00s/it]training loss: 6.939e-03:   0%|          | 1142/300001 [19:24:33<5540:31:50, 66.74s/it]training loss: 6.939e-03:   0%|          | 1143/300001 [19:25:43<5640:45:23, 67.95s/it]training loss: 6.939e-03:   0%|          | 1144/300001 [19:26:31<5142:20:14, 61.94s/it]training loss: 6.939e-03:   0%|          | 1145/300001 [19:27:44<5402:22:48, 65.08s/it]training loss: 6.939e-03:   0%|          | 1146/300001 [19:28:39<5169:25:35, 62.27s/it]training loss: 6.939e-03:   0%|          | 1147/300001 [19:29:40<5117:30:20, 61.65s/it]training loss: 6.939e-03:   0%|          | 1148/300001 [19:30:29<4808:29:26, 57.92s/it]training loss: 6.939e-03:   0%|          | 1149/300001 [19:31:30<4902:57:59, 59.06s/it]training loss: 6.939e-03:   0%|          | 1150/300001 [19:32:15<4529:51:16, 54.57s/it]training loss: 6.939e-03:   0%|          | 1151/300001 [19:33:05<4422:51:03, 53.28s/it]training loss: 6.939e-03:   0%|          | 1152/300001 [19:33:50<4216:48:19, 50.80s/it]training loss: 6.939e-03:   0%|          | 1153/300001 [19:34:42<4259:37:19, 51.31s/it]training loss: 6.939e-03:   0%|          | 1154/300001 [19:35:32<4217:35:46, 50.81s/it]training loss: 6.939e-03:   0%|          | 1155/300001 [19:36:18<4098:15:48, 49.37s/it]training loss: 6.939e-03:   0%|          | 1156/300001 [19:37:19<4383:16:44, 52.80s/it]training loss: 6.939e-03:   0%|          | 1157/300001 [19:38:08<4286:30:35, 51.64s/it]training loss: 6.939e-03:   0%|          | 1158/300001 [19:38:56<4210:25:01, 50.72s/it]training loss: 6.939e-03:   0%|          | 1159/300001 [19:39:44<4130:32:41, 49.76s/it]training loss: 6.939e-03:   0%|          | 1160/300001 [19:40:31<4069:59:44, 49.03s/it]training loss: 6.393e-03:   0%|          | 1160/300001 [19:41:22<4069:59:44, 49.03s/it]training loss: 6.393e-03:   0%|          | 1161/300001 [19:41:23<4130:05:23, 49.75s/it]training loss: 6.393e-03:   0%|          | 1162/300001 [19:42:10<4074:25:16, 49.08s/it]training loss: 6.393e-03:   0%|          | 1163/300001 [19:42:51<3879:58:39, 46.74s/it]training loss: 6.393e-03:   0%|          | 1164/300001 [19:43:31<3692:25:39, 44.48s/it]training loss: 6.393e-03:   0%|          | 1165/300001 [19:44:11<3592:43:10, 43.28s/it]training loss: 6.393e-03:   0%|          | 1166/300001 [19:44:51<3504:08:24, 42.21s/it]training loss: 6.393e-03:   0%|          | 1167/300001 [19:45:34<3533:13:38, 42.56s/it]training loss: 6.393e-03:   0%|          | 1168/300001 [19:46:11<3378:21:31, 40.70s/it]training loss: 6.393e-03:   0%|          | 1169/300001 [19:46:54<3445:06:47, 41.50s/it]training loss: 6.393e-03:   0%|          | 1170/300001 [19:47:31<3343:36:19, 40.28s/it]training loss: 6.393e-03:   0%|          | 1171/300001 [19:48:13<3369:09:17, 40.59s/it]training loss: 6.393e-03:   0%|          | 1172/300001 [19:48:52<3351:04:31, 40.37s/it]training loss: 6.393e-03:   0%|          | 1173/300001 [19:49:32<3327:44:41, 40.09s/it]training loss: 6.393e-03:   0%|          | 1174/300001 [19:50:17<3459:32:02, 41.68s/it]training loss: 6.393e-03:   0%|          | 1175/300001 [19:50:56<3392:39:35, 40.87s/it]training loss: 6.393e-03:   0%|          | 1176/300001 [19:51:40<3453:40:52, 41.61s/it]training loss: 6.393e-03:   0%|          | 1177/300001 [19:52:25<3540:17:40, 42.65s/it]training loss: 6.393e-03:   0%|          | 1178/300001 [19:53:04<3464:15:00, 41.73s/it]training loss: 6.393e-03:   0%|          | 1179/300001 [19:53:52<3600:49:10, 43.38s/it]training loss: 6.393e-03:   0%|          | 1180/300001 [19:54:30<3485:15:28, 41.99s/it]training loss: 6.450e-03:   0%|          | 1180/300001 [19:55:10<3485:15:28, 41.99s/it]training loss: 6.450e-03:   0%|          | 1181/300001 [19:55:10<3432:43:57, 41.36s/it]training loss: 6.450e-03:   0%|          | 1182/300001 [19:55:47<3311:52:42, 39.90s/it]training loss: 6.450e-03:   0%|          | 1183/300001 [19:56:25<3261:49:59, 39.30s/it]training loss: 6.450e-03:   0%|          | 1184/300001 [19:57:02<3205:37:14, 38.62s/it]training loss: 6.450e-03:   0%|          | 1185/300001 [19:57:41<3215:27:00, 38.74s/it]training loss: 6.450e-03:   0%|          | 1186/300001 [19:58:21<3268:40:02, 39.38s/it]training loss: 6.450e-03:   0%|          | 1187/300001 [19:59:06<3389:01:02, 40.83s/it]training loss: 6.450e-03:   0%|          | 1188/300001 [19:59:47<3399:40:24, 40.96s/it]training loss: 6.450e-03:   0%|          | 1189/300001 [20:00:28<3406:37:00, 41.04s/it]training loss: 6.450e-03:   0%|          | 1190/300001 [20:01:15<3547:34:49, 42.74s/it]training loss: 6.450e-03:   0%|          | 1191/300001 [20:01:52<3398:28:25, 40.94s/it]training loss: 6.450e-03:   0%|          | 1192/300001 [20:02:32<3387:29:48, 40.81s/it]training loss: 6.450e-03:   0%|          | 1193/300001 [20:03:14<3401:46:15, 40.98s/it]training loss: 6.450e-03:   0%|          | 1194/300001 [20:03:57<3469:45:11, 41.80s/it]training loss: 6.450e-03:   0%|          | 1195/300001 [20:04:37<3409:27:10, 41.08s/it]training loss: 6.450e-03:   0%|          | 1196/300001 [20:05:17<3393:38:45, 40.89s/it]training loss: 6.450e-03:   0%|          | 1197/300001 [20:05:59<3412:39:59, 41.12s/it]training loss: 6.450e-03:   0%|          | 1198/300001 [20:06:41<3433:50:37, 41.37s/it]training loss: 6.450e-03:   0%|          | 1199/300001 [20:07:23<3468:51:12, 41.79s/it]training loss: 6.450e-03:   0%|          | 1200/300001 [20:08:05<3457:02:32, 41.65s/it]training loss: 6.586e-03:   0%|          | 1200/300001 [20:08:45<3457:02:32, 41.65s/it]training loss: 6.586e-03:   0%|          | 1201/300001 [20:08:45<3416:28:45, 41.16s/it]training loss: 6.586e-03:   0%|          | 1202/300001 [20:09:25<3383:12:16, 40.76s/it]training loss: 6.586e-03:   0%|          | 1203/300001 [20:10:05<3376:55:23, 40.69s/it]training loss: 6.586e-03:   0%|          | 1204/300001 [20:10:45<3348:08:21, 40.34s/it]training loss: 6.586e-03:   0%|          | 1205/300001 [20:11:26<3382:33:12, 40.75s/it]training loss: 6.586e-03:   0%|          | 1206/300001 [20:12:14<3561:20:35, 42.91s/it]training loss: 6.586e-03:   0%|          | 1207/300001 [20:12:54<3476:18:46, 41.88s/it]training loss: 6.586e-03:   0%|          | 1208/300001 [20:13:32<3378:39:13, 40.71s/it]training loss: 6.586e-03:   0%|          | 1209/300001 [20:14:09<3293:23:52, 39.68s/it]training loss: 6.586e-03:   0%|          | 1210/300001 [20:14:50<3319:02:09, 39.99s/it]training loss: 6.586e-03:   0%|          | 1211/300001 [20:15:28<3277:10:18, 39.49s/it]training loss: 6.586e-03:   0%|          | 1212/300001 [20:16:07<3265:50:03, 39.35s/it]training loss: 6.586e-03:   0%|          | 1213/300001 [20:16:47<3273:24:35, 39.44s/it]training loss: 6.586e-03:   0%|          | 1214/300001 [20:17:24<3230:00:11, 38.92s/it]training loss: 6.586e-03:   0%|          | 1215/300001 [20:18:02<3191:34:00, 38.45s/it]training loss: 6.586e-03:   0%|          | 1216/300001 [20:18:49<3419:02:15, 41.20s/it]training loss: 6.586e-03:   0%|          | 1217/300001 [20:19:32<3441:29:45, 41.47s/it]training loss: 6.586e-03:   0%|          | 1218/300001 [20:20:13<3439:48:16, 41.45s/it]training loss: 6.586e-03:   0%|          | 1219/300001 [20:20:53<3395:43:27, 40.91s/it]training loss: 6.586e-03:   0%|          | 1220/300001 [20:21:34<3408:18:59, 41.07s/it]training loss: 6.503e-03:   0%|          | 1220/300001 [20:22:12<3408:18:59, 41.07s/it]training loss: 6.503e-03:   0%|          | 1221/300001 [20:22:12<3326:50:08, 40.09s/it]training loss: 6.503e-03:   0%|          | 1222/300001 [20:22:51<3294:26:38, 39.69s/it]training loss: 6.503e-03:   0%|          | 1223/300001 [20:23:29<3261:07:08, 39.29s/it]training loss: 6.503e-03:   0%|          | 1224/300001 [20:24:12<3366:57:37, 40.57s/it]training loss: 6.503e-03:   0%|          | 1225/300001 [20:24:55<3415:57:33, 41.16s/it]training loss: 6.503e-03:   0%|          | 1226/300001 [20:25:42<3561:28:38, 42.91s/it]training loss: 6.503e-03:   0%|          | 1227/300001 [20:26:25<3574:36:42, 43.07s/it]training loss: 6.503e-03:   0%|          | 1228/300001 [20:27:08<3555:33:46, 42.84s/it]training loss: 6.503e-03:   0%|          | 1229/300001 [20:27:52<3601:49:35, 43.40s/it]training loss: 6.503e-03:   0%|          | 1230/300001 [20:28:30<3463:33:55, 41.73s/it]training loss: 6.503e-03:   0%|          | 1231/300001 [20:29:09<3383:52:41, 40.77s/it]training loss: 6.503e-03:   0%|          | 1232/300001 [20:29:52<3454:02:58, 41.62s/it]training loss: 6.503e-03:   0%|          | 1233/300001 [20:30:32<3413:28:48, 41.13s/it]training loss: 6.503e-03:   0%|          | 1234/300001 [20:31:14<3428:11:58, 41.31s/it]training loss: 6.503e-03:   0%|          | 1235/300001 [20:31:53<3372:53:44, 40.64s/it]training loss: 6.503e-03:   0%|          | 1236/300001 [20:32:36<3426:45:37, 41.29s/it]training loss: 6.503e-03:   0%|          | 1237/300001 [20:33:22<3535:26:15, 42.60s/it]training loss: 6.503e-03:   0%|          | 1238/300001 [20:34:06<3581:45:47, 43.16s/it]training loss: 6.503e-03:   0%|          | 1239/300001 [20:34:46<3507:07:22, 42.26s/it]training loss: 6.503e-03:   0%|          | 1240/300001 [20:35:26<3441:29:52, 41.47s/it]training loss: 7.898e-03:   0%|          | 1240/300001 [20:36:13<3441:29:52, 41.47s/it]training loss: 7.898e-03:   0%|          | 1241/300001 [20:36:13<3574:42:55, 43.07s/it]training loss: 7.898e-03:   0%|          | 1242/300001 [20:36:53<3506:27:07, 42.25s/it]training loss: 7.898e-03:   0%|          | 1243/300001 [20:37:34<3467:46:19, 41.79s/it]training loss: 7.898e-03:   0%|          | 1244/300001 [20:38:18<3530:15:48, 42.54s/it]training loss: 7.898e-03:   0%|          | 1245/300001 [20:39:01<3536:48:44, 42.62s/it]training loss: 7.898e-03:   0%|          | 1246/300001 [20:39:44<3547:17:44, 42.74s/it]training loss: 7.898e-03:   0%|          | 1247/300001 [20:40:25<3507:41:02, 42.27s/it]training loss: 7.898e-03:   0%|          | 1248/300001 [20:41:06<3484:19:20, 41.99s/it]training loss: 7.898e-03:   0%|          | 1249/300001 [20:41:47<3443:54:22, 41.50s/it]training loss: 7.898e-03:   0%|          | 1250/300001 [20:42:28<3438:49:36, 41.44s/it]training loss: 7.898e-03:   0%|          | 1251/300001 [20:43:06<3359:02:22, 40.48s/it]training loss: 7.898e-03:   0%|          | 1252/300001 [20:43:48<3383:49:55, 40.78s/it]training loss: 7.898e-03:   0%|          | 1253/300001 [20:44:27<3341:05:31, 40.26s/it]training loss: 7.898e-03:   0%|          | 1254/300001 [20:45:06<3321:33:07, 40.03s/it]training loss: 7.898e-03:   0%|          | 1255/300001 [20:45:50<3403:25:17, 41.01s/it]training loss: 7.898e-03:   0%|          | 1256/300001 [20:46:18<3090:45:58, 37.25s/it]training loss: 7.898e-03:   0%|          | 1257/300001 [20:46:56<3116:19:12, 37.55s/it]training loss: 7.898e-03:   0%|          | 1258/300001 [20:47:34<3106:13:33, 37.43s/it]training loss: 7.898e-03:   0%|          | 1259/300001 [20:48:14<3184:18:59, 38.37s/it]training loss: 7.898e-03:   0%|          | 1260/300001 [20:48:56<3280:37:22, 39.53s/it]training loss: 9.549e-03:   0%|          | 1260/300001 [20:49:37<3280:37:22, 39.53s/it]training loss: 9.549e-03:   0%|          | 1261/300001 [20:49:38<3321:33:50, 40.03s/it]training loss: 9.549e-03:   0%|          | 1262/300001 [20:50:16<3291:03:24, 39.66s/it]training loss: 9.549e-03:   0%|          | 1263/300001 [20:50:57<3309:24:00, 39.88s/it]training loss: 9.549e-03:   0%|          | 1264/300001 [20:51:38<3335:49:25, 40.20s/it]training loss: 9.549e-03:   0%|          | 1265/300001 [20:52:15<3257:19:28, 39.25s/it]training loss: 9.549e-03:   0%|          | 1266/300001 [20:52:53<3227:13:41, 38.89s/it]training loss: 9.549e-03:   0%|          | 1267/300001 [20:53:33<3250:52:04, 39.18s/it]training loss: 9.549e-03:   0%|          | 1268/300001 [20:54:14<3298:20:13, 39.75s/it]training loss: 9.549e-03:   0%|          | 1269/300001 [20:55:08<3658:39:39, 44.09s/it]training loss: 9.549e-03:   0%|          | 1270/300001 [20:55:48<3553:10:11, 42.82s/it]training loss: 9.549e-03:   0%|          | 1271/300001 [20:56:30<3534:13:44, 42.59s/it]training loss: 9.549e-03:   0%|          | 1272/300001 [20:57:11<3495:41:03, 42.13s/it]training loss: 9.549e-03:   0%|          | 1273/300001 [20:57:48<3363:46:42, 40.54s/it]training loss: 9.549e-03:   0%|          | 1274/300001 [20:58:26<3299:45:28, 39.77s/it]training loss: 9.549e-03:   0%|          | 1275/300001 [20:59:12<3455:34:06, 41.64s/it]training loss: 9.549e-03:   0%|          | 1276/300001 [21:00:06<3780:48:56, 45.56s/it]training loss: 9.549e-03:   0%|          | 1277/300001 [21:00:48<3685:59:41, 44.42s/it]training loss: 9.549e-03:   0%|          | 1278/300001 [21:01:29<3587:59:02, 43.24s/it]training loss: 9.549e-03:   0%|          | 1279/300001 [21:02:09<3512:47:08, 42.33s/it]training loss: 9.549e-03:   0%|          | 1280/300001 [21:02:52<3524:48:38, 42.48s/it]training loss: 6.843e-03:   0%|          | 1280/300001 [21:03:39<3524:48:38, 42.48s/it]training loss: 6.843e-03:   0%|          | 1281/300001 [21:03:39<3651:38:38, 44.01s/it]training loss: 6.843e-03:   0%|          | 1282/300001 [21:04:31<3836:46:02, 46.24s/it]training loss: 6.843e-03:   0%|          | 1283/300001 [21:05:21<3942:15:41, 47.51s/it]training loss: 6.843e-03:   0%|          | 1284/300001 [21:06:05<3854:14:02, 46.45s/it]training loss: 6.843e-03:   0%|          | 1285/300001 [21:06:47<3748:19:53, 45.17s/it]training loss: 6.843e-03:   0%|          | 1286/300001 [21:07:30<3691:14:04, 44.49s/it]training loss: 6.843e-03:   0%|          | 1287/300001 [21:08:10<3576:46:20, 43.11s/it]training loss: 6.843e-03:   0%|          | 1288/300001 [21:08:54<3602:22:53, 43.41s/it]training loss: 6.843e-03:   0%|          | 1289/300001 [21:09:43<3735:13:09, 45.02s/it]training loss: 6.843e-03:   0%|          | 1290/300001 [21:10:32<3829:33:30, 46.15s/it]training loss: 6.843e-03:   0%|          | 1291/300001 [21:11:12<3686:00:48, 44.42s/it]training loss: 6.843e-03:   0%|          | 1292/300001 [21:11:55<3641:20:16, 43.88s/it]training loss: 6.843e-03:   0%|          | 1293/300001 [21:12:36<3570:41:53, 43.03s/it]training loss: 6.843e-03:   0%|          | 1294/300001 [21:13:19<3580:34:09, 43.15s/it]training loss: 6.843e-03:   0%|          | 1295/300001 [21:14:04<3612:14:59, 43.53s/it]training loss: 6.843e-03:   0%|          | 1296/300001 [21:14:42<3488:40:30, 42.05s/it]training loss: 6.843e-03:   0%|          | 1297/300001 [21:15:22<3421:19:52, 41.23s/it]training loss: 6.843e-03:   0%|          | 1298/300001 [21:16:02<3407:17:28, 41.07s/it]training loss: 6.843e-03:   0%|          | 1299/300001 [21:16:42<3361:33:48, 40.51s/it]training loss: 6.843e-03:   0%|          | 1300/300001 [21:17:20<3314:14:27, 39.94s/it]training loss: 6.348e-03:   0%|          | 1300/300001 [21:17:57<3314:14:27, 39.94s/it]training loss: 6.348e-03:   0%|          | 1301/300001 [21:17:57<3243:44:38, 39.09s/it]training loss: 6.348e-03:   0%|          | 1302/300001 [21:18:37<3251:27:46, 39.19s/it]training loss: 6.348e-03:   0%|          | 1303/300001 [21:19:17<3280:48:35, 39.54s/it]training loss: 6.348e-03:   0%|          | 1304/300001 [21:19:54<3210:40:06, 38.70s/it]training loss: 6.348e-03:   0%|          | 1305/300001 [21:20:32<3194:08:19, 38.50s/it]training loss: 6.348e-03:   0%|          | 1306/300001 [21:21:08<3135:24:46, 37.79s/it]training loss: 6.348e-03:   0%|          | 1307/300001 [21:21:45<3112:42:05, 37.52s/it]training loss: 6.348e-03:   0%|          | 1308/300001 [21:22:24<3165:53:36, 38.16s/it]training loss: 6.348e-03:   0%|          | 1309/300001 [21:23:02<3160:56:38, 38.10s/it]training loss: 6.348e-03:   0%|          | 1310/300001 [21:23:43<3220:37:48, 38.82s/it]training loss: 6.348e-03:   0%|          | 1311/300001 [21:24:22<3233:00:24, 38.97s/it]training loss: 6.348e-03:   0%|          | 1312/300001 [21:24:57<3136:54:09, 37.81s/it]training loss: 6.348e-03:   0%|          | 1313/300001 [21:25:33<3077:48:30, 37.10s/it]training loss: 6.348e-03:   0%|          | 1314/300001 [21:26:13<3146:53:34, 37.93s/it]training loss: 6.348e-03:   0%|          | 1315/300001 [21:26:50<3142:13:33, 37.87s/it]training loss: 6.348e-03:   0%|          | 1316/300001 [21:27:25<3061:38:30, 36.90s/it]training loss: 6.348e-03:   0%|          | 1317/300001 [21:28:01<3040:32:34, 36.65s/it]training loss: 6.348e-03:   0%|          | 1318/300001 [21:28:39<3063:52:01, 36.93s/it]training loss: 6.348e-03:   0%|          | 1319/300001 [21:29:17<3104:29:17, 37.42s/it]training loss: 6.348e-03:   0%|          | 1320/300001 [21:29:58<3192:00:32, 38.47s/it]training loss: 6.270e-03:   0%|          | 1320/300001 [21:30:36<3192:00:32, 38.47s/it]training loss: 6.270e-03:   0%|          | 1321/300001 [21:30:36<3187:59:06, 38.42s/it]training loss: 6.270e-03:   0%|          | 1322/300001 [21:31:16<3210:36:32, 38.70s/it]training loss: 6.270e-03:   0%|          | 1323/300001 [21:31:56<3244:37:13, 39.11s/it]training loss: 6.270e-03:   0%|          | 1324/300001 [21:32:31<3149:53:26, 37.97s/it]training loss: 6.270e-03:   0%|          | 1325/300001 [21:33:08<3110:37:57, 37.49s/it]training loss: 6.270e-03:   0%|          | 1326/300001 [21:33:45<3118:34:48, 37.59s/it]training loss: 6.270e-03:   0%|          | 1327/300001 [21:34:26<3197:57:09, 38.55s/it]training loss: 6.270e-03:   0%|          | 1328/300001 [21:35:07<3254:12:07, 39.22s/it]training loss: 6.270e-03:   0%|          | 1329/300001 [21:35:45<3218:18:50, 38.79s/it]training loss: 6.270e-03:   0%|          | 1330/300001 [21:36:25<3244:40:32, 39.11s/it]training loss: 6.270e-03:   0%|          | 1331/300001 [21:37:00<3159:16:22, 38.08s/it]training loss: 6.270e-03:   0%|          | 1332/300001 [21:37:38<3161:01:40, 38.10s/it]training loss: 6.270e-03:   0%|          | 1333/300001 [21:38:21<3261:25:15, 39.31s/it]training loss: 6.270e-03:   0%|          | 1334/300001 [21:38:59<3237:38:50, 39.03s/it]training loss: 6.270e-03:   0%|          | 1335/300001 [21:39:40<3281:27:10, 39.55s/it]training loss: 6.270e-03:   0%|          | 1336/300001 [21:40:17<3236:05:53, 39.01s/it]training loss: 6.270e-03:   0%|          | 1337/300001 [21:41:00<3314:33:56, 39.95s/it]training loss: 6.270e-03:   0%|          | 1338/300001 [21:41:44<3428:55:34, 41.33s/it]training loss: 6.270e-03:   0%|          | 1339/300001 [21:42:25<3408:44:20, 41.09s/it]training loss: 6.270e-03:   0%|          | 1340/300001 [21:43:01<3300:08:02, 39.78s/it]training loss: 6.632e-03:   0%|          | 1340/300001 [21:43:42<3300:08:02, 39.78s/it]training loss: 6.632e-03:   0%|          | 1341/300001 [21:43:42<3318:47:26, 40.00s/it]training loss: 6.632e-03:   0%|          | 1342/300001 [21:44:23<3338:05:38, 40.24s/it]training loss: 6.632e-03:   0%|          | 1343/300001 [21:45:07<3427:48:54, 41.32s/it]training loss: 6.632e-03:   0%|          | 1344/300001 [21:45:48<3428:17:09, 41.32s/it]training loss: 6.632e-03:   0%|          | 1345/300001 [21:46:29<3426:32:35, 41.30s/it]training loss: 6.632e-03:   0%|          | 1346/300001 [21:47:12<3460:35:32, 41.71s/it]training loss: 6.632e-03:   0%|          | 1347/300001 [21:47:50<3377:32:43, 40.71s/it]training loss: 6.632e-03:   0%|          | 1348/300001 [21:48:32<3394:02:24, 40.91s/it]training loss: 6.632e-03:   0%|          | 1349/300001 [21:49:12<3370:40:20, 40.63s/it]training loss: 6.632e-03:   0%|          | 1350/300001 [21:49:52<3369:07:47, 40.61s/it]training loss: 6.632e-03:   0%|          | 1351/300001 [21:50:30<3306:03:33, 39.85s/it]training loss: 6.632e-03:   0%|          | 1352/300001 [21:51:08<3252:44:24, 39.21s/it]training loss: 6.632e-03:   0%|          | 1353/300001 [21:51:48<3279:52:17, 39.54s/it]training loss: 6.632e-03:   0%|          | 1354/300001 [21:52:33<3411:52:21, 41.13s/it]training loss: 6.632e-03:   0%|          | 1355/300001 [21:53:11<3344:41:32, 40.32s/it]training loss: 6.632e-03:   0%|          | 1356/300001 [21:53:53<3376:58:32, 40.71s/it]training loss: 6.632e-03:   0%|          | 1357/300001 [21:54:29<3270:00:19, 39.42s/it]training loss: 6.632e-03:   0%|          | 1358/300001 [21:55:17<3475:39:38, 41.90s/it]training loss: 6.632e-03:   0%|          | 1359/300001 [21:56:02<3537:00:03, 42.64s/it]training loss: 6.632e-03:   0%|          | 1360/300001 [21:56:40<3423:17:46, 41.27s/it]training loss: 5.925e-03:   0%|          | 1360/300001 [21:57:23<3423:17:46, 41.27s/it]training loss: 5.925e-03:   0%|          | 1361/300001 [21:57:23<3476:03:44, 41.90s/it]training loss: 5.925e-03:   0%|          | 1362/300001 [21:58:02<3393:59:46, 40.91s/it]training loss: 5.925e-03:   0%|          | 1363/300001 [21:58:44<3423:50:02, 41.27s/it]training loss: 5.925e-03:   0%|          | 1364/300001 [21:59:22<3362:40:35, 40.54s/it]training loss: 5.925e-03:   0%|          | 1365/300001 [21:59:58<3249:26:22, 39.17s/it]training loss: 5.925e-03:   0%|          | 1366/300001 [22:00:37<3236:59:35, 39.02s/it]training loss: 5.925e-03:   0%|          | 1367/300001 [22:01:17<3268:36:18, 39.40s/it]training loss: 5.925e-03:   0%|          | 1368/300001 [22:01:54<3189:47:21, 38.45s/it]training loss: 5.925e-03:   0%|          | 1369/300001 [22:02:32<3194:59:21, 38.52s/it]training loss: 5.925e-03:   0%|          | 1370/300001 [22:03:08<3126:56:46, 37.70s/it]training loss: 5.925e-03:   0%|          | 1371/300001 [22:03:45<3112:09:46, 37.52s/it]training loss: 5.925e-03:   0%|          | 1372/300001 [22:04:25<3180:30:54, 38.34s/it]training loss: 5.925e-03:   0%|          | 1373/300001 [22:05:03<3154:30:45, 38.03s/it]training loss: 5.925e-03:   0%|          | 1374/300001 [22:05:42<3195:12:11, 38.52s/it]training loss: 5.925e-03:   0%|          | 1375/300001 [22:06:20<3175:27:43, 38.28s/it]training loss: 5.925e-03:   0%|          | 1376/300001 [22:06:59<3200:43:05, 38.59s/it]training loss: 5.925e-03:   0%|          | 1377/300001 [22:07:37<3183:27:57, 38.38s/it]training loss: 5.925e-03:   0%|          | 1378/300001 [22:08:18<3248:56:55, 39.17s/it]training loss: 5.925e-03:   0%|          | 1379/300001 [22:08:56<3212:04:47, 38.72s/it]training loss: 5.925e-03:   0%|          | 1380/300001 [22:09:32<3132:08:56, 37.76s/it]training loss: 5.798e-03:   0%|          | 1380/300001 [22:10:09<3132:08:56, 37.76s/it]training loss: 5.798e-03:   0%|          | 1381/300001 [22:10:09<3118:11:29, 37.59s/it]training loss: 5.798e-03:   0%|          | 1382/300001 [22:10:54<3303:44:28, 39.83s/it]training loss: 5.798e-03:   0%|          | 1383/300001 [22:11:31<3244:11:50, 39.11s/it]training loss: 5.798e-03:   0%|          | 1384/300001 [22:12:08<3195:40:52, 38.53s/it]training loss: 5.798e-03:   0%|          | 1385/300001 [22:12:45<3139:42:54, 37.85s/it]training loss: 5.798e-03:   0%|          | 1386/300001 [22:13:25<3205:31:54, 38.64s/it]training loss: 5.798e-03:   0%|          | 1387/300001 [22:14:09<3330:18:09, 40.15s/it]training loss: 5.798e-03:   0%|          | 1388/300001 [22:15:04<3708:00:54, 44.70s/it]training loss: 5.798e-03:   0%|          | 1389/300001 [22:16:00<3983:18:15, 48.02s/it]training loss: 5.798e-03:   0%|          | 1390/300001 [22:16:42<3839:32:46, 46.29s/it]training loss: 5.798e-03:   0%|          | 1391/300001 [22:17:27<3800:03:31, 45.81s/it]training loss: 5.798e-03:   0%|          | 1392/300001 [22:18:07<3645:55:36, 43.95s/it]training loss: 5.798e-03:   0%|          | 1393/300001 [22:18:51<3658:01:40, 44.10s/it]training loss: 5.798e-03:   0%|          | 1394/300001 [22:19:33<3600:04:14, 43.40s/it]training loss: 5.798e-03:   0%|          | 1395/300001 [22:20:12<3500:24:38, 42.20s/it]training loss: 5.798e-03:   0%|          | 1396/300001 [22:20:51<3414:05:27, 41.16s/it]training loss: 5.798e-03:   0%|          | 1397/300001 [22:21:31<3389:30:53, 40.86s/it]training loss: 5.798e-03:   0%|          | 1398/300001 [22:22:12<3399:12:00, 40.98s/it]training loss: 5.798e-03:   0%|          | 1399/300001 [22:22:55<3438:29:15, 41.46s/it]training loss: 5.798e-03:   0%|          | 1400/300001 [22:23:35<3410:19:59, 41.12s/it]training loss: 5.472e-03:   0%|          | 1400/300001 [22:24:16<3410:19:59, 41.12s/it]training loss: 5.472e-03:   0%|          | 1401/300001 [22:24:16<3394:19:57, 40.92s/it]training loss: 5.472e-03:   0%|          | 1402/300001 [22:25:00<3480:50:49, 41.97s/it]training loss: 5.472e-03:   0%|          | 1403/300001 [22:25:41<3443:22:39, 41.51s/it]training loss: 5.472e-03:   0%|          | 1404/300001 [22:26:19<3364:19:59, 40.56s/it]training loss: 5.472e-03:   0%|          | 1405/300001 [22:26:57<3311:15:50, 39.92s/it]training loss: 5.472e-03:   0%|          | 1406/300001 [22:27:36<3269:28:24, 39.42s/it]training loss: 5.472e-03:   0%|          | 1407/300001 [22:28:16<3302:44:58, 39.82s/it]training loss: 5.472e-03:   0%|          | 1408/300001 [22:28:52<3202:39:17, 38.61s/it]training loss: 5.472e-03:   0%|          | 1409/300001 [22:29:33<3251:54:59, 39.21s/it]training loss: 5.472e-03:   0%|          | 1410/300001 [22:30:17<3391:07:53, 40.89s/it]training loss: 5.472e-03:   0%|          | 1411/300001 [22:31:02<3476:08:22, 41.91s/it]training loss: 5.472e-03:   0%|          | 1412/300001 [22:31:47<3549:33:18, 42.80s/it]training loss: 5.472e-03:   0%|          | 1413/300001 [22:32:26<3457:09:23, 41.68s/it]training loss: 5.472e-03:   0%|          | 1414/300001 [22:33:43<4352:36:25, 52.48s/it]training loss: 5.472e-03:   0%|          | 1415/300001 [22:34:27<4130:38:48, 49.80s/it]training loss: 5.472e-03:   0%|          | 1416/300001 [22:35:11<3992:59:22, 48.14s/it]training loss: 5.472e-03:   0%|          | 1417/300001 [22:36:08<4218:28:31, 50.86s/it]training loss: 5.472e-03:   0%|          | 1418/300001 [22:36:52<4040:24:41, 48.72s/it]training loss: 5.472e-03:   0%|          | 1419/300001 [22:37:38<3959:48:20, 47.74s/it]training loss: 5.472e-03:   0%|          | 1420/300001 [22:38:21<3842:20:24, 46.33s/it]training loss: 6.064e-03:   0%|          | 1420/300001 [22:39:15<3842:20:24, 46.33s/it]training loss: 6.064e-03:   0%|          | 1421/300001 [22:39:15<4054:32:46, 48.89s/it]training loss: 6.064e-03:   0%|          | 1422/300001 [22:39:57<3883:34:56, 46.82s/it]training loss: 6.064e-03:   0%|          | 1423/300001 [22:40:44<3883:42:51, 46.83s/it]training loss: 6.064e-03:   0%|          | 1424/300001 [22:41:30<3865:28:11, 46.61s/it]training loss: 6.064e-03:   0%|          | 1425/300001 [22:42:14<3796:33:33, 45.78s/it]training loss: 6.064e-03:   0%|          | 1426/300001 [22:42:55<3681:44:55, 44.39s/it]training loss: 6.064e-03:   0%|          | 1427/300001 [22:43:40<3686:42:31, 44.45s/it]training loss: 6.064e-03:   0%|          | 1428/300001 [22:44:23<3662:18:00, 44.16s/it]training loss: 6.064e-03:   0%|          | 1429/300001 [22:45:02<3532:36:02, 42.59s/it]training loss: 6.064e-03:   0%|          | 1430/300001 [22:45:44<3509:48:04, 42.32s/it]training loss: 6.064e-03:   0%|          | 1431/300001 [22:46:22<3404:40:13, 41.05s/it]training loss: 6.064e-03:   0%|          | 1432/300001 [22:47:01<3342:13:34, 40.30s/it]training loss: 6.064e-03:   0%|          | 1433/300001 [22:47:41<3347:07:46, 40.36s/it]training loss: 6.064e-03:   0%|          | 1434/300001 [22:48:18<3263:51:20, 39.35s/it]training loss: 6.064e-03:   0%|          | 1435/300001 [22:49:00<3333:52:55, 40.20s/it]training loss: 6.064e-03:   0%|          | 1436/300001 [22:49:40<3312:22:26, 39.94s/it]training loss: 6.064e-03:   0%|          | 1437/300001 [22:50:22<3380:46:03, 40.76s/it]training loss: 6.064e-03:   0%|          | 1438/300001 [22:51:03<3377:40:58, 40.73s/it]training loss: 6.064e-03:   0%|          | 1439/300001 [22:51:39<3269:09:05, 39.42s/it]training loss: 6.064e-03:   0%|          | 1440/300001 [22:52:18<3246:36:15, 39.15s/it]training loss: 6.121e-03:   0%|          | 1440/300001 [22:53:02<3246:36:15, 39.15s/it]training loss: 6.121e-03:   0%|          | 1441/300001 [22:53:02<3361:17:21, 40.53s/it]training loss: 6.121e-03:   0%|          | 1442/300001 [22:53:45<3432:13:47, 41.39s/it]training loss: 6.121e-03:   0%|          | 1443/300001 [22:54:23<3350:56:36, 40.41s/it]training loss: 6.121e-03:   0%|          | 1444/300001 [22:55:04<3363:10:40, 40.55s/it]training loss: 6.121e-03:   0%|          | 1445/300001 [22:55:43<3309:14:41, 39.90s/it]training loss: 6.121e-03:   0%|          | 1446/300001 [22:56:21<3266:01:41, 39.38s/it]training loss: 6.121e-03:   0%|          | 1447/300001 [22:57:01<3285:27:58, 39.62s/it]training loss: 6.121e-03:   0%|          | 1448/300001 [22:57:44<3374:08:50, 40.69s/it]training loss: 6.121e-03:   0%|          | 1449/300001 [22:58:27<3425:33:02, 41.31s/it]slurmstepd: error: *** JOB 9913544 ON gpu018 CANCELLED AT 2026-05-15T15:20:01 DUE TO TIME LIMIT ***
diff --git a/slurm/logs/pidm_darcy_pg_9913544.out b/slurm/logs/pidm_darcy_pg_9913544.out
deleted file mode 100644
index 4b80c77..0000000
--- a/slurm/logs/pidm_darcy_pg_9913544.out
+++ /dev/null
@@ -1 +0,0 @@
-Number of trainable parameters: 10386482
diff --git a/slurm/logs/pidm_darcy_pg_9943187.err b/slurm/logs/pidm_darcy_pg_9943187.err
deleted file mode 100644
index ad069c9..0000000
--- a/slurm/logs/pidm_darcy_pg_9943187.err
+++ /dev/null
@@ -1,4 +0,0 @@
-Traceback (most recent call last):
-  File "/tmp/tmp.BRlW0cyUiR_main.py", line 6, in <module>
-    from src.data_utils import *
-ModuleNotFoundError: No module named 'src'
diff --git a/slurm/logs/pidm_darcy_pg_9943187.out b/slurm/logs/pidm_darcy_pg_9943187.out
deleted file mode 100644
index 829d8ea..0000000
--- a/slurm/logs/pidm_darcy_pg_9943187.out
+++ /dev/null
@@ -1,3 +0,0 @@
-CUDA available: True
-Torch CUDA: 12.1
-GPU: NVIDIA A100 80GB PCIe
diff --git a/slurm/logs/pidm_toy_9908779.err b/slurm/logs/pidm_toy_9908779.err
deleted file mode 100644
index da791d6..0000000
--- a/slurm/logs/pidm_toy_9908779.err
+++ /dev/null
@@ -1,7 +0,0 @@
-Traceback (most recent call last):
-  File "<string>", line 6, in <module>
-  File "main_toy.py", line 7, in <module>
-    from src.denoising_toy_utils import *
-  File "/scratch/dstoyanova/PhysicsInformedDiffusionModels/src/denoising_toy_utils.py", line 1, in <module>
-    import os, dill
-ModuleNotFoundError: No module named 'dill'
diff --git a/slurm/logs/pidm_toy_9908779.out b/slurm/logs/pidm_toy_9908779.out
deleted file mode 100644
index e69de29..0000000
diff --git a/slurm/logs/pidm_toy_9912059.err b/slurm/logs/pidm_toy_9912059.err
deleted file mode 100644
index 322d4c1..0000000
--- a/slurm/logs/pidm_toy_9912059.err
+++ /dev/null
@@ -1,2 +0,0 @@
-  0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.5152:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.3789:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.2946:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.2986:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1994:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0912:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0367:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1352:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1058:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0884:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0338:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0145:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1622:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0615:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0173:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0301:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0258:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0413:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0343:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0964:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0162:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9760:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9718:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0519:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9114:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9289:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9336:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0006:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9296:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0271:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9249:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8873:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9933:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9360:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9202:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9836:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8683:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9113:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9114:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7995:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8778:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9115:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8789:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8656:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8538:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9382:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8543:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9284:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9010:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8267:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8483:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7410:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7821:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7964:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8175:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7951:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8026:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7574:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7594:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7234:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8132:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7521:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7649:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7512:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7854:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7253:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7691:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7200:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7329:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6241:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7410:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7128:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7229:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7586:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7287:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6686:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6742:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6595:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0171:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0171:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6374:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6249:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6663:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.7210:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6649:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6854:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6189:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6717:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6249:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6469:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6700:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5936:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6072:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.6156:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5700:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5883:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5557:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5855:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5374:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5767:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5291:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5217:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5500:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5624:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4962:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5129:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4655:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5036:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5223:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4714:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4957:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.5240:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4823:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4659:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4415:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4376:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4509:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4644:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4519:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4596:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4566:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4783:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4499:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4547:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3599:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3756:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4632:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4386:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3603:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3798:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3933:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3881:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3732:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3522:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3576:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4307:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3738:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3357:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3961:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3725:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4162:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3291:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3322:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3497:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3744:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3528:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3355:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3822:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3706:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.4346:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3244:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3953:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3114:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3752:   0%|          | 1/401 [00:03<24:42,  3.71s/it]training loss: 0.3561:   0%|          | 1/401 [00:04<24:42,  3.71s/it]training loss: 0.3542:   0%|          | 1/401 [00:04<24:42,  3.71s/it]training loss: 0.4224:   0%|          | 1/401 [00:04<24:42,  3.71s/it]training loss: 0.3633:   0%|          | 1/401 [00:04<24:42,  3.71s/it]training loss: 0.2147:   0%|          | 1/401 [00:04<24:42,  3.71s/it]training loss: 0.2147:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3845:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3693:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3577:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3713:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3821:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3625:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2946:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3450:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3979:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.4316:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3301:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3451:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2920:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3189:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3521:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3802:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3334:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2673:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3271:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3839:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.4021:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2882:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3578:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3489:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3275:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.4010:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.4039:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3388:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3710:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3292:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3677:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3953:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3414:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3305:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3477:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3261:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3771:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3604:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3249:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3791:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3320:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3247:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2592:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3405:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3072:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3682:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3582:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2835:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3406:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3310:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3523:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3634:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2810:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.4075:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2655:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3663:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3028:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3374:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2897:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3823:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3022:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3918:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3126:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3212:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2820:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2836:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2957:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3013:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3636:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3284:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3091:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3655:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3522:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3744:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3992:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3626:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.2875:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.3349:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.4077:   0%|          | 2/401 [00:04<11:22,  1.71s/it]training loss: 0.4077:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3424:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3990:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3607:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3316:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2497:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3547:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3185:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3593:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3463:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3468:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3027:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2752:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3321:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3308:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3072:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3342:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2876:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3406:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3054:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2590:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2911:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3846:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3155:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3330:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2765:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3410:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3079:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2835:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3051:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3354:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3531:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2541:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3650:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3455:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2858:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3101:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3473:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2787:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2944:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2806:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3480:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3276:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3044:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3267:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3467:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2451:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3267:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3559:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3378:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2999:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3034:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2999:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3185:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3073:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3412:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3302:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2587:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3440:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3271:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2529:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2944:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2907:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2845:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2346:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2846:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3240:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2908:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2569:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3222:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3345:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3578:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3175:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2664:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3073:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2798:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.2930:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3096:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3338:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3785:   1%|          | 3/401 [00:04<07:18,  1.10s/it]training loss: 0.3785:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2921:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2701:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2517:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2829:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2677:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2732:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3492:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3776:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2839:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2795:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2809:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3082:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2823:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3096:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3089:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3165:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2604:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2795:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3347:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2986:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2537:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3302:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2627:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3029:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2753:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.3603:   1%|          | 4/401 [00:04<05:22,  1.23it/s]training loss: 0.2633:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2769:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3185:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2667:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3233:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3425:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2895:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3051:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2802:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3600:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3136:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2254:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3810:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2373:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3007:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2902:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2936:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3135:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2800:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2653:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3468:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2617:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2748:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2999:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3400:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3338:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2719:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3330:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3345:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3263:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3196:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2848:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3135:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3131:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2589:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3065:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2976:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3452:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3025:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3033:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2651:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2757:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2662:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2917:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2671:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3028:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3448:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3581:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2578:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2906:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2932:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.3125:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2585:   1%|          | 4/401 [00:05<05:22,  1.23it/s]training loss: 0.2585:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2738:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2862:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2702:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2572:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2483:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2947:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3033:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3003:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3106:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2813:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3487:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2540:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2927:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2677:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2868:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3114:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3708:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3127:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3087:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2481:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3036:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3212:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2769:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2844:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2469:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3430:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2651:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3458:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2313:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2946:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2810:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3234:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3108:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2653:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2560:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3292:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3457:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3469:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3623:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2652:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3577:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3132:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2586:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3138:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2777:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2708:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2890:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3088:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3459:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3163:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2859:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.1935:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3018:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2812:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2930:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2976:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2899:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2830:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2343:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2675:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2589:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2490:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2925:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2594:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2664:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3099:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3023:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3144:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3879:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3242:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2976:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3268:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2418:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3767:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3026:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.2627:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3506:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3499:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3329:   1%|          | 5/401 [00:05<04:46,  1.38it/s]training loss: 0.3329:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2961:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3042:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2929:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3308:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2746:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3128:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2987:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2791:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3032:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2023:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3625:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3294:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2796:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3582:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3112:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3010:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2395:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3572:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3115:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3162:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2984:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2988:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3141:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2684:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3336:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2964:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2712:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3123:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2670:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2803:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2586:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2848:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3024:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3315:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3082:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2684:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2989:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2881:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2708:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2806:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3007:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2805:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2755:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3068:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3310:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2396:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3349:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3342:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3907:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2982:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2749:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3045:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2680:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2660:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2692:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3101:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2820:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2769:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3461:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3115:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2572:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2928:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2707:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2880:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3076:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2733:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3123:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3517:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2964:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3110:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3477:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3007:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3231:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2873:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3096:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3459:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3345:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.3172:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2325:   1%|▏         | 6/401 [00:05<03:50,  1.72it/s]training loss: 0.2325:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.3423:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.2606:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.2509:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.3133:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.3275:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.2838:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.3062:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.3076:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.2921:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.2709:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.2037:   2%|▏         | 7/401 [00:05<03:15,  2.02it/s]training loss: 0.2723:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2883:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2380:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3028:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3438:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2467:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3084:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2915:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3472:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3510:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2773:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3127:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2836:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2809:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2585:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3079:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2686:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3180:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3034:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3056:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3111:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2614:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2765:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3055:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2628:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2834:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2736:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3396:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.4051:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2766:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3604:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2764:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2859:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2690:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3101:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2874:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2069:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3167:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2459:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3157:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2435:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3134:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3483:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3135:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3418:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3517:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2995:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3282:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2817:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2481:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3048:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2772:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2627:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3083:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2880:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3151:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2532:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2887:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2417:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2719:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2891:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3127:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2747:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.3123:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2471:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2599:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.2887:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.4381:   2%|▏         | 7/401 [00:06<03:15,  2.02it/s]training loss: 0.4381:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2746:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2848:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2641:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2924:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3372:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2419:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2871:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2930:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2606:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3557:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2613:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2536:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3257:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2771:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2375:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3111:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3150:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3060:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2748:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3282:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2904:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3221:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.4045:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2695:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3089:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3610:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2901:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3433:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3229:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2531:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2645:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2876:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2764:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3086:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2686:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3152:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3106:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3033:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2855:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2865:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3316:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2778:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.1981:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2586:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2704:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3218:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2039:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3509:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2685:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2531:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2930:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2892:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2839:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2552:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3535:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2882:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3109:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2991:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2516:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2783:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2499:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3095:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3174:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2985:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2909:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2499:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2212:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3089:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3196:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3273:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2539:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2534:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2979:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2500:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2909:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2664:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2633:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.2269:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3809:   2%|▏         | 8/401 [00:06<02:50,  2.30it/s]training loss: 0.3809:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2241:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2214:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2789:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3018:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3126:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2844:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2983:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2988:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2683:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2665:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3073:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2965:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2670:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2857:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2765:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2634:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3097:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3103:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2878:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3881:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2621:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3371:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2858:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3187:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2436:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2922:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.3154:   2%|▏         | 9/401 [00:06<02:38,  2.47it/s]training loss: 0.2826:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2591:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2730:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3063:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3292:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3193:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2821:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2588:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2400:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3437:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2754:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2945:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3488:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2650:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2952:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3538:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3202:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3132:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3376:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2190:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2886:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2915:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3248:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3039:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3083:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2823:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2409:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2905:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2824:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3067:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3339:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3317:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3389:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2735:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2327:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2520:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3247:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2371:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2662:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3715:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2964:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2798:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2565:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3268:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2836:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3010:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2415:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3004:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2716:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.3422:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2597:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2006:   2%|▏         | 9/401 [00:07<02:38,  2.47it/s]training loss: 0.2006:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2761:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2705:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3304:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2800:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2990:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3032:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3059:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2845:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2675:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3613:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2441:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3349:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3250:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2937:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3339:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2421:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3120:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2726:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2566:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2624:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3023:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2710:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2622:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3155:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3696:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2751:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2600:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3059:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3151:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3098:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2607:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3067:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2453:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2746:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2191:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2555:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2721:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.4218:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3244:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3046:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3004:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2753:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3007:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3426:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2645:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2425:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3052:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2732:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2456:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2853:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2646:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3034:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3099:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3390:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3277:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2919:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3114:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2838:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3035:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2470:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2586:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3310:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2411:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2936:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3381:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3199:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3734:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2201:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2525:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3452:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3278:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2683:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2871:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2945:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2835:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3178:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.2827:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3407:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3258:   2%|▏         | 10/401 [00:07<03:30,  1.86it/s]training loss: 0.3258:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2356:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2739:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3495:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2647:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2650:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3064:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3343:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2957:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3016:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2482:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2976:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2254:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2462:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3540:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3438:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2867:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3427:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2467:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2522:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2888:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3750:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2827:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2609:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2349:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3100:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3069:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2881:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2347:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3218:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2811:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3395:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3361:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2860:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2492:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2689:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2592:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2984:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2598:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3535:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3005:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2814:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2764:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2572:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2592:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2650:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3480:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3019:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3180:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2955:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3150:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2981:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3108:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3377:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2717:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3330:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3016:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2929:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3177:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3004:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3235:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2513:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3024:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3130:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3054:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2666:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2826:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2923:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3159:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2639:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2570:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2801:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2754:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2275:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2667:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2684:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3570:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.3112:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2730:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2926:   3%|▎         | 11/401 [00:10<08:33,  1.32s/it]training loss: 0.2926:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2246:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3657:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3284:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2139:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2158:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2665:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2603:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3354:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2691:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2730:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2573:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2920:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3040:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3323:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3043:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3053:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2745:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3165:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3038:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2794:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2574:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3204:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3573:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2572:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2846:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3140:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3163:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2806:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2573:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2587:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3098:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2788:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2598:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2872:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2433:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3087:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2636:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3002:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3049:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2881:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2715:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.3117:   3%|▎         | 12/401 [00:10<06:33,  1.01s/it]training loss: 0.2670:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3296:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2748:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2629:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3233:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3089:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2972:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2706:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2898:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2619:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2491:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3203:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2825:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2375:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2937:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2721:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2684:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3418:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3055:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2563:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2845:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3210:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2626:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3155:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3457:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2711:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2838:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3139:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2835:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3489:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3277:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2745:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3165:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3172:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2520:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.2566:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3143:   3%|▎         | 12/401 [00:11<06:33,  1.01s/it]training loss: 0.3143:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2540:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3532:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3289:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3401:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2790:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3160:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2975:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2864:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3275:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2859:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2500:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2721:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2605:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2792:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2929:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2382:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3169:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2836:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2989:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3156:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2845:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3118:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2230:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3041:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2360:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2186:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3053:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2933:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3012:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2876:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2758:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2772:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2698:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2900:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3586:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2889:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2370:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2546:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2980:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2790:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3550:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2542:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3271:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2512:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2644:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2854:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2649:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2598:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2532:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2658:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2493:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3258:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2946:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2709:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2866:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2831:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2723:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3409:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3028:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3004:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2945:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2389:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3244:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3189:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3122:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3012:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3073:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2990:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2938:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3201:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2499:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2727:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2739:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3155:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3348:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3092:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2749:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.3018:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2511:   3%|▎         | 13/401 [00:11<05:09,  1.25it/s]training loss: 0.2511:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2909:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2733:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2746:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3017:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2997:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2995:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2734:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3258:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2643:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3039:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3573:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2829:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3049:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2832:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2694:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2590:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3208:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2384:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2728:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3080:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2840:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2397:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2864:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2725:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2690:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3301:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2993:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2572:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2841:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2578:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3012:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2154:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3139:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2402:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2306:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2782:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2902:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2512:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3025:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2921:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2886:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2477:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3106:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2554:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2298:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2432:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2753:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3109:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2644:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3210:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3212:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2611:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3111:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2895:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2898:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2822:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3240:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2904:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2696:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2954:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3463:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2823:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3623:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2950:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2525:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2515:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3072:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2121:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2785:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2634:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3124:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3064:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2612:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3051:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3078:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3471:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3040:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.3121:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2752:   3%|▎         | 14/401 [00:11<04:12,  1.53it/s]training loss: 0.2752:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2343:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2583:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2398:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2475:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2932:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2555:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2499:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2825:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2835:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2913:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2995:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2754:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2449:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3134:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3284:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2922:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2673:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2632:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2393:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3045:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2706:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2849:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3023:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2385:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3163:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2950:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3263:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2686:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2504:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2829:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3534:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2742:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2817:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3081:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2916:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3460:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3385:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2928:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2984:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2086:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2528:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2885:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3003:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2360:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.4150:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3027:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2975:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2584:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2994:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3195:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2828:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2929:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2841:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2969:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3318:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.2772:   4%|▎         | 15/401 [00:11<03:32,  1.81it/s]training loss: 0.3302:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2618:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.3014:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2265:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2942:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.3011:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2821:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2535:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2620:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2677:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.3132:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2716:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2413:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2646:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.3658:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2831:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.3135:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.3130:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2657:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2995:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2735:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.3114:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2878:   4%|▎         | 15/401 [00:12<03:32,  1.81it/s]training loss: 0.2878:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3071:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2904:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2250:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2688:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3187:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2906:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2856:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2951:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3114:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2814:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2943:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2998:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2717:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2716:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3051:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2808:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2507:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2378:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3084:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2471:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2720:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2914:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2883:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2837:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2681:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2331:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2872:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3128:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2905:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2518:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3132:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3558:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3690:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2930:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2270:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2914:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2840:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2796:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3070:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3220:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3013:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2885:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2991:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3170:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2332:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2903:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2478:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2919:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2891:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2473:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2480:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3124:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3219:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2754:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2723:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2659:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3045:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3098:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2838:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2930:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3243:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3154:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2758:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3258:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3071:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2981:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3391:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3590:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3295:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2848:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3516:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3179:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3087:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2941:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2661:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2815:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2443:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.2883:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3526:   4%|▍         | 16/401 [00:12<03:05,  2.08it/s]training loss: 0.3526:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2816:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3045:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2363:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2597:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2717:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3471:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3170:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2356:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2581:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2563:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3113:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2845:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3060:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2988:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2855:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2913:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3881:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2873:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2893:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2978:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2050:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2128:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2954:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3112:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3135:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2959:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2522:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2516:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2600:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3172:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2868:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2719:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3321:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3075:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3134:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3296:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2397:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2563:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3006:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3160:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2614:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3398:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2896:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2799:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2859:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2708:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2554:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2847:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2854:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2403:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2918:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2294:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3375:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2573:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3430:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2949:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2685:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2569:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2724:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3017:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2525:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2969:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2787:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2731:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3445:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2925:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3432:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2538:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2825:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2547:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2649:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2892:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2464:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2598:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.3104:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2956:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2435:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2704:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2451:   4%|▍         | 17/401 [00:12<02:46,  2.31it/s]training loss: 0.2451:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2962:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3713:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2479:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3109:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2365:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2975:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2646:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2601:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2719:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2546:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2396:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3107:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3462:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2704:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2652:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3090:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3048:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2352:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3142:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3106:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2653:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3145:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2528:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2844:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3231:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2724:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2421:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3541:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3242:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2608:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3606:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3101:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2983:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3419:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3555:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2542:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2964:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2768:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2867:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2592:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2594:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2968:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3413:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3194:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2613:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3130:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2811:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2350:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3034:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2738:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2843:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2507:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2670:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3011:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2826:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3041:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3488:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2881:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2664:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2932:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2786:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2950:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2703:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2909:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.2739:   4%|▍         | 18/401 [00:12<02:33,  2.50it/s]training loss: 0.3191:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2641:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2307:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2379:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2912:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.3071:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.3151:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2877:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2528:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.3055:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.3024:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.3419:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2452:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2906:   4%|▍         | 18/401 [00:13<02:33,  2.50it/s]training loss: 0.2906:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3281:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2865:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2448:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2967:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2953:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3073:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2878:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2690:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3187:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3064:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2325:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2654:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2411:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2596:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2237:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2544:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3342:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2802:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2808:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2530:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2630:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2819:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2633:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3242:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2686:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3047:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2970:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2673:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2983:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2544:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2783:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2660:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2508:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2364:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2797:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3105:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2797:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3173:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3245:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2214:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2867:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3052:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2679:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3085:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2891:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2748:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2796:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2558:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3325:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2453:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2913:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3278:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2914:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3282:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2640:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3201:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2813:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2904:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3113:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2744:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3715:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2723:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3202:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3125:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2241:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2915:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2561:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2135:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2731:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3051:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2639:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2685:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2775:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2723:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2486:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2902:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.2612:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3138:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3449:   5%|▍         | 19/401 [00:13<02:23,  2.66it/s]training loss: 0.3449:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2626:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3964:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2514:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2252:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2916:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2951:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2964:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2642:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2764:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3201:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3051:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2129:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2532:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2572:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2490:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2512:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2118:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2940:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.4087:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3178:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3455:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2466:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2791:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3372:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2608:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2897:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2546:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2927:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2394:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2479:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2184:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3002:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3109:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3337:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2516:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2712:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3161:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3019:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2342:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3096:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2648:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2836:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2856:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3144:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2969:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2667:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3227:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3305:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2984:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2429:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2632:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2595:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3032:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2593:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2712:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2877:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2646:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2988:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2980:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2779:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2809:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3233:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2262:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2944:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3452:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2625:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2435:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2858:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2865:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2890:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2884:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2943:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2758:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3169:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3025:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3057:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.2683:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3039:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3801:   5%|▍         | 20/401 [00:13<02:17,  2.77it/s]training loss: 0.3801:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2903:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2801:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2538:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3136:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2931:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3255:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3140:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2957:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3370:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2751:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2802:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2759:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3064:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3174:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3107:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2395:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3313:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2790:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3162:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3109:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2866:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3188:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3033:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2776:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2371:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2410:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2328:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2904:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2874:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2207:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2469:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2717:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2574:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2852:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2831:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3406:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2852:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3226:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2857:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2469:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2900:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2351:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2588:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2149:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2390:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2740:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2320:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2585:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2794:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2872:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2689:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2986:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2524:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2571:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2842:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3198:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2848:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2824:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3191:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2777:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2928:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2905:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2357:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2440:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3307:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2550:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2565:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2461:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2634:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2614:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2184:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2578:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2776:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2700:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2783:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.3523:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2946:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2537:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2994:   5%|▌         | 21/401 [00:16<06:57,  1.10s/it]training loss: 0.2994:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2907:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3059:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3104:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2883:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3011:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2802:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3037:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3502:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3375:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3103:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2845:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2822:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3464:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2770:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3514:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2555:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3583:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3344:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3106:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2266:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2663:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2719:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2525:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3274:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2791:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3090:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2903:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2598:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2734:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2802:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2641:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3329:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2593:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3384:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2649:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2614:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3000:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2936:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2704:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2957:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2487:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2712:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2686:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2869:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2981:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2495:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2732:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2694:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3055:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3137:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2850:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2447:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2903:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3117:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2484:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3370:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2793:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2948:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3234:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.2877:   5%|▌         | 22/401 [00:16<05:55,  1.07it/s]training loss: 0.3724:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2715:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2746:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2896:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.3103:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2667:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2943:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2728:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.3445:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2890:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2772:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2224:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2565:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.3837:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2191:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.2839:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.3672:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.3213:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.3159:   5%|▌         | 22/401 [00:17<05:55,  1.07it/s]training loss: 0.3159:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2554:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2479:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3664:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2739:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2413:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2701:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2377:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3342:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2685:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2874:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3453:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2908:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3220:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2994:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2804:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2640:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3165:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2705:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2356:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3090:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2748:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2819:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2346:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2727:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2546:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3070:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3096:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2805:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3538:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2464:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2566:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2780:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2828:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3049:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3426:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3399:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2569:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2956:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2789:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2561:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2576:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3179:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2415:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3845:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2861:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2441:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3284:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2988:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2812:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2867:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3511:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2830:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2680:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3267:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2410:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2999:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3075:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3155:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2884:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2611:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2869:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2557:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2794:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2969:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2573:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3248:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3037:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2900:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3069:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3313:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2625:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3545:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2790:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2905:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3060:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2943:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2320:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.2807:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3142:   6%|▌         | 23/401 [00:17<04:43,  1.33it/s]training loss: 0.3142:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3134:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2856:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2782:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2862:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2850:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2521:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3159:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3046:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2278:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2928:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3047:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2522:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2656:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2502:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3010:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2775:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2756:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2605:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3085:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3160:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2343:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2367:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2853:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2614:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2807:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2445:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2696:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3381:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2547:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2683:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2976:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3196:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2731:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3152:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2530:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2896:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2756:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2728:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3113:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2897:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2583:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2648:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2702:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2530:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3188:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2341:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2906:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2969:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3075:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3331:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3659:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2653:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2936:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2625:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2708:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2897:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2730:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2678:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2619:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2808:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2703:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3019:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2867:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2953:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2741:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2936:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2170:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3149:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3025:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3065:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2571:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2564:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2999:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.3346:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2875:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2653:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2674:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.2608:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.4335:   6%|▌         | 24/401 [00:17<03:52,  1.62it/s]training loss: 0.4335:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2852:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2621:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2633:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2720:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3435:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2895:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2645:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2525:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2548:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3064:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2667:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2481:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3089:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2671:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2822:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2630:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2579:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2955:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3104:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2756:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2688:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3035:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2687:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2795:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2862:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2617:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2704:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3518:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3063:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2469:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2726:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2640:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2854:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2871:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3364:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2698:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2964:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2677:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2705:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2788:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2770:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3113:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2946:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3016:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3089:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3112:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2763:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2756:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2685:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3060:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2735:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2575:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2461:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2793:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2820:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3326:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2675:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2659:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2992:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2983:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2299:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3656:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2539:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3110:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3044:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2909:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2684:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2802:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3363:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.1982:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2635:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.4445:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2623:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2637:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3018:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2913:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2823:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.2712:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3692:   6%|▌         | 25/401 [00:17<03:16,  1.91it/s]training loss: 0.3692:   6%|▋         | 26/401 [00:17<02:51,  2.19it/s]training loss: 0.2860:   6%|▋         | 26/401 [00:17<02:51,  2.19it/s]training loss: 0.2624:   6%|▋         | 26/401 [00:17<02:51,  2.19it/s]training loss: 0.2845:   6%|▋         | 26/401 [00:17<02:51,  2.19it/s]training loss: 0.2892:   6%|▋         | 26/401 [00:17<02:51,  2.19it/s]training loss: 0.2590:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2707:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3080:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2967:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2930:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3357:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2806:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3094:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2836:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3356:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2106:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2504:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3415:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3736:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2617:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3080:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3083:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2515:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2779:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2537:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3074:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2830:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2762:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2576:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2282:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3248:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2636:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2628:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2749:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2656:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2904:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2414:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3003:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3105:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3045:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2846:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3154:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2512:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2233:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2590:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2651:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3553:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2482:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3529:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3597:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2287:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2661:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2696:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2813:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3083:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3250:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2894:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3469:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3127:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2653:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2644:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2608:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3052:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2942:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2521:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2618:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2834:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2768:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2401:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3458:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2949:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2483:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3072:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3222:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2400:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3072:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3093:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.3041:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.2613:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.5369:   6%|▋         | 26/401 [00:18<02:51,  2.19it/s]training loss: 0.5369:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3176:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2531:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2663:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2764:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2853:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2731:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2687:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2586:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3058:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2441:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2581:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2785:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3544:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2945:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2892:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2820:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3012:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2926:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2954:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2533:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2525:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2875:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3367:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3558:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3174:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2899:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2871:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2568:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3293:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2193:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2964:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3124:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2422:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2947:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2584:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3235:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2966:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3019:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2892:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2757:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2649:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2643:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3194:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2781:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2809:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2655:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2241:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2540:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2928:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3346:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2638:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2540:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3017:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3324:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3096:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2969:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2763:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2985:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2790:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3007:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2658:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2790:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2779:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3172:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3427:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2702:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2724:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2369:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2565:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3269:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3562:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3314:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3109:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2910:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2749:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.2981:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3201:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.3405:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.1673:   7%|▋         | 27/401 [00:18<02:34,  2.43it/s]training loss: 0.1673:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2706:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2352:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2751:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3119:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2601:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2510:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2315:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3374:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3293:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2775:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2450:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3094:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2623:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2868:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3411:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2625:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2463:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3396:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3025:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2908:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3393:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3009:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2511:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2565:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2997:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3077:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2879:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2432:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2804:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3004:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2881:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2779:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2684:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2262:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2772:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3370:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3220:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2905:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2633:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2322:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2533:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3316:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2481:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3084:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3012:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2946:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2090:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2666:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3029:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3132:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3144:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2534:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2976:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3101:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3343:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3213:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2930:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2968:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2808:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3083:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2829:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2445:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2907:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3186:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3117:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2850:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2794:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3092:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3119:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2616:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2808:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2618:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3029:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2619:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3247:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2681:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.2857:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.3184:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.1945:   7%|▋         | 28/401 [00:18<02:21,  2.63it/s]training loss: 0.1945:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3023:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3138:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3280:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3415:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2596:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3426:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2793:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2919:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3686:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2762:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2778:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3266:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3200:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2716:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2672:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2979:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2913:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3192:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3248:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.3148:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2826:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2307:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2531:   7%|▋         | 29/401 [00:18<02:13,  2.79it/s]training loss: 0.2301:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.1986:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2823:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2703:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3108:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3364:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3051:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3485:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2795:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2832:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2725:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2515:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2453:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2517:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3214:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3042:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2805:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3180:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2926:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2547:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2514:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2650:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2957:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2517:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2861:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2771:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3068:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2627:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2803:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2593:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3148:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3052:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2638:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2734:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3601:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2702:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3118:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3422:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2328:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2803:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3412:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2914:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2779:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2839:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3264:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2515:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2908:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2874:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3124:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2721:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2795:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2645:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2715:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2635:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.2629:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3279:   7%|▋         | 29/401 [00:19<02:13,  2.79it/s]training loss: 0.3279:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2580:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2636:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2861:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2816:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3030:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2987:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3026:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3446:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2842:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2922:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3118:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2473:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2781:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3483:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2817:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2993:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3257:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2590:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2352:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3036:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2525:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2450:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3120:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3277:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2555:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2653:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2849:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2932:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3230:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2573:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2966:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2850:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2787:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3309:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3549:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2936:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3012:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2534:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2638:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2661:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3000:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2539:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2633:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3423:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3186:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2836:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2860:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2547:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2760:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3457:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2386:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3473:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3401:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3292:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3289:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2940:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2819:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3062:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3202:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2707:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3211:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2727:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3404:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2747:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3108:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2680:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2723:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2977:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2543:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2337:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2983:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2233:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2722:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2775:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2469:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2902:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.3097:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.2676:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.1875:   7%|▋         | 30/401 [00:19<02:08,  2.89it/s]training loss: 0.1875:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.3457:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.2577:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.3240:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.2329:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.2806:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.3152:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.3022:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.2842:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.3033:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.2486:   8%|▊         | 31/401 [00:21<06:32,  1.06s/it]training loss: 0.2874:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2246:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2864:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2854:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3270:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2640:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2280:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2729:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3612:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2972:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3423:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3337:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3011:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3032:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3393:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3074:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2469:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3576:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2740:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3284:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2932:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2806:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2735:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3339:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2626:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3004:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3178:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3141:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2835:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2974:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3031:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2572:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3421:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2436:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2626:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2776:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2953:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2977:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2554:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3437:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3345:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3097:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3754:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2881:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3106:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2788:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3050:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2516:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2917:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3380:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2525:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3209:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3182:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3068:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3024:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2967:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3156:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2594:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.3250:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2769:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2620:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2801:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2574:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2964:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2866:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2679:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2568:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.2551:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.1966:   8%|▊         | 31/401 [00:22<06:32,  1.06s/it]training loss: 0.1966:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2826:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2556:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2785:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2274:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2492:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3417:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2570:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2857:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3345:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2268:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3164:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3090:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3009:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2789:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3081:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2909:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2893:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2257:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3340:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2841:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2767:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3082:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3391:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2928:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3207:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3117:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2866:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3359:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2797:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2980:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2847:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2349:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2855:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2390:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2812:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2718:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2345:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2963:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2801:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2810:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2621:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2811:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2880:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2797:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2793:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2274:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3086:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2633:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2334:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3190:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3111:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2987:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2802:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3160:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2834:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3097:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3285:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2923:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2779:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2674:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3378:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2298:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2559:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2188:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2823:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3480:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2581:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2472:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3005:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3171:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2965:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2729:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2718:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3000:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2894:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2796:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2698:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.2497:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3111:   8%|▊         | 32/401 [00:22<05:08,  1.20it/s]training loss: 0.3111:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2778:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2881:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2588:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3302:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3180:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2645:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2983:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3039:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2894:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2790:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2910:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2859:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3312:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2193:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2760:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2615:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2964:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3738:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3025:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2877:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2840:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3128:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2498:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3341:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3231:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3087:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2262:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3130:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2936:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2734:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2616:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2525:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2869:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2937:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3322:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2543:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3001:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2782:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2833:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2581:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3055:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2579:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3010:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2835:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2465:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2530:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2791:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3127:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2945:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3045:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2290:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3077:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2954:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2468:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2897:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2944:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2581:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2369:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3305:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2404:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2574:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2895:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2757:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3648:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2679:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3435:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2447:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3614:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2684:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2517:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2710:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2900:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3020:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.3494:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2365:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2251:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2760:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2384:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2010:   8%|▊         | 33/401 [00:22<04:08,  1.48it/s]training loss: 0.2010:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2929:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3187:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3249:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3066:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2924:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3123:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2333:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3490:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3219:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3302:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2604:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2768:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2914:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2860:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2850:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2394:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2648:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2876:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2993:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2528:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2894:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2367:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2893:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2854:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3154:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2828:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3343:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.1949:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3384:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2498:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3148:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.3080:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2918:   8%|▊         | 34/401 [00:22<03:27,  1.77it/s]training loss: 0.2396:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2891:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3226:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2868:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2329:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3224:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2423:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2919:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2456:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2615:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2715:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2430:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3075:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2941:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2494:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2825:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2813:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2732:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3206:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2520:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3166:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2817:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3222:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2504:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3798:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3280:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3490:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3197:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3115:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2665:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2728:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2672:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2974:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2668:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2594:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2324:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3069:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2496:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.1867:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2290:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2971:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3404:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2721:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2742:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.3487:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2527:   8%|▊         | 34/401 [00:23<03:27,  1.77it/s]training loss: 0.2527:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2731:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3008:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2634:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3216:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2483:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3144:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2351:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2511:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3202:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3441:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2597:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2541:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2453:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2193:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2473:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2714:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2856:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3276:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2621:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2772:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2981:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2970:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3124:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2903:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2928:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2938:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2857:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2410:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2881:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2927:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2907:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2883:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2313:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3259:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2762:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2473:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2461:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2485:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3002:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3069:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2746:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2658:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2693:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2920:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3147:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2607:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2910:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2140:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2853:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2403:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2626:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2926:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2541:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2372:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2972:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3379:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2582:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2580:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2706:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3292:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2736:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2692:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2897:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2184:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2737:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3054:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3547:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2872:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2784:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2478:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2789:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3313:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2155:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3027:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3095:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2610:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.2835:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.3088:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.0900:   9%|▊         | 35/401 [00:23<02:58,  2.05it/s]training loss: 0.0900:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2633:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3208:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2697:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2827:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2882:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2168:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2929:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2495:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2924:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2853:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2808:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2508:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2423:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3030:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2529:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2463:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2804:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2991:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2875:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2935:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2674:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2628:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2463:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3157:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2853:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2648:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2522:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2281:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3041:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2506:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2479:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2905:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2859:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2627:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2819:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2795:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2961:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2791:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3276:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2646:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2951:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3386:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2944:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3000:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2310:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2941:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2845:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2899:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3063:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2724:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2936:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2976:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3102:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2251:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3076:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3321:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2746:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3473:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3267:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2531:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2328:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2653:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2710:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2239:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3130:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3306:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2938:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3291:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2661:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2477:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2535:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2935:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2725:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2807:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2837:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2537:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.2653:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.3053:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.1270:   9%|▉         | 36/401 [00:23<02:39,  2.29it/s]training loss: 0.1270:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2673:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2600:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2530:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2951:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2406:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2579:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2965:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2551:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3187:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2826:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2969:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2776:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3005:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3012:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3143:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2907:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2637:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3000:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2713:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2445:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3061:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2601:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3056:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2864:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2704:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2530:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2317:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3050:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.3070:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2824:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2064:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2623:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2474:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2628:   9%|▉         | 37/401 [00:23<02:31,  2.41it/s]training loss: 0.2521:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2479:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2473:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2792:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2319:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2547:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2478:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2794:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3048:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2442:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3083:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2273:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2856:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2535:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2746:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3272:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2611:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3290:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2458:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2733:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2773:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2202:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2936:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2705:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2826:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2957:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2863:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3194:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2432:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2207:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2762:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2959:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3445:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2578:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2665:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3082:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2652:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2915:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2571:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2857:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2374:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3440:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.3261:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2735:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2721:   9%|▉         | 37/401 [00:24<02:31,  2.41it/s]training loss: 0.2721:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2734:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2371:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2898:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3010:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2556:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2872:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2799:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2755:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2706:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2727:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2356:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3015:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2731:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3074:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2351:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2312:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2806:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2363:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2987:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2722:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3142:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2848:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3061:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2211:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3119:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2982:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3036:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2841:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2489:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2700:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2998:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2639:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2188:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2596:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2482:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2723:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2323:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3246:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3020:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2374:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3014:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2368:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3016:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2361:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2975:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2816:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2814:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2357:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2478:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2846:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2882:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2233:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3232:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2506:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2594:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2425:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2731:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2920:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2683:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2605:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2978:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2737:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2755:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2936:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2617:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3444:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2577:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2508:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2967:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2738:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2933:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2759:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3340:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2962:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3232:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3451:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.3340:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.2567:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.1734:   9%|▉         | 38/401 [00:24<02:20,  2.59it/s]training loss: 0.1734:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2640:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2933:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2961:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3037:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3498:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2797:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2809:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2587:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2863:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3003:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2804:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2793:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2589:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2775:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2551:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3032:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2875:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2440:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3197:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2893:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3038:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3067:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2734:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2484:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2709:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2961:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2229:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2592:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3125:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2849:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3537:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2925:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3583:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2619:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3736:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2778:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3318:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2964:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2831:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2802:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2845:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2967:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3192:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2279:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2472:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2776:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2614:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2518:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2394:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2987:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2842:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3058:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2690:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3260:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3261:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3272:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2795:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2707:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3150:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2802:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2859:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3125:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2805:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2872:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2854:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3020:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2393:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3405:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2440:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2227:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3038:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2572:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3065:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3020:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2491:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2608:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.2699:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3135:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3323:  10%|▉         | 39/401 [00:24<02:11,  2.75it/s]training loss: 0.3323:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2734:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3106:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3410:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2720:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2774:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2848:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2815:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3182:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2694:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3312:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2833:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2518:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3242:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2242:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3116:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3276:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3052:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2764:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2811:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2328:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3139:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2567:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2992:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2594:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2587:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3144:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2438:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2811:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2528:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2603:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3136:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3026:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3048:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2638:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3069:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2776:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2469:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3949:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2971:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3131:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2780:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3300:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2780:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.3010:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2758:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2882:  10%|▉         | 40/401 [00:24<02:06,  2.85it/s]training loss: 0.2622:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3012:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2816:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2275:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2640:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2843:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2391:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2635:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3526:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3038:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2878:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3308:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2795:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2536:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3066:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2569:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2977:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3084:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2825:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3199:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2671:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2713:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2889:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2639:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3049:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2689:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2469:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3523:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3172:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.3566:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2322:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2868:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2027:  10%|▉         | 40/401 [00:25<02:06,  2.85it/s]training loss: 0.2027:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2452:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3025:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2916:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2912:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3005:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2691:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2646:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2451:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2484:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2529:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3546:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3047:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3213:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2725:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3380:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3301:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3221:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2570:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3091:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2526:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2691:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2559:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2661:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2723:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2794:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3057:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3409:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2511:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2858:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2719:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2671:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2821:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2725:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3274:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2350:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2688:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2434:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2902:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2712:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2843:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2604:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2803:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2910:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2237:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2817:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2777:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3242:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3304:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3057:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2432:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2250:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2905:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2335:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2514:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3447:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2789:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2335:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2746:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2722:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3097:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2844:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3314:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2802:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2283:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2823:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2534:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3584:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2613:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2739:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2280:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2736:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3248:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3096:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2728:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.3218:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2725:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2887:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2766:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2540:  10%|█         | 41/401 [00:27<06:31,  1.09s/it]training loss: 0.2540:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2399:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.3202:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.3147:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2466:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2575:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2424:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2916:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.3057:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2612:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.3290:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2786:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2953:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2370:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.3051:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2285:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2532:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2620:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2791:  10%|█         | 42/401 [00:27<05:06,  1.17it/s]training loss: 0.2583:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2733:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3471:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2828:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2807:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2809:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2856:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2972:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2737:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2835:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3421:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3668:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2863:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2549:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2943:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2233:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3047:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2171:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2896:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2942:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3399:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2505:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2467:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3163:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3356:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3073:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2315:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2450:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2889:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3065:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2639:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2690:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3735:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2859:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3060:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2420:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2884:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2764:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2795:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3135:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2527:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2873:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3208:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2750:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2424:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3031:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3027:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3607:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2799:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3119:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2535:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2720:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2777:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2513:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3183:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2833:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2764:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2701:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3174:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.2771:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3004:  10%|█         | 42/401 [00:28<05:06,  1.17it/s]training loss: 0.3004:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2017:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2807:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2857:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2597:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3021:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3120:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3024:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2925:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2823:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2814:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2744:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2757:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3156:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2934:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2370:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2646:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3169:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3332:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2906:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2865:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3246:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2751:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2930:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2652:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2653:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3565:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2398:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3056:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2452:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3150:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2739:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2983:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2474:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3038:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3012:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2931:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2710:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3070:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2938:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3035:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3091:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2718:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3014:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2422:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3034:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2787:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2871:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3139:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2589:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2560:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2778:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2812:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2693:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2509:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3099:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3253:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2873:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2571:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3007:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2631:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2622:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2456:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2754:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2847:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3022:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3257:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3309:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2762:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2612:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2476:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2980:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2474:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2051:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3676:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2590:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2566:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2672:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.2468:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3759:  11%|█         | 43/401 [00:28<04:07,  1.45it/s]training loss: 0.3759:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2582:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2593:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3057:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2425:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3187:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2325:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3047:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2959:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2691:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2696:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3062:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2823:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3118:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3785:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3232:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2549:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2803:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3714:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2691:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2785:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3376:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2962:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2238:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2991:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3299:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2504:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2497:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2815:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2479:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2763:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2635:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3172:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2465:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2840:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2556:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2686:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3135:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2945:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2608:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2950:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2899:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2455:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2709:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3373:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3008:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2890:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2714:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2878:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3010:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2663:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2589:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2633:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2964:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3431:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2744:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2983:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2833:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2536:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2692:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2480:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2182:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3072:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2937:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2764:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2907:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3013:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2781:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2948:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3029:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2815:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3072:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2488:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2798:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2482:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2822:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2583:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.2969:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.3791:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.1954:  11%|█         | 44/401 [00:28<03:25,  1.74it/s]training loss: 0.1954:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3288:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3243:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3454:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2914:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3719:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2558:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2371:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3156:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2656:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3125:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2736:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2852:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2569:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3133:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3495:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2318:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2466:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2886:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3016:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3426:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2968:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2724:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3306:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3801:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2628:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2864:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2345:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3530:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2538:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3536:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2500:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2882:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3112:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2677:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.3224:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2813:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2838:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2882:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2436:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2347:  11%|█         | 45/401 [00:28<02:55,  2.03it/s]training loss: 0.2933:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2352:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3055:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2399:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2597:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2402:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2577:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2935:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2610:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2828:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2706:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2517:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3769:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3426:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2617:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2503:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2906:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3008:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2778:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2304:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2963:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3145:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2811:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2857:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2800:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3378:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2609:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2234:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3572:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2612:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2434:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2709:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2410:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2953:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2442:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.2706:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3128:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.3225:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.1517:  11%|█         | 45/401 [00:29<02:55,  2.03it/s]training loss: 0.1517:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2708:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2933:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2844:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2381:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2721:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2243:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3051:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2444:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2907:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2189:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2643:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3784:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2439:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2742:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2647:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3228:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2213:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2932:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2926:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3221:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2286:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2945:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3178:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3229:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3354:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3033:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2749:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2770:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3073:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3344:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2907:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3015:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3088:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2491:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2283:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2605:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2950:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2711:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3285:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2523:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3121:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2505:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3018:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2864:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3200:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3134:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3478:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2864:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3423:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2323:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2792:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2762:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2904:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2530:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2095:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3255:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2431:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2826:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2793:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2859:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3019:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2686:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3744:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2635:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2550:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2932:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2454:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2597:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2470:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3120:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2446:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2507:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2364:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.3229:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2737:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2942:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2570:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2432:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2295:  11%|█▏        | 46/401 [00:29<02:34,  2.29it/s]training loss: 0.2295:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3328:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3460:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3272:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2759:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2587:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3048:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2606:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3079:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3348:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3997:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3132:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3055:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2527:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2385:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3311:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3349:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2683:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3507:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2843:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2795:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3065:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3086:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2699:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2929:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2772:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3097:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2446:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2150:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2686:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2900:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3310:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2696:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2928:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2503:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2626:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3082:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2858:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3134:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2226:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3661:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2813:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2676:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2746:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2529:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2866:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3121:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3028:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2792:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2923:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2693:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2945:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3005:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2837:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3139:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2138:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2928:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2950:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3091:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2748:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2815:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2404:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2965:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3076:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2321:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2895:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2410:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2857:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2781:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3296:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3124:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2902:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2707:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3124:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3426:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2261:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2705:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2834:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.2699:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3166:  12%|█▏        | 47/401 [00:29<02:20,  2.53it/s]training loss: 0.3166:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3167:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2729:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3052:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2736:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3374:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3602:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2976:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3060:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2479:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2725:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2378:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2841:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2950:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2827:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3204:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2574:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2355:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2445:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2843:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2332:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3279:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3001:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2516:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3077:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3011:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3220:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2599:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3532:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2884:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.1982:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2843:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3097:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2457:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3427:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3267:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2948:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3488:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2838:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2809:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3038:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2778:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2449:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2919:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2841:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3077:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2878:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2964:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2861:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2166:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2498:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2688:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3110:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2910:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2394:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2979:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3254:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.2832:  12%|█▏        | 48/401 [00:29<02:11,  2.68it/s]training loss: 0.3177:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2418:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2377:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2527:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2719:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2912:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.3394:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2885:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.3005:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.3023:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2793:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2932:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2953:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.3055:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2805:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2950:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2970:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2445:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2808:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2888:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.2852:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.3417:  12%|█▏        | 48/401 [00:30<02:11,  2.68it/s]training loss: 0.3417:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3453:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2499:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2803:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2867:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3063:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2610:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3103:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2790:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2847:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2410:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3343:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2482:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3161:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2797:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2786:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3533:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2694:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3106:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2650:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3043:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2854:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2767:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3220:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3067:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2786:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3704:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3213:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2702:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3614:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2595:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2707:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2981:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2703:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2407:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3311:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2692:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2318:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2618:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3217:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2667:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2364:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2766:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3446:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2406:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2824:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3019:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3397:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2663:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2993:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2287:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2544:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2589:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2733:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2669:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2770:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2928:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3214:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2254:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2588:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3407:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2825:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3047:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2743:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3331:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2813:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2743:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3162:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2993:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3172:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2949:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3079:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3286:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3844:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2509:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2556:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3177:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.3258:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2786:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2906:  12%|█▏        | 49/401 [00:30<02:05,  2.80it/s]training loss: 0.2906:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2444:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3049:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2893:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2589:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2585:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2525:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3354:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2940:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2824:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2308:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2906:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2729:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2977:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3030:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2855:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2983:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3001:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2323:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2811:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2538:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2423:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2919:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3305:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2919:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2575:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2705:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3091:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3155:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2741:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3029:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2801:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3036:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2839:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2839:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2626:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2602:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2734:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2647:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2809:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3343:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2410:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2683:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3256:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3563:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2862:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3410:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2689:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2788:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2260:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2757:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2808:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3290:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2579:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2861:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2811:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3088:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2572:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3081:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2872:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3063:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2535:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2819:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2352:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2047:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2471:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2590:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2908:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2850:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2733:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2256:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2749:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2470:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3373:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3121:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2960:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2678:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2511:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.3048:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2688:  12%|█▏        | 50/401 [00:30<02:00,  2.92it/s]training loss: 0.2688:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2364:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2719:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3188:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2969:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2467:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2707:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2504:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3120:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3166:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2806:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2575:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2609:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2555:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2444:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2975:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2676:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3214:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2766:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2876:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2787:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2565:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2356:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2897:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3023:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3022:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2929:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2843:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2825:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2730:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2274:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2505:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2894:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2787:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2623:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2439:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2585:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2757:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2187:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2453:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2585:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2839:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2980:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2292:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2894:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2932:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2560:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3163:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2547:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2309:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3115:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2964:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2941:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2799:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2834:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2470:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2758:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3019:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3028:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3134:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2908:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3259:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3173:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2856:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3217:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3051:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2942:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3178:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3637:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2958:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2775:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2726:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2807:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2494:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2442:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2732:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2836:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.2778:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.3111:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.1885:  13%|█▎        | 51/401 [00:33<06:15,  1.07s/it]training loss: 0.1885:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3113:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2692:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2799:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3347:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2766:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3275:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3288:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2427:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2373:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2819:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2951:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2729:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2867:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2083:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2244:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2267:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3323:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3010:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2669:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2786:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2925:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2730:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2751:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2819:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2781:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3306:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2472:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2254:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3251:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3113:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3247:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2422:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2631:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2287:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2762:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2552:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2981:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2888:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3020:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3058:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2272:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2324:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2526:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3197:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2564:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3187:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3350:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2815:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2880:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2922:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2637:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2337:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2692:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3027:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3220:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3125:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2935:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2635:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2551:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2622:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2713:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3117:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2667:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3235:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3079:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3551:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2805:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3130:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3085:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2832:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3280:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2705:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2460:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2816:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3299:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2617:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2572:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.2939:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3195:  13%|█▎        | 52/401 [00:33<04:56,  1.18it/s]training loss: 0.3195:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2466:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2595:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2497:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3462:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2689:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2614:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3007:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2838:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2907:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2823:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2317:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3472:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2925:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2587:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2608:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2993:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2938:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2855:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2887:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3554:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2538:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2565:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2722:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2735:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2866:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3011:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2736:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3103:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3223:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3391:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2697:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2509:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2983:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2792:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3304:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2323:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3160:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2464:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3366:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2931:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2933:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2676:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2878:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.3165:  13%|█▎        | 53/401 [00:33<04:00,  1.45it/s]training loss: 0.2504:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2445:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2677:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2608:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3436:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2371:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2494:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2382:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2889:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2941:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2964:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2805:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3117:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3198:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3282:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3344:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3354:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2909:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2535:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2525:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2714:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2363:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3122:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2656:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2965:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3364:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3014:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3065:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3198:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3222:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2453:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2476:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3219:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2471:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.1854:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.1854:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2488:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2610:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2942:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2822:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3062:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2601:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2523:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2544:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2316:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2686:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2730:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2321:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2296:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2758:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2413:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2357:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3070:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2454:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2401:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2707:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2967:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2174:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2660:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3626:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2536:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2748:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2814:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2601:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3170:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2756:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3561:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2897:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3039:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2497:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2572:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2196:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2769:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2278:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3535:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2738:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3158:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3218:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2825:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3204:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2866:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2839:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2304:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2887:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3401:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2493:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2427:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2573:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3120:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2993:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3152:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3293:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2772:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2285:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3570:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2876:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3294:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2799:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3034:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3028:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3225:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2758:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2605:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3128:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2457:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2967:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2228:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3208:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2809:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2539:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2820:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2500:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2669:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.2450:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3506:  13%|█▎        | 54/401 [00:34<03:20,  1.73it/s]training loss: 0.3506:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3018:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3127:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2442:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3463:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3120:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2630:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2519:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3113:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3655:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2342:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3076:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2840:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3666:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2497:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.4190:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2530:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2761:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2498:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2731:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3765:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3342:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3341:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2690:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2146:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2694:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2439:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2615:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2643:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2607:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2414:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2667:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3021:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3063:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2968:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3222:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2956:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3184:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2966:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3098:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3171:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3002:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3296:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2410:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2614:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2431:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3157:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3005:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3001:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2768:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2596:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3310:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2937:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2427:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3130:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2543:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2462:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2477:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3477:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2565:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2651:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2550:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3347:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2613:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2366:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2827:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3588:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2566:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2802:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2788:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2395:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3133:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2844:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2958:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2697:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2588:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2660:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3413:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.2581:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3425:  14%|█▎        | 55/401 [00:34<02:52,  2.01it/s]training loss: 0.3425:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3100:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2895:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2642:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3116:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3123:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2854:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3540:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2690:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3191:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2898:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2653:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2752:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2808:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2936:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3116:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2544:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2804:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2253:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2678:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3260:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2658:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2865:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2982:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2841:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2690:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2539:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2195:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2821:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3155:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2906:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2632:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2484:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2808:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2770:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3194:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2701:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2578:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3043:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2847:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2829:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2963:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3253:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2975:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3033:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2558:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2537:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3106:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3034:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2462:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2383:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2277:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2955:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2017:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2939:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2873:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2912:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.3925:  14%|█▍        | 56/401 [00:34<02:33,  2.25it/s]training loss: 0.2817:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2549:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2789:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2630:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.3203:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.3333:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2715:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2395:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2669:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2684:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2544:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2769:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.3084:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2758:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2657:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2814:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2206:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2653:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2610:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2635:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2948:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2918:  14%|█▍        | 56/401 [00:35<02:33,  2.25it/s]training loss: 0.2918:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3342:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2950:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2780:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2535:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2557:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2266:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3177:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3152:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3274:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3070:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2963:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2815:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3137:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2785:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2371:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2487:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3027:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2728:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3151:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2533:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2640:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2337:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2802:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2116:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2872:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2862:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2931:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3586:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2295:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3035:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2539:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3815:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2492:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2806:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2431:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3023:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2230:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3244:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3188:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3333:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2885:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2923:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2571:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2544:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2375:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3221:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2907:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2564:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2617:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3069:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2634:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2752:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2946:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3063:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2273:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2935:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3111:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2499:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2748:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2849:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2871:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2961:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2259:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2343:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2920:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3414:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3135:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2927:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3519:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2830:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2679:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2822:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3641:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3110:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2483:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3369:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3375:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.2443:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3644:  14%|█▍        | 57/401 [00:35<02:21,  2.44it/s]training loss: 0.3644:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2938:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3112:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2806:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2896:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3534:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2532:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2856:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3202:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2835:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3088:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2990:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2494:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3118:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2617:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2495:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2370:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2413:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2411:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3458:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2433:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2701:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2949:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2152:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2308:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2351:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2562:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3567:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2836:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2521:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3119:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3268:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2575:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2268:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2707:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3125:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2981:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2771:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2489:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2595:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2458:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2899:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2762:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2223:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2315:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3422:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2674:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2758:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3359:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2144:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3449:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2228:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2764:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2915:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3625:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3423:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2771:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2564:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3134:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2210:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2890:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3124:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2998:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2467:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2749:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2823:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2870:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2455:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2938:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3144:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2616:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2580:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2984:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3115:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3120:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2256:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2873:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.2914:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3109:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3143:  14%|█▍        | 58/401 [00:35<02:12,  2.60it/s]training loss: 0.3143:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2417:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2121:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2623:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3020:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3363:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3293:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3011:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2689:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3025:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3092:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3314:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3317:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3339:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3600:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2734:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2859:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2754:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2396:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2905:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2971:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3118:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2837:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2317:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2774:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2394:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3112:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2650:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2806:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3074:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2945:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3282:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2700:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3403:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2521:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2234:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3209:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2647:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2552:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2865:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2404:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2531:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.1956:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2910:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2583:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2748:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3126:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2518:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2512:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2317:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3338:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2490:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2769:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2923:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2717:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3052:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2513:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2962:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2842:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2460:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2853:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2550:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3088:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.2772:  15%|█▍        | 59/401 [00:35<02:05,  2.73it/s]training loss: 0.3484:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.3081:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2410:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2689:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.3076:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.3292:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.3108:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.3374:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2694:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.3240:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2497:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2912:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2929:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2956:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2381:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2759:  15%|█▍        | 59/401 [00:36<02:05,  2.73it/s]training loss: 0.2759:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3565:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3025:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3016:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3263:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2467:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2798:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2062:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2827:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2508:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2600:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2725:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2844:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2798:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2280:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2529:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2878:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2783:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3128:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2656:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2313:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2791:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2562:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3035:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2768:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2912:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3223:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2822:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2559:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2578:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2548:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2999:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2802:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2660:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2166:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2493:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2777:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3147:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2760:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2736:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2895:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2217:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2769:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3188:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2360:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3070:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2671:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2870:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2792:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3063:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2539:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2127:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2477:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2926:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2845:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2726:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3225:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2793:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2230:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2665:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3020:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2882:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3104:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2586:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2644:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2843:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2675:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2654:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3038:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3029:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3179:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.3173:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2864:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2342:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2286:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2773:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2975:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2783:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2429:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2413:  15%|█▍        | 60/401 [00:36<01:59,  2.85it/s]training loss: 0.2413:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2991:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2875:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2661:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3733:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2674:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2426:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2616:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2755:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3335:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2493:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2634:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2688:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2721:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2831:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2734:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2939:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2863:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2994:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2350:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3046:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2581:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2791:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3128:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2777:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2768:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2857:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3410:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2376:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2967:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2884:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2861:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2793:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2514:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2770:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3016:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3168:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3069:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2827:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2379:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3145:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2492:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2756:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3088:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2501:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2735:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2848:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2825:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3281:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3360:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3067:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2857:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3174:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2745:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2778:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2936:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2925:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3492:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2699:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3167:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2283:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2929:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2657:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3552:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3178:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2845:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3268:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2962:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2571:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3158:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2788:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3214:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2877:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3170:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.3028:  15%|█▌        | 61/401 [00:38<05:54,  1.04s/it]training loss: 0.2428:  15%|█▌        | 61/401 [00:39<05:54,  1.04s/it]training loss: 0.2530:  15%|█▌        | 61/401 [00:39<05:54,  1.04s/it]training loss: 0.2525:  15%|█▌        | 61/401 [00:39<05:54,  1.04s/it]training loss: 0.2762:  15%|█▌        | 61/401 [00:39<05:54,  1.04s/it]training loss: 0.2437:  15%|█▌        | 61/401 [00:39<05:54,  1.04s/it]training loss: 0.2437:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2219:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3288:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2399:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2793:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2581:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3102:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2688:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3095:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2928:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3152:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2342:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2622:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2917:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3013:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2174:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3017:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2977:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2832:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3630:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2594:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2812:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2605:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3868:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2807:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3227:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2618:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2196:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3025:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2861:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2773:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2838:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3265:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2857:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3136:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3029:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2379:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2829:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3220:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2984:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3037:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3178:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2428:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3016:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3137:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3066:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2845:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2505:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2387:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2819:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3054:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3170:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2783:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2463:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2716:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2508:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3190:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2231:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2849:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2562:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2786:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3517:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2872:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3100:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2755:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2681:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3008:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2911:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3490:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2709:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3403:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2671:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2843:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2803:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2528:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2868:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.2705:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3154:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.3351:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.4136:  15%|█▌        | 62/401 [00:39<04:38,  1.22it/s]training loss: 0.4136:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3026:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3220:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2550:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2511:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2582:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2784:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3197:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2517:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2827:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2663:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2566:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2990:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2940:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2673:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.1975:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2710:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2434:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2880:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3000:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2688:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2536:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2897:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3173:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2653:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2481:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2560:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2840:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2536:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2940:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2825:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3125:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2909:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3041:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3171:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2834:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2255:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2371:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2640:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3116:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2736:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2199:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2710:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2695:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2851:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2577:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2435:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2450:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2727:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3060:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2854:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2790:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2686:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3128:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3084:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2394:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2582:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2478:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2495:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3089:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2580:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2639:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2792:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3043:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2885:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3043:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3529:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3225:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2316:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2714:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2978:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2926:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3048:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2914:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2857:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3164:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2597:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2787:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.2752:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3794:  16%|█▌        | 63/401 [00:39<03:45,  1.50it/s]training loss: 0.3794:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2678:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2874:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3038:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2679:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2301:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3009:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2688:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2950:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3031:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2851:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3012:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2550:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3110:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3127:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2812:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3022:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2841:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2697:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3227:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2716:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2842:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2748:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3272:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2436:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2706:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2369:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2745:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3035:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3047:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3044:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2931:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2988:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2817:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3389:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3673:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2770:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2856:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2786:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2371:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2714:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2748:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2583:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3687:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3193:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3187:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2336:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3336:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2523:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2587:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2833:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2837:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2986:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3458:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2530:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2275:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2516:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2980:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2746:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2737:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3287:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3469:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2513:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2899:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2908:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2934:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2939:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3000:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2633:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2710:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3249:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2625:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2908:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3119:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2146:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2592:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2848:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2186:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.3119:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2727:  16%|█▌        | 64/401 [00:39<03:08,  1.79it/s]training loss: 0.2727:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.2743:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.3034:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.2609:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.3211:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.2942:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.3227:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.2674:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.2846:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.2836:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.3591:  16%|█▌        | 65/401 [00:39<02:44,  2.05it/s]training loss: 0.2575:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3217:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2593:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2116:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2799:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2456:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2931:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2486:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2864:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2774:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2627:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2884:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2909:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3169:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2870:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3545:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2838:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2727:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2918:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2360:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2242:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2718:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2628:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3427:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2872:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3276:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2421:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2915:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2889:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3415:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2927:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2186:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2318:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2306:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2706:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2512:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3171:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3313:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2798:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2440:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2547:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2615:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2607:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2383:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2685:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2634:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3368:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2261:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2790:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2488:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2616:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3226:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2699:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3228:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2604:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2929:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2796:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2781:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2626:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2316:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2080:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2765:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3518:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2251:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2982:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2758:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3076:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.2686:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3337:  16%|█▌        | 65/401 [00:40<02:44,  2.05it/s]training loss: 0.3337:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2492:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3001:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2975:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2869:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2865:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2933:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3466:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3047:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3387:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2873:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2631:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2222:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3095:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3367:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2925:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3414:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3150:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2655:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2877:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2153:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3663:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3255:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3214:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2386:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2526:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3182:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2617:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3113:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2666:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2604:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2250:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3579:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3211:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2753:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2716:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3466:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2506:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2712:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3596:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2861:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3322:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2611:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2988:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2882:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3252:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2141:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3451:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2290:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3007:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3096:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2378:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2614:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2366:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2928:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2610:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3086:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2432:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2765:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3106:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2694:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2678:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2957:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3783:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2837:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2555:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2450:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2302:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2367:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3258:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2818:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2859:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2868:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3684:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2664:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2607:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3020:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2931:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.2747:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3731:  16%|█▋        | 66/401 [00:40<02:26,  2.29it/s]training loss: 0.3731:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3204:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2574:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3271:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3045:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3054:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3515:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2374:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2738:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2242:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2620:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2886:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3255:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2459:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2609:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2426:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3170:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2686:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3127:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2635:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2839:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3170:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2580:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2920:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2425:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2489:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2975:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2171:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2776:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2990:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2605:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2622:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2094:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2948:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2714:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2550:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3594:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2843:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2954:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2941:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2211:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2752:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2790:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2680:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2870:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2908:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2882:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2779:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2862:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2510:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2899:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2263:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2987:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3410:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2787:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2956:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2474:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3081:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3031:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2324:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2553:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2454:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2989:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3033:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2484:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2449:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2491:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2610:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3064:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2605:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2577:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3230:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.3170:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2868:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2734:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2690:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2468:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2837:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.2928:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.6044:  17%|█▋        | 67/401 [00:40<02:14,  2.49it/s]training loss: 0.6044:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2995:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2568:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2891:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2819:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2765:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2768:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2782:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2204:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.3029:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.3481:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2903:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.3208:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.3075:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2409:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2956:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2655:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.3261:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2586:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2565:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2780:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2548:  17%|█▋        | 68/401 [00:40<02:05,  2.65it/s]training loss: 0.2732:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2896:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2897:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2438:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2738:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2812:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2525:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2414:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2343:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2978:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3027:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3084:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2222:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2754:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3614:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2427:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3299:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2987:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3163:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2530:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3695:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2644:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2759:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2782:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3057:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2444:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2846:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3127:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2781:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2547:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2869:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2298:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2800:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2764:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2832:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2888:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2736:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2505:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2732:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2810:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3205:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3000:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2916:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2294:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2877:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2764:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2666:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3003:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2402:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3029:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2629:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3441:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2659:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2682:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.3255:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2902:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.2683:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.1955:  17%|█▋        | 68/401 [00:41<02:05,  2.65it/s]training loss: 0.1955:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2276:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2784:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3445:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2789:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2752:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2471:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2694:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2225:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3202:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2048:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3020:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2810:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2589:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3001:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3065:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3030:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2528:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2766:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2393:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2367:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2939:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2475:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2539:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2832:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3138:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2534:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3112:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3138:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3147:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3188:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2877:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3657:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3172:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2388:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3373:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2353:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2317:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2338:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2481:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2504:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2310:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2844:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3101:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2768:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2788:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2247:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2410:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2078:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2929:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2879:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2679:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2157:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3192:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2715:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3158:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3029:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3112:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2297:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2822:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2982:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2602:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3233:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2949:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2230:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2620:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3069:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2550:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2535:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2813:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2851:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3369:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2799:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2705:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2724:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2908:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2471:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.3208:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.2305:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.1962:  17%|█▋        | 69/401 [00:41<01:59,  2.78it/s]training loss: 0.1962:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3158:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2778:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2427:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3701:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3348:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2615:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3002:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3212:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3022:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3009:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3140:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2226:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2713:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3245:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2904:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3016:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3471:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2798:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3130:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2452:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2583:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2154:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3009:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2529:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2629:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2738:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3052:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3459:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3625:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3029:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3025:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2766:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3102:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2420:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2613:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2660:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2709:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2962:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2707:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2344:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2577:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2635:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2878:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.1998:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2831:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3152:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2737:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2999:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2699:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2978:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2761:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2485:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3132:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3534:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2649:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3046:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2540:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2705:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2669:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3286:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2600:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2934:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2579:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3077:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3345:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2853:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2849:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2790:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3155:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2695:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3382:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2965:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2933:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2248:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2378:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2607:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2518:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.3042:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2665:  17%|█▋        | 70/401 [00:41<01:54,  2.88it/s]training loss: 0.2665:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2816:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2925:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2886:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3246:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2730:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2798:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3727:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2797:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2876:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2698:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3543:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2520:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2968:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2870:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3073:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2493:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2825:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2164:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2704:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2717:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2569:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2525:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2769:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2954:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2695:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2769:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2717:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2151:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2667:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3253:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2731:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2732:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2712:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2884:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2658:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3454:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2762:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2677:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3121:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2917:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2405:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3674:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3447:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3306:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2998:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3102:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2858:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2517:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2723:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2438:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2848:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2950:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2474:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2642:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3163:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2521:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2285:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2671:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2920:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2128:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3254:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2793:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2440:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2905:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2892:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2950:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3202:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2636:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2623:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.3027:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2556:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2164:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2813:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2342:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2412:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2597:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2445:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2218:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2100:  18%|█▊        | 71/401 [00:44<05:34,  1.01s/it]training loss: 0.2100:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2880:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2700:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2531:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2904:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3132:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3073:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2713:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3564:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3394:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2169:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2470:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2914:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2903:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2802:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2549:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3225:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2960:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2905:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2718:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2969:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2656:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3407:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2376:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2886:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2556:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2405:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3064:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3419:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2336:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2875:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2840:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2289:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3015:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2581:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3139:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3282:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2729:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2783:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2675:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2693:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2480:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3244:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3132:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2584:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2497:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2918:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3572:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3484:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3061:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2547:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2852:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2496:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3011:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3086:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3277:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2867:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2816:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2587:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2648:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3153:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2725:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2653:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2674:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2727:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3079:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3072:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2871:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.3713:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2535:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2338:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2687:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2697:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2508:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2662:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2531:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2657:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2746:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2629:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2411:  18%|█▊        | 72/401 [00:44<04:23,  1.25it/s]training loss: 0.2411:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2971:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2481:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2937:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2370:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2515:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2538:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2852:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2842:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2040:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3108:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2848:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2774:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2889:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2464:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3308:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2901:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3739:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2573:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2908:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2755:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2639:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3347:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2663:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3197:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2822:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2987:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2586:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2261:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2779:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2587:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2569:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2788:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3206:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2977:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3344:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2602:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2981:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2755:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3224:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2649:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2819:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3180:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3016:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2845:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2501:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2766:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3075:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3026:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3160:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2701:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3371:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2721:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2568:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2483:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3009:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2889:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3123:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2627:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.2648:  18%|█▊        | 73/401 [00:44<03:34,  1.53it/s]training loss: 0.3220:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2528:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2491:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2754:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.3715:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2945:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2662:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2325:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2629:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2890:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.3384:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.3191:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2672:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2923:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2606:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2639:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.2309:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.3205:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.3213:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.3678:  18%|█▊        | 73/401 [00:45<03:34,  1.53it/s]training loss: 0.3678:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3438:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2593:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3094:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3010:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3062:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2300:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2746:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2593:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2879:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2470:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3025:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3328:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.1934:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2531:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2515:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2828:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2555:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2830:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2529:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2911:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2592:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3061:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2563:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2757:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2897:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3069:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3012:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3320:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3128:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2804:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3025:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2383:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2702:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2695:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2391:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2863:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2339:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2830:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2712:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3379:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3347:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2566:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2462:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3273:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2687:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3269:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2614:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2653:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3399:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2661:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3179:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3165:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2743:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2937:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3234:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2882:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3320:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2672:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2815:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2887:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2718:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2606:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3052:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2388:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2737:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2887:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2406:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2861:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2523:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3085:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2915:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2859:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3072:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3455:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2727:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2350:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.3208:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2391:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2395:  18%|█▊        | 74/401 [00:45<03:10,  1.72it/s]training loss: 0.2395:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2649:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2856:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2779:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2531:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3138:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2362:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2970:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2867:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2461:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3450:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2856:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2789:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2918:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2441:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2390:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2696:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2670:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2564:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3519:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3140:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2605:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3123:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2613:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2539:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2855:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3113:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3452:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2728:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2913:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2866:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3148:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2527:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2791:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2680:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2641:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2710:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3661:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2759:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2864:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2536:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3339:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3226:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2369:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2787:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2915:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3164:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3070:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3208:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2864:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2699:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2694:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2667:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2858:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2771:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2782:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3127:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2558:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2688:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2842:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3160:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3124:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2804:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2603:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2781:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2669:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2917:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2655:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2695:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2396:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2173:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2618:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2193:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.1998:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2749:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2602:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3162:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2742:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.2671:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3383:  19%|█▊        | 75/401 [00:45<02:44,  1.99it/s]training loss: 0.3383:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3037:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2181:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2984:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2938:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3083:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3064:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2636:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2966:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2851:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2456:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3389:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2992:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2896:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2355:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2949:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3329:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3003:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2167:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2960:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2541:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3127:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3131:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3077:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2722:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2419:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2462:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3201:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2864:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3087:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3113:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2889:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2529:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2519:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2614:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2520:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2675:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3097:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2773:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2109:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2727:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2402:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3109:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2910:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3250:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3013:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3058:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2428:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3350:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2943:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2712:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2610:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3202:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.2736:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3478:  19%|█▉        | 76/401 [00:45<02:25,  2.24it/s]training loss: 0.3014:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2528:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2768:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.3098:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2513:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2711:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2790:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2913:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2752:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2325:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2504:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2514:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2406:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2474:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2518:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2449:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.3021:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2630:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.3255:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.3037:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2818:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2788:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.2675:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.3150:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.3285:  19%|█▉        | 76/401 [00:46<02:25,  2.24it/s]training loss: 0.3285:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2922:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2974:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3173:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2927:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2065:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2007:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2567:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2208:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2819:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2779:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2678:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3144:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3177:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2947:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2238:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2329:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3034:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2985:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2889:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3267:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2415:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3371:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2800:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2923:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2671:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2869:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2567:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2937:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2659:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3098:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2931:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3528:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3034:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3337:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2379:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2360:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2681:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2973:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2848:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2896:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2866:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2175:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2960:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2525:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2380:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2549:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2599:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2726:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3079:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2434:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3647:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2457:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3740:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2961:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3382:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2505:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3194:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2890:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2396:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2653:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2285:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3316:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2936:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3247:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3270:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2441:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2426:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2862:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3257:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2790:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2320:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2573:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2557:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2972:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2902:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3172:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2674:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.2692:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3934:  19%|█▉        | 77/401 [00:46<02:11,  2.46it/s]training loss: 0.3934:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2739:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2907:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2751:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2922:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2189:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3418:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2337:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2762:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2672:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2900:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2988:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2925:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2835:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2527:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2884:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3273:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2460:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3038:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2506:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2916:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3083:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3413:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3240:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2806:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3123:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3143:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2795:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3147:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2774:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2153:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2781:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2988:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3440:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2627:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2825:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2414:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3174:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3036:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2478:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2960:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2899:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3087:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3395:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2842:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2809:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3054:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2930:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2358:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.1910:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3264:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3224:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2637:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2788:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3095:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3424:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2848:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3007:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2805:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2620:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2670:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2622:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3253:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2573:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3086:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3629:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2332:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2756:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3323:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.3043:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2144:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2970:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2847:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2877:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2717:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2967:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2589:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2414:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2955:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2844:  19%|█▉        | 78/401 [00:46<02:01,  2.66it/s]training loss: 0.2844:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2891:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2751:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.3124:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.3384:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2653:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2930:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2872:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2445:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2940:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2672:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.3487:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2622:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2626:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2765:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.3884:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2795:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2440:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2831:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2488:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2551:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2680:  20%|█▉        | 79/401 [00:46<02:04,  2.59it/s]training loss: 0.2258:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3175:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2956:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3339:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2586:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2562:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3029:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3006:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3252:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2882:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3199:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2444:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2684:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2806:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2476:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2580:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2082:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2753:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3492:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2699:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3034:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2453:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3054:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2755:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2497:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2755:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2914:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2631:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3196:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2811:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2632:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2190:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2773:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3144:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3237:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2880:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2057:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2959:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2833:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3053:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3127:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3066:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2894:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3180:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2860:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2155:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3455:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2697:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3675:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2738:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2551:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3941:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2455:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2711:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.3413:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2592:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.2470:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.5860:  20%|█▉        | 79/401 [00:47<02:04,  2.59it/s]training loss: 0.5860:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2951:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3085:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2115:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2465:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2604:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2546:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3607:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2077:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3409:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3108:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2432:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2617:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3139:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2778:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2918:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2329:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2589:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3295:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3035:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2606:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2479:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3045:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2352:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2355:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2916:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2801:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2736:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2880:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3074:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2964:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3311:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2864:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2371:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2791:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3018:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3070:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2750:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2834:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2524:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3179:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2707:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2798:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3035:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2816:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3154:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2665:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2678:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2654:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2745:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3310:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2940:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2929:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3246:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2987:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3004:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2480:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3233:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2374:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3084:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2665:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3115:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2823:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2418:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2746:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3347:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2733:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2835:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2691:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2815:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2831:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2666:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2292:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2804:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2487:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2808:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2924:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.2608:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.3024:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.6963:  20%|█▉        | 80/401 [00:47<02:44,  1.95it/s]training loss: 0.6963:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2794:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2958:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2826:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2767:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2285:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2550:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2694:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3044:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2555:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2544:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3140:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2999:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2765:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2111:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2752:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2938:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2728:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2501:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2381:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2960:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3136:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2375:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2514:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2890:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2795:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2813:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2051:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2570:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2252:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2548:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2693:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2654:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2694:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2840:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3042:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2430:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2493:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2651:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3244:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2780:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2851:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2889:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3002:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3221:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2965:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2767:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3634:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3500:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3077:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2993:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2892:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3012:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2664:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2576:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2807:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2942:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2306:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2444:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2038:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3276:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2591:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3308:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2617:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3210:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2666:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2514:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3459:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3078:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2548:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2831:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2796:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2925:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.3216:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2787:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2430:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2680:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2242:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.2943:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.1554:  20%|██        | 81/401 [00:50<06:07,  1.15s/it]training loss: 0.1554:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2394:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2195:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2414:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3319:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3268:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2920:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2813:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2984:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3433:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2406:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2866:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2958:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2646:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2750:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2536:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3275:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2098:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2502:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2157:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2684:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2800:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2362:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3213:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2595:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3075:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2720:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2793:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3563:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2884:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2031:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2768:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3305:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.1962:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2494:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3219:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2726:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2626:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2986:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2476:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2633:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2175:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2751:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2782:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2786:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2707:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2061:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2395:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2660:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2659:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3105:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2877:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3228:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3373:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3302:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2789:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2536:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2264:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2934:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3511:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2503:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2812:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2324:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2845:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3078:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2569:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2556:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2951:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2989:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2658:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3471:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2748:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3074:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2732:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3030:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2321:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3053:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3248:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.3012:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2281:  20%|██        | 82/401 [00:50<04:46,  1.11it/s]training loss: 0.2281:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2956:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2737:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2848:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.3103:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.3656:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2438:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2937:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.3234:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2707:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2951:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2443:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2778:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2819:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.3009:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2544:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2629:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2545:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2996:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2974:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2792:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2830:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2811:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2419:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2874:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.3155:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2951:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2641:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2945:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2892:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2250:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.3509:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.2842:  21%|██        | 83/401 [00:50<03:49,  1.39it/s]training loss: 0.3279:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2253:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2442:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2249:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.3218:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2575:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.3006:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.3282:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2533:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2497:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2076:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2616:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2694:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2599:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2572:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2957:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2555:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2480:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.3045:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2545:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2600:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.3373:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.3214:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2643:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2503:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2645:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.3155:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2571:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2325:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2828:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2340:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2773:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2987:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2678:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2928:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2547:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2937:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2985:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2519:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2760:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2710:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2717:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2737:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2872:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2344:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.2816:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.1488:  21%|██        | 83/401 [00:51<03:49,  1.39it/s]training loss: 0.1488:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3259:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2302:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2361:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2624:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2522:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2508:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2323:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2692:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2711:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2457:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2668:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2734:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3511:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3330:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2769:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2520:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2741:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2839:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2417:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2500:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3049:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2768:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2685:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2565:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2690:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2741:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2816:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3006:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2833:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2982:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2662:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2579:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2866:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2153:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2524:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3442:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2248:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2627:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2611:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2399:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3287:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2305:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2708:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3235:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2610:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2481:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3381:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2312:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3062:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2791:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2823:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2642:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2671:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3042:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2688:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3016:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2226:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2898:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2952:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2988:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2570:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2602:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2604:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2722:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3125:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2968:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2973:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3023:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2739:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3182:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2715:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2064:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2211:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2652:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2944:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2886:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.3172:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.2629:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.1981:  21%|██        | 84/401 [00:51<03:08,  1.68it/s]training loss: 0.1981:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2751:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2964:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2672:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2698:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2516:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3416:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2873:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2624:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2698:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2507:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3011:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2318:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2460:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2883:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2943:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2708:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3140:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2952:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2824:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3105:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2614:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3081:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2823:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2348:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3403:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3155:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3299:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3138:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2566:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2426:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2843:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3176:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2809:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3616:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2869:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3013:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3052:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2617:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2524:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2491:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2838:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2500:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3007:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2522:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2801:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2658:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3259:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2841:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2773:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2874:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2670:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2522:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2784:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2895:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2339:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2551:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2556:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2420:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3403:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2980:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3073:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3012:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2723:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2992:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3190:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2577:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2589:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3312:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3044:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3164:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2568:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2904:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2536:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2922:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2399:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2637:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.2675:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.3169:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.4063:  21%|██        | 85/401 [00:51<02:40,  1.96it/s]training loss: 0.4063:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2864:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2441:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2618:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2931:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3190:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3044:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2231:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2474:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3036:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2179:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2590:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3371:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2704:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3020:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3404:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3025:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3048:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2269:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3153:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3471:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2919:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2627:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2028:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2149:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2563:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2785:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3029:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2499:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3344:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3117:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2854:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2407:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2911:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2834:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3157:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2551:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.3082:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2956:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2508:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2759:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2411:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2520:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2301:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2890:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2198:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2824:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2708:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2886:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2561:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2641:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2836:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2850:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2896:  21%|██▏       | 86/401 [00:51<02:21,  2.23it/s]training loss: 0.2835:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2457:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.3012:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2597:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2916:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2494:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2752:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.3278:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2612:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2567:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2720:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2063:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2779:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2128:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2730:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2870:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2960:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.3521:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2798:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2686:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.3311:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2512:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.3083:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2581:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2355:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2971:  21%|██▏       | 86/401 [00:52<02:21,  2.23it/s]training loss: 0.2971:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2706:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2867:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2855:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2540:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2733:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2460:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2912:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2932:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2866:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2761:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2550:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2774:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3096:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2699:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2896:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2502:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2077:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2026:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2433:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2738:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2086:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3040:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.1962:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3354:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2234:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2821:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2689:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2661:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2770:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2888:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2933:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2924:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2456:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2576:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3029:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2999:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3043:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3272:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2672:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2750:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3415:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2986:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3391:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3014:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2661:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2453:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2645:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2620:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3229:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2585:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2947:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2596:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2445:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2561:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.3035:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2640:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2761:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2988:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2801:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2874:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2576:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2740:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2251:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2376:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2939:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2823:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2682:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2446:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2719:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2501:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2438:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2430:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2754:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2482:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2587:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2356:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2428:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.2784:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.4874:  22%|██▏       | 87/401 [00:52<02:07,  2.47it/s]training loss: 0.4874:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2110:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2849:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2434:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3328:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2224:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2365:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2943:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2467:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2517:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2930:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3026:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2778:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2811:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2782:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2923:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3322:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3206:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2623:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3173:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2849:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2539:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2637:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2680:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2607:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2769:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2115:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2838:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2454:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2684:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2854:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3225:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3415:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2984:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2401:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3124:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3515:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2594:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2967:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2268:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2763:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3281:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2504:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3016:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2796:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3502:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2944:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3006:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2557:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2919:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2985:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2744:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3002:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2472:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2856:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2497:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2832:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2825:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2549:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2689:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2789:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3194:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2467:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2533:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3248:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3118:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2588:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2849:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2783:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2857:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3050:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.1920:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2559:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2850:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2416:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3299:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3514:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.2833:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.3276:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.1644:  22%|██▏       | 88/401 [00:52<02:13,  2.35it/s]training loss: 0.1644:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2761:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2862:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2806:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2422:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2853:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2775:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.3038:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2950:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.3505:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2503:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2267:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2715:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2879:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2445:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.3665:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2927:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2158:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2590:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.3663:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2791:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2582:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.3016:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.3069:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.3308:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2390:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2790:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2388:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.1771:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.2387:  22%|██▏       | 89/401 [00:52<02:02,  2.55it/s]training loss: 0.3164:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2844:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2400:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2785:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3323:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2544:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3436:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3068:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3042:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2456:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2102:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2335:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2902:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2508:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2673:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2897:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3294:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2605:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2716:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2673:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3330:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3140:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2880:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2611:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3268:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2655:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2762:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3338:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2591:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3317:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2918:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3197:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2858:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3650:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3197:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2863:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2765:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2943:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2816:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3302:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3029:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2845:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2883:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3511:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2860:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3157:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2901:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2592:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.3111:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2811:  22%|██▏       | 89/401 [00:53<02:02,  2.55it/s]training loss: 0.2811:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2565:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2398:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2423:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2028:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2932:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3396:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3145:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3038:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2995:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3528:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3225:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3348:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2958:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3333:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3294:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2413:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2836:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2842:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3260:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2728:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2743:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3035:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3309:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2885:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2692:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3356:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2002:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2387:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2725:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2589:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2941:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2396:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2426:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3164:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2525:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2592:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2938:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2931:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2239:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2847:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2399:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2062:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2061:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2994:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2934:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2671:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2602:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3017:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2736:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2434:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2868:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2631:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2633:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2559:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2480:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2330:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3306:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3082:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2846:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2743:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2791:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2576:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2986:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3266:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2700:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2545:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2704:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3140:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2665:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2711:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2868:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3152:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2739:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2888:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2588:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2796:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.2512:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.3248:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.1959:  22%|██▏       | 90/401 [00:53<01:54,  2.71it/s]training loss: 0.1959:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2686:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2698:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2588:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2430:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3020:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3142:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2863:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2236:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3319:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2621:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3115:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3088:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3193:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2231:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2764:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3217:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2387:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2748:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2299:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2798:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2589:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2800:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2520:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2690:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2581:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2924:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3451:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2628:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2868:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2985:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2300:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.1841:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2699:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2877:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2817:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2756:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2471:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2900:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2815:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2754:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2758:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2575:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2588:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2823:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2877:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3043:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2946:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2436:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2541:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3239:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3121:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2434:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2779:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2389:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2926:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2628:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2384:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2362:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2988:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3303:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3580:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2466:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3033:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3152:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2894:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2848:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3342:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2879:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2726:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2855:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2847:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2438:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2999:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2830:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2003:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2542:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3003:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.2651:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3529:  23%|██▎       | 91/401 [00:56<05:54,  1.14s/it]training loss: 0.3529:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3085:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2260:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2598:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2712:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2635:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3253:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2464:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2764:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2701:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2952:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2310:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2803:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2785:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2721:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2888:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2710:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2302:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2643:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3091:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2436:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2941:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3146:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2989:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2869:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3158:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2846:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3289:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2632:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2509:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2251:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2531:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2588:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2490:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2814:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2738:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3250:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2768:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2682:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2386:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2628:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3303:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2829:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3249:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2366:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2094:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2416:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2985:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2768:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3367:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3029:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2801:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2844:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2961:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2437:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2791:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2955:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2794:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2614:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2722:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3428:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2386:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2522:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2104:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3085:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2697:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2755:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2657:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3056:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2558:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2114:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2904:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2691:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2930:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3006:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2004:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2497:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3131:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.3484:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2110:  23%|██▎       | 92/401 [00:56<04:36,  1.12it/s]training loss: 0.2110:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2312:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2065:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2970:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2142:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2331:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3356:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2889:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2635:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2351:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2488:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2579:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2639:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3032:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2534:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2714:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2988:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2869:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2135:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3179:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2519:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2744:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2626:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2931:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2557:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3016:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2526:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3130:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2249:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2738:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2636:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2917:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3273:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3178:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2397:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2771:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3239:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2845:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2593:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2829:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2416:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2786:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3423:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2304:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3166:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2971:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2845:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3053:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2402:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3176:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.2809:  23%|██▎       | 93/401 [00:56<03:42,  1.38it/s]training loss: 0.3239:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2861:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2279:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2588:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2394:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2965:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2607:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2942:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2946:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.3254:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.3501:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2993:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2591:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2928:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.3334:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2781:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2716:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2568:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2744:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2732:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2662:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2974:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.3344:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2442:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.3150:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2767:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2702:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.2778:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.3918:  23%|██▎       | 93/401 [00:57<03:42,  1.38it/s]training loss: 0.3918:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2353:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2496:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2727:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2703:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2482:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2564:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3066:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2632:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2734:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2031:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2873:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3212:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2789:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3673:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2581:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2655:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2925:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2612:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2769:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2236:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3199:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2840:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2291:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2483:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2396:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2256:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3397:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2754:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2867:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3298:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2762:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2684:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3125:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3263:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3115:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2565:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2567:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2983:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2424:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3167:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2367:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2661:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2294:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2844:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2649:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3105:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3018:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2095:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2969:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2908:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2806:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3032:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2474:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2867:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2911:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3238:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2900:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3140:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2894:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2197:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2471:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2018:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2716:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2964:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2546:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2330:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3728:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2488:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2913:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2352:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2812:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2373:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2522:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2302:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.3004:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2146:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2946:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.2951:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.0794:  23%|██▎       | 94/401 [00:57<03:05,  1.65it/s]training loss: 0.0794:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2313:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3228:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2771:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2741:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2450:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2499:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2752:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2654:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2921:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3119:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2678:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3264:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2653:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2584:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2221:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2443:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3360:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2985:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2531:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3132:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2721:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2558:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2891:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2151:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3091:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3195:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2401:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2996:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3140:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2676:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2322:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2478:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2866:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2223:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2873:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2569:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2688:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2814:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2651:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2687:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2477:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3503:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2814:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2558:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3306:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2580:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3423:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3023:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2035:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2576:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2433:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2750:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2509:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2618:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2485:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2924:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3098:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2705:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2827:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2406:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2961:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2521:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2583:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2126:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2543:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2986:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2829:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2326:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2701:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2984:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3286:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3511:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2810:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3197:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2552:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.2961:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3090:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.3027:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.1564:  24%|██▎       | 95/401 [00:57<02:39,  1.92it/s]training loss: 0.1564:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2500:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2334:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2810:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2897:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2716:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3200:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2462:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2690:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2870:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2803:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3655:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3200:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2647:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3301:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2462:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2746:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2613:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2534:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2904:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2127:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2462:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2657:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2779:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2983:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3367:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2701:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2728:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3145:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2954:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2349:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2748:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2484:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2413:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2482:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2940:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2915:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2268:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2350:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2677:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2420:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2990:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2511:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2724:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2467:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2676:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2823:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2750:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2711:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3039:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3058:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2596:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3328:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.3010:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2726:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2209:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2455:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2479:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2564:  24%|██▍       | 96/401 [00:57<02:20,  2.17it/s]training loss: 0.2504:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.3184:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2716:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2629:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2925:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2598:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2767:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2876:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2957:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2233:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2604:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2104:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2809:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2758:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2757:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2279:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2372:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2516:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2352:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.3077:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2461:  24%|██▍       | 96/401 [00:58<02:20,  2.17it/s]training loss: 0.2461:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2890:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2553:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3503:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3080:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3091:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2732:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2934:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2522:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3085:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2931:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3018:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2478:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3034:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2327:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3301:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2773:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2863:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2475:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3711:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2928:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2729:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2866:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2413:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2816:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2555:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2799:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2305:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2660:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3437:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3358:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2700:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3437:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2908:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2887:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2238:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2907:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2652:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2826:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2549:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2408:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2988:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2287:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2640:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2738:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2541:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2786:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2959:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2825:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3197:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3006:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2553:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3589:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2651:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2749:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3002:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2778:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3124:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2921:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2783:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2898:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2350:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2554:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2705:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2710:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3242:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2318:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2660:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2662:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2927:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2297:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2888:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2430:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2469:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2970:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2237:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2518:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2549:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2988:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.1410:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.1410:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2660:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2830:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2614:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2814:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2302:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3461:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2239:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3654:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2931:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2792:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2282:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2504:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3240:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2350:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2443:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2885:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2679:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2989:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2989:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3124:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2798:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2776:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2215:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2817:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2433:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2840:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2718:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2228:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2522:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2658:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2681:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2343:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2993:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2993:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2581:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2623:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2640:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2712:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2702:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2606:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2659:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2710:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2948:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3486:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2549:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2755:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2800:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2815:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2796:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2992:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2559:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2357:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2912:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2870:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3230:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2656:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2863:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2698:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2743:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2604:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2563:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2556:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2782:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.1827:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2946:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3173:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.1974:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2187:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2800:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2503:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2510:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2614:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3071:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2800:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2703:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3395:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2236:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3002:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.1788:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.1788:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3216:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2525:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3023:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2733:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2438:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3372:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2739:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3592:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2272:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2907:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2664:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2180:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2811:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2458:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3360:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2916:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2344:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2933:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2620:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2794:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3030:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2541:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2744:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2844:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2995:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2935:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2737:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3366:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2397:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2907:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2626:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2646:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2525:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2502:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2464:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3322:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2842:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2394:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2823:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2483:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3002:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3008:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3068:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2764:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2308:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2677:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3293:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2821:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2564:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2571:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2982:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2679:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2234:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2760:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2374:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2040:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2717:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2614:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2914:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.3066:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2683:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2588:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2477:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2698:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2715:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2295:  25%|██▍       | 99/401 [00:58<01:51,  2.72it/s]training loss: 0.2695:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2101:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2564:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2048:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2904:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2990:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2939:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2360:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.3029:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2588:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2450:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.2665:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.1755:  25%|██▍       | 99/401 [00:59<01:51,  2.72it/s]training loss: 0.1755:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2408:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2686:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3363:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3219:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2475:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2493:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2757:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2261:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2774:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2515:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2699:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2972:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2971:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3022:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2527:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2170:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2665:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2575:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2688:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2755:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2631:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2900:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3443:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3229:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2003:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2930:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2701:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2836:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2737:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3009:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2449:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3389:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2377:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3013:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2599:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2598:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2303:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2655:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2952:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2785:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2965:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2821:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3020:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2585:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2505:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2762:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2918:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2516:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2461:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2723:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2713:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2848:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2637:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2925:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2262:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2716:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2543:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2691:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2982:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2812:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2503:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2386:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2672:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3367:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3124:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2783:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2907:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2460:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2902:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3278:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2527:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3074:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2659:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2502:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2910:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2379:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2998:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.2999:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3249:  25%|██▍       | 100/401 [00:59<01:47,  2.80it/s]training loss: 0.3249:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2666:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2737:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3071:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2899:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2653:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2311:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2560:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2931:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2764:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3232:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2894:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2220:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2917:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2764:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2759:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2552:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2534:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2480:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2837:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2379:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3120:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3084:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2832:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2768:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3799:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2909:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3330:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2817:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2168:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2691:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2884:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2708:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2644:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3143:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2936:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2546:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2910:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2731:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3112:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2105:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2771:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3288:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2800:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3035:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3150:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2131:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2266:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2516:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3081:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2525:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2725:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2537:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2675:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3117:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2336:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2593:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2598:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.1920:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2876:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2690:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3031:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2480:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2955:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2845:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3265:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2612:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2294:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2389:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2331:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2847:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2474:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2432:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2995:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3168:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2665:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2145:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.3385:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2547:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2083:  25%|██▌       | 101/401 [01:01<04:55,  1.02it/s]training loss: 0.2083:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.3167:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2834:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.3020:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2702:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2469:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2564:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2723:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2599:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2702:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.3277:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.3286:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2452:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2594:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2651:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2756:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2737:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2461:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2288:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2311:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2366:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2929:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2684:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.3120:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.3100:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2337:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2467:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2253:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2920:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2964:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2658:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2624:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2994:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2707:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2416:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2621:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2663:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2584:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2768:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.3035:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2731:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2308:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.3046:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2895:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2347:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2353:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2778:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2574:  25%|██▌       | 102/401 [01:01<03:54,  1.28it/s]training loss: 0.2727:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2586:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2519:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.3124:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2867:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2501:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2418:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2625:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2773:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2652:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2621:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2619:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2076:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2907:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2600:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2294:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2890:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2754:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2894:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2987:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.3196:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2985:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.3509:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2742:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2962:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2778:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2846:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2350:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.3052:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2508:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.2830:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.4553:  25%|██▌       | 102/401 [01:02<03:54,  1.28it/s]training loss: 0.4553:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2542:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2785:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2379:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2682:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2348:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2243:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2325:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2620:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2973:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2733:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2988:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3294:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2488:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2836:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2946:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2761:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2616:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2895:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2170:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2348:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2372:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2601:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3107:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2178:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2623:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3027:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2355:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2350:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2860:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2252:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2728:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2687:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2365:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3168:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2768:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3044:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2103:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2881:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2878:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2913:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2228:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3873:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2779:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2916:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2252:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2334:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2497:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2719:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2730:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2387:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2354:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2039:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2730:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3124:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2538:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2636:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2938:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2816:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2578:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2665:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.1942:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2100:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2619:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2900:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3041:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.3123:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2876:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2516:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2315:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2159:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2323:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2406:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2967:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.1912:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2942:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2024:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2950:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.2893:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.1902:  26%|██▌       | 103/401 [01:02<03:11,  1.56it/s]training loss: 0.1902:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2389:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2913:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3041:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2876:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3009:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2629:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2610:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2775:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2966:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2046:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2700:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2836:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2406:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3403:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2952:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2553:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2374:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3156:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3289:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2496:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2921:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2825:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2976:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2858:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2092:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3053:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2179:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3129:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2359:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.1998:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3457:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2369:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2438:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3024:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2710:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3617:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2878:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2503:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2399:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2164:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2184:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2772:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2789:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2440:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3141:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2080:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3205:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2487:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2709:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2556:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2662:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2948:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2413:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2639:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2566:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2245:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2565:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2459:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2149:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2508:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2824:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3266:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3086:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2664:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3244:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2939:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2780:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3242:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2561:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3141:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2566:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2902:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2247:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2772:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.3263:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2696:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2156:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.2572:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.4402:  26%|██▌       | 104/401 [01:02<02:41,  1.84it/s]training loss: 0.4402:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2788:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2594:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3005:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2280:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2821:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3258:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2693:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2862:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3337:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2745:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2827:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2674:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2695:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2579:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2946:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2728:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3300:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3116:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2728:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2296:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3212:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3339:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2771:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2591:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2832:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2672:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2737:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2249:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2389:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2194:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2762:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2817:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2756:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3343:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2675:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3221:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3008:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2832:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2774:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3092:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2326:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3291:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2389:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2258:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3160:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2555:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2811:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2698:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2548:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2837:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3156:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2529:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2816:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2759:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2488:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2660:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2723:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2579:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2977:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2619:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.2202:  26%|██▌       | 105/401 [01:02<02:20,  2.11it/s]training loss: 0.3008:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2491:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2597:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2957:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2223:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2688:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2390:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.3424:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2971:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2355:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2355:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.3045:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.3239:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2185:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2419:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2353:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2733:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2674:  26%|██▌       | 105/401 [01:03<02:20,  2.11it/s]training loss: 0.2674:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2363:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3048:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2412:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2854:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2206:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.1983:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2659:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3022:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3097:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2584:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3124:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2620:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2621:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2593:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2589:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2948:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2684:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2395:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2360:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2714:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3301:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2787:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2413:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3491:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2655:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2269:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2672:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2874:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2257:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2972:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2287:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2313:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2290:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2627:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2418:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2058:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2479:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3108:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2648:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2527:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2842:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2620:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2915:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2595:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2768:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2334:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2538:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2493:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2926:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2830:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2408:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2527:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3005:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2671:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2876:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2476:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2579:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2759:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2173:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2880:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2591:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2843:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2470:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3122:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3265:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2747:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3014:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2925:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3195:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2415:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2384:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2837:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2769:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3248:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3037:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2092:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2478:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.2711:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3760:  26%|██▋       | 106/401 [01:03<02:05,  2.34it/s]training loss: 0.3760:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2352:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2739:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2273:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3112:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2445:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3130:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3043:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2777:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3281:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2653:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2794:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2501:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2984:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2548:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2428:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3056:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2587:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2776:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2872:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3118:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3058:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2428:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2797:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3400:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2363:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2427:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2829:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2740:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2972:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2837:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2978:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2540:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2876:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2301:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2173:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2539:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2948:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2486:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2395:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2775:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2237:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2312:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2645:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2852:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3301:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2606:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2695:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2753:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2776:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2788:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2704:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2906:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2680:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2454:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2617:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2471:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2941:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2738:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2545:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2808:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2686:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2761:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2437:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2459:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2560:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2569:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2704:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2758:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2477:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2578:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3028:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.3060:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2779:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.1761:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2943:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2793:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2882:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.2229:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.1532:  27%|██▋       | 107/401 [01:03<01:56,  2.52it/s]training loss: 0.1532:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2874:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2757:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.3076:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2749:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2566:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2920:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2400:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2874:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2645:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2619:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2665:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.3120:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2492:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2676:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.3190:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2892:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2316:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2793:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2591:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2424:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2360:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2654:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2173:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2788:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2730:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.3204:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.1654:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2699:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2763:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2823:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2608:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2804:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2167:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.3473:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2354:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2621:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2483:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2999:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2962:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2789:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.2779:  27%|██▋       | 108/401 [01:03<02:00,  2.44it/s]training loss: 0.3016:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2991:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2750:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3103:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2672:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2893:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2556:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2532:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2199:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2707:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2491:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2358:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2990:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2761:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2331:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2884:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2988:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2761:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3101:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3203:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2565:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2815:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2930:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2258:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2652:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2560:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3000:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3065:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3011:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2969:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2822:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3140:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2801:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3592:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.3018:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2557:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2643:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2458:  27%|██▋       | 108/401 [01:04<02:00,  2.44it/s]training loss: 0.2458:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3215:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2485:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2216:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2503:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2672:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2821:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2503:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2657:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2942:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2706:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2368:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2589:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2761:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3036:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2918:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2553:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2734:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2904:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2748:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2577:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2569:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3078:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2497:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2795:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2791:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3102:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2845:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2793:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2753:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2277:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3282:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2839:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2633:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2289:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2474:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2769:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2110:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2597:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2695:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2872:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2745:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2577:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2197:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2590:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2768:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2764:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2638:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2808:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3041:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2461:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2720:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2793:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2674:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2727:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2536:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2847:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2321:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2900:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2630:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2836:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3059:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2579:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2615:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2565:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2311:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3482:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2283:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2962:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3208:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2633:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3030:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2660:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2617:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2621:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2913:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3036:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2308:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.2574:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3838:  27%|██▋       | 109/401 [01:04<01:51,  2.63it/s]training loss: 0.3838:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2963:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2233:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.3058:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2318:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2510:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.3129:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2615:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2527:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2472:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2623:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2738:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2515:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.1875:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2221:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2695:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2558:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2464:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2971:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2158:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2610:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2464:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2824:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.3134:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2624:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2426:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2408:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2712:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2597:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.3329:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2694:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2784:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2842:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2740:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2788:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2351:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2795:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2759:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2580:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2697:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2711:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.3044:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2449:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2497:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2668:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2508:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2965:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2385:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.1935:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2598:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.3108:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.3122:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2156:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2861:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2383:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2646:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2442:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2147:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2267:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2302:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2565:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2475:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2776:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2277:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2485:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2493:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2608:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2168:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2449:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2781:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2409:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.3004:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2539:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2485:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2581:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2630:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2401:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.2247:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.1983:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.1262:  27%|██▋       | 110/401 [01:04<01:44,  2.78it/s]training loss: 0.1262:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2977:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2619:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2804:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2480:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2734:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2211:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2387:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2908:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2750:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2610:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3636:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2520:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2677:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2372:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2606:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2298:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2523:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2186:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2594:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2436:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2911:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2992:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2012:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2550:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2625:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2205:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2787:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2925:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2725:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3275:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3300:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2515:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2509:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2426:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2728:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2421:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2821:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2381:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2629:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2619:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2691:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2325:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2230:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3074:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2179:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2992:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2682:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2741:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2768:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3096:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.1976:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2601:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2616:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2626:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2753:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3084:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2487:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3227:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2847:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2681:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3281:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2479:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3029:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3290:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2653:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3168:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2395:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2542:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3074:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2751:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2758:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2946:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2654:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2710:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2192:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2826:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.2823:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.3134:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.4118:  28%|██▊       | 111/401 [01:07<05:26,  1.13s/it]training loss: 0.4118:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2160:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3118:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2818:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2742:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2493:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2399:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2579:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3512:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2735:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3238:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2440:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2520:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2875:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2522:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.1897:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2072:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2255:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2679:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3633:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2801:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2690:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2898:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2415:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2420:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2420:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2975:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2560:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2467:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2963:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2155:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2536:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2052:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2829:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3123:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2407:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2453:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2435:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2864:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2672:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2496:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2137:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2447:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2356:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2170:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2734:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3131:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2155:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3427:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3076:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2464:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2295:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2526:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2736:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2780:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3158:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2772:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2691:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2507:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2480:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2738:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2530:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2485:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2767:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3013:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.1986:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2559:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2888:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2455:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2657:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2790:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2109:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2737:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2608:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.3034:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2462:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2390:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2478:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2145:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2458:  28%|██▊       | 112/401 [01:07<04:14,  1.13it/s]training loss: 0.2458:  28%|██▊       | 113/401 [01:07<03:24,  1.41it/s]training loss: 0.2527:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2625:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2148:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2577:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2384:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2221:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2710:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2733:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2961:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2681:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2227:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3436:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2300:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2529:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2746:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3189:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2229:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2467:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2210:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2811:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2566:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3119:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3072:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2839:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2939:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2791:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2887:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2426:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3406:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2765:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2502:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2376:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2484:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2552:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2661:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2644:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2676:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2171:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2392:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3472:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2497:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3150:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2320:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2276:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2585:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2644:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2225:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3040:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2975:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2284:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2359:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2302:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2541:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3036:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3209:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2727:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3110:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2871:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3354:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2910:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2733:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2472:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2392:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2552:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3180:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2820:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2776:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2822:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3335:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2203:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2687:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2378:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.3003:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2649:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2519:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2650:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2375:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2155:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2211:  28%|██▊       | 113/401 [01:08<03:24,  1.41it/s]training loss: 0.2211:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2426:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2292:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2728:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2806:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.3094:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2658:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2123:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2613:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2695:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.1797:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2398:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2062:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2347:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2396:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2486:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.3042:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2496:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2210:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2408:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2492:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2241:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2071:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2886:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2543:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2802:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]training loss: 0.2985:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]slurmstepd: error: *** JOB 9912059 ON gpu012 CANCELLED AT 2026-05-14T10:50:09 ***
-training loss: 0.2993:  28%|██▊       | 114/401 [01:08<02:49,  1.69it/s]
\ No newline at end of file
diff --git a/slurm/logs/pidm_toy_9912059.out b/slurm/logs/pidm_toy_9912059.out
deleted file mode 100644
index e69de29..0000000
diff --git a/slurm/logs/pidm_toy_9912070.err b/slurm/logs/pidm_toy_9912070.err
deleted file mode 100644
index 0703182..0000000
--- a/slurm/logs/pidm_toy_9912070.err
+++ /dev/null
@@ -1 +0,0 @@
-  0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.2551:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1176:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1060:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1632:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1818:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0338:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1002:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0983:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0812:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0331:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0574:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0444:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9588:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0914:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0291:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0121:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9731:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9560:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0103:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9386:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9856:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9452:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9396:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9620:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9623:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9229:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9432:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9279:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9292:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8801:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8585:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9653:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9662:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8867:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9096:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9265:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8645:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8828:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8600:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8572:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8554:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8367:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8476:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8754:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8526:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8306:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7750:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7980:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7936:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7926:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7810:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7994:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7928:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8409:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7598:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8015:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6955:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7742:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8142:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7444:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6679:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6853:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7115:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7299:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6961:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7344:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6457:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6683:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6733:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6842:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6885:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7089:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6253:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6443:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6088:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6275:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6551:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.5678:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6039:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6039:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.6093:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5775:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5579:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.6020:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5859:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5814:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5573:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5129:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5302:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5351:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5318:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5398:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5146:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5093:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5481:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5132:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.5026:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4681:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4820:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4638:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4943:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4588:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4837:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4216:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4526:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4499:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4998:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4547:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4344:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4219:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4697:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4456:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4492:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3905:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3912:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4068:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4049:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3884:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4446:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4242:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3773:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4253:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3726:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4104:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4030:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3557:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3865:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3053:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3985:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3683:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3541:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4177:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3863:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3775:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3682:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3662:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3357:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4027:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3493:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3336:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3701:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3362:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4137:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3368:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4069:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3933:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3370:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3304:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.4235:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3191:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3769:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3863:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.2603:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3528:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3548:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3779:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.2995:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.3698:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.1826:   0%|          | 1/401 [00:04<27:04,  4.06s/it]training loss: 0.1826:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3406:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.4033:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2978:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3100:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3001:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3360:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2874:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3243:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3403:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3685:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3251:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3131:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3668:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2817:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3275:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3150:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2796:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3481:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3502:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3211:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3261:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2969:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2918:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2998:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3303:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3013:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3277:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3485:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3230:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3760:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2999:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2846:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2725:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3087:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3666:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3036:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3759:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3327:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2803:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2855:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3307:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3205:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3134:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3100:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3055:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3335:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2834:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3343:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2551:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3027:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3176:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3016:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3485:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3647:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3548:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2989:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3743:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3236:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3336:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3316:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3150:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3782:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3572:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3283:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3295:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2868:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2498:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2644:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2787:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2525:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3200:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3202:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3047:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3130:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2600:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3730:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2763:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.3245:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2876:   0%|          | 2/401 [00:04<12:21,  1.86s/it]training loss: 0.2876:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3222:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3313:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2932:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2620:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3152:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2789:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3206:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3138:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3368:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3158:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2743:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2646:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.4446:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3172:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3743:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3078:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3206:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3121:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2688:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3185:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2757:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3557:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3379:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3845:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2807:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2882:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3009:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3291:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2848:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3242:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2943:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2648:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3348:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2971:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2864:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3064:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3603:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2276:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3285:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2944:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3606:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3466:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3188:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3116:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2715:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2997:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2782:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2857:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3182:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3087:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3168:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3054:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2711:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2884:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2947:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2813:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3648:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2694:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3033:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3250:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2909:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2823:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3153:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2209:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3097:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3287:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3619:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3301:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3090:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2924:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3115:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2933:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2427:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.3063:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2988:   1%|          | 3/401 [00:04<07:39,  1.16s/it]training loss: 0.2700:   1%|          | 3/401 [00:05<07:39,  1.16s/it]training loss: 0.3348:   1%|          | 3/401 [00:05<07:39,  1.16s/it]training loss: 0.3275:   1%|          | 3/401 [00:05<07:39,  1.16s/it]training loss: 0.3833:   1%|          | 3/401 [00:05<07:39,  1.16s/it]training loss: 0.3833:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3421:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3302:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3214:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2663:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3354:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3254:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3018:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3114:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3121:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3085:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2907:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3136:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3857:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3473:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3223:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3586:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2834:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2495:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3246:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3369:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2825:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2988:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2835:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3110:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3056:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3108:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3130:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2989:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2374:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2707:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3493:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3094:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2934:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3422:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2672:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3233:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3056:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2745:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2732:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3253:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2982:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2929:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3145:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2667:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2999:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2690:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3765:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3242:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2605:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2888:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2923:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3959:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2501:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2485:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3118:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3320:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2923:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3189:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3007:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2874:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3386:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3509:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3332:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2946:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3235:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2901:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3197:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2793:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2591:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2935:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3051:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2868:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2592:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3329:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.3065:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2875:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2750:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2295:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2113:   1%|          | 4/401 [00:05<05:27,  1.21it/s]training loss: 0.2113:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2494:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3078:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2854:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2562:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3316:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3228:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3198:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3428:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2418:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3122:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3161:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2644:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2982:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2881:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3203:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3128:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2532:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3023:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3625:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2784:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3473:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3108:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2413:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3028:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2463:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3183:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2429:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2714:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3238:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3323:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3294:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2892:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2522:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2849:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3340:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2748:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2744:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3038:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2698:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2852:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2447:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2426:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3496:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2672:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2335:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2083:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2579:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3166:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3165:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3215:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2544:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3191:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2743:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3789:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2939:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2951:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3007:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3145:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2628:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2420:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2662:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3233:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3252:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3096:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3019:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3269:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3325:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3041:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2983:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3060:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2583:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3188:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2667:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2840:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2912:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2318:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.3957:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.2703:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.1804:   1%|          | 5/401 [00:05<04:15,  1.55it/s]training loss: 0.1804:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3265:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2912:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2467:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3311:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3107:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2685:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2406:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2725:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3334:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3307:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3357:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2739:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3018:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3364:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2795:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3512:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3072:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3228:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3162:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3217:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2708:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3341:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3721:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3690:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2988:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3073:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2952:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2688:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3351:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3211:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2556:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2854:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.4159:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3638:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3166:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3240:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2247:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3069:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2814:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3041:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2623:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3507:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2997:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2286:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2859:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2847:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3047:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2593:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3184:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3640:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2629:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3427:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2549:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3281:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2970:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3098:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3252:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2706:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2568:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3245:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3117:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3059:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2745:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3136:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2791:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2412:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2698:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2950:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2422:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2782:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2830:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2582:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3387:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3433:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3699:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2650:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3413:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.2554:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3423:   1%|▏         | 6/401 [00:05<03:30,  1.88it/s]training loss: 0.3423:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.3494:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.2927:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.2622:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.3348:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.3118:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.2451:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.3203:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.2648:   2%|▏         | 7/401 [00:05<03:01,  2.17it/s]training loss: 0.3459:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2430:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2822:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3079:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2567:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3494:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2544:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2850:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2729:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2840:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2881:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2654:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3117:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3194:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2811:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3649:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2228:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3752:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3068:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2873:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2929:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2992:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3903:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3295:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3421:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3544:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2509:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2239:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2733:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3004:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3278:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3558:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3227:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2763:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2868:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3095:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2602:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3038:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2847:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2834:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3103:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2577:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3064:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2764:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2376:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2520:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3311:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2809:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2779:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3127:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2799:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2676:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3043:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3016:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3215:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2801:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3681:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3146:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2400:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3282:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2977:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3134:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2775:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3142:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3035:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3095:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3074:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2872:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3238:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.2736:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3917:   2%|▏         | 7/401 [00:06<03:01,  2.17it/s]training loss: 0.3917:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3532:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3028:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2657:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2582:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2594:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2798:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3335:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2665:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3620:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2799:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2475:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2944:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3286:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2751:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2721:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3125:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3027:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3153:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2594:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3140:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2380:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2753:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3147:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2379:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3213:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3248:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2771:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2848:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3407:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2976:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2437:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2837:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3062:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3115:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3205:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3028:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2692:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2814:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2783:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2605:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2723:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2742:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3424:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3513:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2976:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3228:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2964:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2626:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3150:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3226:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2508:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3415:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3034:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2909:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2645:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2840:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3719:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3222:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2315:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2767:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2454:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2023:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2844:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3524:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2647:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2844:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2745:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3747:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2785:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2900:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3504:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2616:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3676:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2511:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3012:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2687:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2899:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.2970:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3719:   2%|▏         | 8/401 [00:06<02:42,  2.42it/s]training loss: 0.3719:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2494:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2739:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2410:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2892:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2638:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3148:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2944:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3039:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2952:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2879:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3002:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2920:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2757:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2693:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2701:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3228:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3346:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2943:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2531:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3016:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3291:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2848:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2623:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2517:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2858:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2377:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2831:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2893:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2843:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3101:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2579:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2626:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3221:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3177:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2875:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3420:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2920:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3063:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3288:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2685:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2838:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3090:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3151:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2341:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2593:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3075:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3040:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.1999:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2806:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3962:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3176:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2483:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3119:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2784:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2697:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2660:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2835:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2665:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2874:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2428:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2426:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2856:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2559:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2642:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2717:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3125:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2911:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2815:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2996:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3697:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2477:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2468:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3656:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.3478:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2860:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2026:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2364:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.2403:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.1503:   2%|▏         | 9/401 [00:06<02:29,  2.62it/s]training loss: 0.1503:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3332:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3023:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3072:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3217:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2153:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2813:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2323:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3262:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3357:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2530:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3350:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2614:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2983:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3336:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2255:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2725:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2848:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2790:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.3760:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2672:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2796:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2745:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2724:   2%|▏         | 10/401 [00:06<02:20,  2.77it/s]training loss: 0.2291:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2866:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3111:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3137:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2943:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3375:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2777:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2898:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2878:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2534:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2652:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3055:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2232:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2676:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3370:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2797:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2481:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2692:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2062:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3087:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2949:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2831:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3322:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3236:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3101:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3115:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2606:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2450:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3572:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2792:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2325:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2692:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2414:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2775:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2436:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2198:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2524:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2846:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2685:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2660:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2426:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3069:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3064:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2923:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2903:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3050:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2935:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2969:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2750:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2458:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3200:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2722:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3300:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.2685:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3361:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3115:   2%|▏         | 10/401 [00:07<02:20,  2.77it/s]training loss: 0.3115:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3474:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2435:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2788:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2840:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2689:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2502:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3291:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3467:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3497:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2471:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2567:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2723:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3139:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3026:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2649:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3102:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2622:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3278:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3066:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2027:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2368:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3609:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3159:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3096:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3120:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2585:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2813:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3354:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2846:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2869:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2694:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2740:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2993:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2528:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2650:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2795:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2917:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3231:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2381:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3213:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3054:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2958:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3052:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2616:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3160:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2141:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2679:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2917:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2763:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3547:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3279:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2615:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3187:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3537:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2803:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2683:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2634:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2894:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2931:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2461:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2359:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2589:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2953:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2997:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3685:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2642:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3208:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3248:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.4181:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2824:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3087:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2631:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2655:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3020:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3555:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3393:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3080:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.2764:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3536:   3%|▎         | 11/401 [00:09<07:00,  1.08s/it]training loss: 0.3536:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2706:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.3502:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2697:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.3017:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2395:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2291:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2985:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2351:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2738:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.3148:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2838:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2379:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2968:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2636:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2620:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.3608:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2549:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.3007:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2795:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2471:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2733:   3%|▎         | 12/401 [00:09<05:28,  1.18it/s]training loss: 0.2745:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3133:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2544:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2400:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2611:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3353:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2668:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2811:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2678:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3161:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2805:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2553:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2570:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2643:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3262:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2576:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2866:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2941:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2487:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2635:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2679:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2817:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2892:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2839:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3234:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2904:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2392:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3113:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2749:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2886:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2585:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2740:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2510:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2815:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2851:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2760:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2390:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2859:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2421:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2519:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2762:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2847:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2722:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2466:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2364:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3217:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3526:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2689:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2893:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2494:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2486:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2706:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2883:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2270:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3307:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.3558:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2924:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2134:   3%|▎         | 12/401 [00:10<05:28,  1.18it/s]training loss: 0.2134:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2857:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2598:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2579:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2290:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2646:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3269:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3034:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2661:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3138:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3165:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2460:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3246:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2584:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2748:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2737:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2754:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2945:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3191:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2533:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2793:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2479:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2603:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2989:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2627:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3246:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3157:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3105:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3834:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2996:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3105:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2924:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2545:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3293:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2981:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2813:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2659:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2659:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2904:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3197:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3433:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3465:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3139:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2727:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3066:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2998:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3307:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2812:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3810:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2703:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2405:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3179:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2774:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2735:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3288:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2472:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2219:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3099:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2835:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2868:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3319:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3303:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3457:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2763:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2675:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2511:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3718:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3179:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3191:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3071:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2857:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2851:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2810:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2549:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2723:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3701:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.3147:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2940:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2141:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2938:   3%|▎         | 13/401 [00:10<04:24,  1.47it/s]training loss: 0.2938:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3248:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2750:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2715:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3084:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3017:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2721:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2840:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3188:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2410:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2433:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3250:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3628:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2702:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2649:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2486:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2982:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2554:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3225:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2950:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2822:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2891:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2713:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2678:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2370:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2758:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2783:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2972:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3415:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3386:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2832:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2407:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2982:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2593:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2958:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2707:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2651:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2882:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2802:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3612:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2904:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3240:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2933:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2306:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2653:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2951:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3461:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2559:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3125:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2462:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2767:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3124:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3094:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3382:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2416:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2841:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2841:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2360:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3005:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2868:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3082:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2888:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2637:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2316:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2737:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2836:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3165:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2448:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2952:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3072:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3513:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2945:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2263:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2918:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2786:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3586:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2848:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.2781:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.3297:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.5124:   3%|▎         | 14/401 [00:10<03:41,  1.75it/s]training loss: 0.5124:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2624:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3187:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2536:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2992:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2326:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2675:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2777:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3070:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3179:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3442:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3192:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3161:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3493:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2955:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2730:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2912:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3781:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2344:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2973:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2583:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2921:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2746:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3362:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2210:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2546:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2931:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2864:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2570:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3646:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3338:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2924:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3037:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2559:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.3370:   4%|▎         | 15/401 [00:10<03:11,  2.01it/s]training loss: 0.2603:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3353:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2567:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3012:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2309:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2748:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3070:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2842:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2834:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2831:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2909:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2965:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2620:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3094:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2695:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2804:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2963:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2601:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3076:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3719:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2581:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2757:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3032:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2809:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2573:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2484:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2749:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2684:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3118:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3117:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2979:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3232:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2741:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2967:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2803:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3154:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2556:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2568:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2576:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3119:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3480:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.3199:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2501:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.2705:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.1609:   4%|▎         | 15/401 [00:11<03:11,  2.01it/s]training loss: 0.1609:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2685:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3007:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2483:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2272:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2971:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2559:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2699:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2965:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2825:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2935:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3091:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2962:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3914:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2621:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2236:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2919:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2652:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2843:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2574:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2560:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3068:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2578:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3103:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2615:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2218:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3113:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3267:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2460:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2990:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2291:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3222:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3289:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2905:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2722:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3130:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2844:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3011:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2677:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3243:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3176:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3084:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2220:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2694:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2949:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2494:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2576:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2444:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2927:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2793:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2865:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2583:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3094:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3125:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2823:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3204:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3273:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3679:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2686:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3463:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2997:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2661:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2891:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2965:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2529:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2883:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2148:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3124:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2545:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3366:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.3342:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2669:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2864:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2763:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2650:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2805:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2908:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2370:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.2979:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.1921:   4%|▍         | 16/401 [00:11<02:49,  2.27it/s]training loss: 0.1921:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3300:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3032:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3105:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2902:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3464:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2922:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3076:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3055:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2485:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3281:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3000:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2571:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2339:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2687:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2868:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2684:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2649:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3060:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2513:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2755:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2545:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3004:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2436:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2617:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3110:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3273:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2673:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3222:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2739:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2274:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2903:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2505:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2989:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3127:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2460:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3570:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2469:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2523:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2653:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2861:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2692:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3339:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2771:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2742:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3023:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3042:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3259:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3046:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3023:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2704:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2889:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2763:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2764:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2946:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3058:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2780:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2862:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3045:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3480:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3164:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2463:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2633:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2750:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3220:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3543:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2849:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2961:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3257:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3004:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3046:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3367:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2512:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3329:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3175:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2418:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3267:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2732:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2307:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2885:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2885:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2907:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2876:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2601:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2656:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2311:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2993:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2753:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.3121:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2897:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2537:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2635:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2518:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.3346:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2580:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2561:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.3092:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2433:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.3227:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2848:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2305:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.3275:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2903:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2602:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2778:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.3037:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2850:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2698:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.3279:   4%|▍         | 18/401 [00:11<02:31,  2.53it/s]training loss: 0.2504:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2932:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3813:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2652:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2472:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2498:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3072:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2791:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3236:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3280:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2789:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2810:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2893:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2670:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2362:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2847:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2956:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2534:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3391:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3277:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2601:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2942:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2372:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2877:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3472:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3280:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2833:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2723:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2827:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2501:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2440:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2636:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3079:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2448:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.4189:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2191:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2424:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3007:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2301:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2756:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3041:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2697:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2428:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3074:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.3378:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2640:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2928:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2813:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2984:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2729:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2594:   4%|▍         | 18/401 [00:12<02:31,  2.53it/s]training loss: 0.2594:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2462:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2908:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2340:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2757:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3289:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2980:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2990:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3084:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2894:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2684:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2947:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2380:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3704:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3291:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3432:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2438:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2722:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2696:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3146:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3138:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2288:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2626:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3565:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2327:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3042:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2977:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3154:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2739:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2303:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2812:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3344:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2799:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2780:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2869:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2627:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2716:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3165:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2778:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2786:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3037:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2716:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2507:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2840:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3131:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2777:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2723:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3118:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2182:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2506:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2955:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2449:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2780:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3026:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2366:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2577:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2686:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2692:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2983:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2530:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2857:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3003:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2874:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2824:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2988:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2483:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2801:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2888:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3004:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2789:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2447:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2956:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2523:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3284:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2237:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2918:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.3601:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2451:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.2576:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.0841:   5%|▍         | 19/401 [00:12<02:21,  2.70it/s]training loss: 0.0841:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2936:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2493:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3005:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2435:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2359:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2715:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2749:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2636:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2787:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2685:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3012:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2084:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2757:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2976:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3009:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2409:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2913:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3558:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2505:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2748:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2658:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2815:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2971:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3063:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2399:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2842:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3324:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2659:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3002:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2541:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2596:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2953:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2943:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2942:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2538:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2310:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2980:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2642:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3016:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2698:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2995:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2377:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2783:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2467:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3363:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2665:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2425:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2874:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2694:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2357:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3388:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2466:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2774:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.3293:   5%|▍         | 20/401 [00:12<02:15,  2.81it/s]training loss: 0.2609:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3140:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3039:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2648:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2925:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2901:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3028:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3032:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2169:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2813:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3267:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2546:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2576:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2622:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3010:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2502:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2794:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2938:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2692:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3304:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3183:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2821:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2820:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.3401:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2903:   5%|▍         | 20/401 [00:13<02:15,  2.81it/s]training loss: 0.2903:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3558:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3214:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2939:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3291:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3868:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3193:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2482:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3381:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2788:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2200:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2547:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2842:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2712:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2645:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2814:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2628:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2147:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3118:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2898:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2681:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2783:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2424:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2914:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2547:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2531:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2737:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2600:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2421:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3099:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2655:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3264:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2165:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2568:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3045:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2753:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2276:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2552:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2850:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3107:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2715:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3152:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2806:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3154:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2910:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2784:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3034:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2635:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3207:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3393:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3134:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2661:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3635:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3152:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2779:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2486:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2825:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3453:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3325:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3378:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3382:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2445:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3376:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2768:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2960:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2723:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2415:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3225:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3001:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2565:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2776:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3386:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3258:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2613:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3562:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2978:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2888:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.3179:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.2981:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.4510:   5%|▌         | 21/401 [00:15<06:56,  1.10s/it]training loss: 0.4510:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2752:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.3504:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2615:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2755:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2942:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.3008:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2789:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2141:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2595:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.3138:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2728:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.3211:   5%|▌         | 22/401 [00:15<05:46,  1.09it/s]training loss: 0.2637:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3237:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2928:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2304:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2728:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2837:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3032:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2920:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2823:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2642:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2922:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3026:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2878:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2514:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2938:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3059:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3405:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2597:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2965:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2767:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2386:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3353:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2841:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3322:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3061:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2800:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2715:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2729:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3093:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2815:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3326:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2966:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2596:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2509:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2815:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2613:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3037:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2959:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3048:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2962:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2774:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3087:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3079:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2496:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2491:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2703:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2622:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3034:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2467:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3210:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2839:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2600:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2918:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2905:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3124:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3448:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2842:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3199:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3373:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2581:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3222:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2851:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2695:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2717:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3480:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.2732:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3604:   5%|▌         | 22/401 [00:16<05:46,  1.09it/s]training loss: 0.3604:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3223:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2396:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2720:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3061:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3163:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3326:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2609:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2643:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3067:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2719:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2885:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3159:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3438:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2616:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3060:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2363:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2701:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2906:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3229:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2654:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2737:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3038:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2975:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2653:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3079:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3053:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2403:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2833:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3105:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2456:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3403:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2987:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2859:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3250:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2819:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2915:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2569:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2655:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3116:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2371:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2750:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3084:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3051:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2545:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2619:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2836:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2803:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3728:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2911:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3663:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3132:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2794:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2545:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2769:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2983:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3013:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2110:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2985:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2917:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2813:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2857:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2418:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2641:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2728:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2066:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2496:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2671:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2307:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2724:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2932:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3329:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2784:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2910:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2813:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3164:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.3506:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2295:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.2831:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.4534:   6%|▌         | 23/401 [00:16<05:19,  1.18it/s]training loss: 0.4534:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2789:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2594:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2788:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2902:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2573:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2843:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3297:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2632:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2372:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2417:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3209:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3138:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3080:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3105:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3451:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2352:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2818:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3315:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2863:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2014:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3650:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2979:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2640:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2987:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3744:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2775:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2615:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2439:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3011:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2223:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2887:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2476:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2652:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2596:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3056:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.2997:   6%|▌         | 24/401 [00:16<04:21,  1.44it/s]training loss: 0.3076:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3058:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2781:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3115:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2754:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2883:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2641:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2895:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2675:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2736:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3119:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2731:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3169:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2290:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2852:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2967:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2561:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2620:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2477:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2903:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2524:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3222:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2760:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2851:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2676:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.1843:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2125:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3085:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3090:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2910:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2660:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2315:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2659:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2747:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2637:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2993:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3030:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2978:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3111:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2528:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3145:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.3084:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2554:   6%|▌         | 24/401 [00:17<04:21,  1.44it/s]training loss: 0.2554:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2905:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2536:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2582:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2901:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2669:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3057:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2795:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2931:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2984:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2973:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3223:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2832:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2657:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2712:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3299:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3236:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3311:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3307:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2672:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3077:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3025:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3290:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2869:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2151:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3079:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2460:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2894:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2972:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2653:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2563:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3193:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2696:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2829:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2659:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2612:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2513:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2974:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3227:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2410:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2609:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3452:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3011:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2976:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3086:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3446:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3455:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2614:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3315:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2303:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2442:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2865:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3053:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3202:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2804:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3060:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2254:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2940:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3384:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2830:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3135:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3092:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2537:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3644:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2756:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3407:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.4003:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2899:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.3103:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2955:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2819:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2703:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2845:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2593:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2608:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2294:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2755:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2312:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.2915:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.4981:   6%|▌         | 25/401 [00:17<03:38,  1.72it/s]training loss: 0.4981:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2802:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2594:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3125:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3170:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2486:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2843:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2624:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2890:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2938:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2538:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2860:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2950:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3126:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3089:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3235:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3276:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2942:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3234:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3002:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2706:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3025:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3211:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2693:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2844:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2672:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2888:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2250:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2773:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3123:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3314:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2936:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3125:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3028:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3323:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3255:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2738:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2992:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3583:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2809:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2488:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2994:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2232:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3048:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2839:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2282:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2992:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2153:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3212:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2708:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3297:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3049:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2490:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3294:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3004:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3142:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2748:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2626:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2934:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3633:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2987:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2498:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3458:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3675:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2860:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3025:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2660:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2933:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2829:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3203:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2613:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3075:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3179:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2361:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.3145:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2515:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2650:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2797:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2626:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2795:   6%|▋         | 26/401 [00:17<03:07,  2.00it/s]training loss: 0.2795:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2943:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3044:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3107:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2731:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2885:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2863:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2304:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2275:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2935:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2431:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2627:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2972:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2765:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2884:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2706:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2879:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2710:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2557:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3213:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2620:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2532:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2363:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2760:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2241:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2813:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3010:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2841:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2309:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3005:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3057:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3479:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2284:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2633:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2419:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2668:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2675:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2920:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2636:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2764:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2827:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2901:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2655:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2578:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2948:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3093:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2650:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2790:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3147:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2951:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2350:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2499:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2313:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.2756:   7%|▋         | 27/401 [00:17<02:44,  2.27it/s]training loss: 0.3283:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.3093:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2311:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.3603:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2837:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.3383:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2477:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2648:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.3256:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2953:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.3345:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2865:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2708:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2819:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2548:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2240:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2732:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2687:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.3751:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2843:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.3102:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2559:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.3457:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2866:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.2615:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.1439:   7%|▋         | 27/401 [00:18<02:44,  2.27it/s]training loss: 0.1439:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2735:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3315:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2507:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2694:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2701:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3184:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3099:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2846:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3413:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2710:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3021:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2826:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2634:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3090:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2826:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2512:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2887:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2742:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2646:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2657:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3174:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2917:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2876:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2987:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3373:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3219:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2809:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2169:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2941:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2924:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3321:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2309:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2932:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2257:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2641:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3004:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2713:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3368:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2712:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2842:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2397:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2856:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3185:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2526:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2785:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2705:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3176:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3148:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2613:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2979:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2652:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3281:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3311:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3060:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2337:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3024:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2816:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3341:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3076:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2347:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2356:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2950:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2823:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2839:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2674:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2859:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3025:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3244:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3090:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2899:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2921:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3346:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3021:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3075:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2736:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2767:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.3227:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.2587:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.1263:   7%|▋         | 28/401 [00:18<02:29,  2.49it/s]training loss: 0.1263:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3798:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2920:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2827:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2806:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3272:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2098:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2974:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2462:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2788:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2607:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2728:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2779:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2922:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3033:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3153:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2269:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2665:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3653:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3237:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2986:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2687:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2598:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3767:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2738:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2508:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2741:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3523:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2510:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2652:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2650:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3185:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2723:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2416:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2805:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2539:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3044:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2968:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3682:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3029:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3511:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2776:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3179:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2965:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2821:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2541:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2258:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2641:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2970:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2509:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2384:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3022:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3046:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2713:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2871:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2757:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2670:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3097:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3161:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2847:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3304:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3141:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2592:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2360:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3086:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3455:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2741:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2987:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3313:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2863:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2710:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3220:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2797:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2860:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2565:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.3490:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2972:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2580:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.2963:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.0885:   7%|▋         | 29/401 [00:18<02:20,  2.66it/s]training loss: 0.0885:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2823:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2748:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2443:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2965:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2220:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2214:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2886:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3500:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2046:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2974:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3669:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3093:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2728:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2706:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3442:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3019:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3006:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2812:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3248:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3070:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2673:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2780:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3457:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2937:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2974:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2487:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2850:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2918:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3019:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2777:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3327:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2277:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3136:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2288:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2938:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2560:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2876:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2845:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3169:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2690:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2402:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.1859:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3050:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3109:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2572:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2490:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2551:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2779:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3372:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3175:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2969:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2341:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2703:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2576:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2872:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2706:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3187:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2411:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2993:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2674:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2655:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.3040:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2513:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2752:   7%|▋         | 30/401 [00:18<02:14,  2.77it/s]training loss: 0.2369:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.3001:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.2749:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.3065:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.3094:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.2453:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.2548:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.3283:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.2720:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.3060:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.3281:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.2582:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.4137:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.2926:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.1387:   7%|▋         | 30/401 [00:19<02:14,  2.77it/s]training loss: 0.1387:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3148:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2770:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2525:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2784:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3091:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2619:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2370:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3078:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3233:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2855:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2826:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2956:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2682:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2725:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3085:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2259:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3138:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2839:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2278:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3536:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2783:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3123:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2840:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2874:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2803:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2992:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3389:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2230:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2897:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2887:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2696:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3283:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2417:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2460:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2456:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2871:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2977:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2647:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2956:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2440:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2675:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3035:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2416:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2760:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2764:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2953:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2939:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2714:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2919:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2868:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2744:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2964:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3188:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3129:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2403:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2702:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2964:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2311:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3168:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3156:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2565:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2768:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2675:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2840:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2916:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2941:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3278:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3181:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2761:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2862:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2953:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2848:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2733:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3289:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2643:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3023:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.2733:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.3123:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.1673:   8%|▊         | 31/401 [00:21<06:43,  1.09s/it]training loss: 0.1673:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2829:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2580:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2870:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.3163:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.3096:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2784:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2902:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2703:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2481:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.3043:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2740:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.3000:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2792:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2815:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2408:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2592:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.3311:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2332:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2470:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2671:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2850:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2553:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2701:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2978:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.3335:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2996:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2616:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2656:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2906:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2949:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2924:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2888:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2744:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.2799:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.3009:   8%|▊         | 32/401 [00:21<05:18,  1.16it/s]training loss: 0.3137:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2903:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2987:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3399:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3444:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3249:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2927:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2547:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2057:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2356:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2909:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3838:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2476:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3419:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3126:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2763:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2715:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3127:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2840:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3620:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2713:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2021:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3120:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2998:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2580:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2685:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3204:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3603:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3322:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2688:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2517:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2723:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2285:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3290:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3402:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2695:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2640:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2680:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2837:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2532:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3506:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.2453:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3445:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3805:   8%|▊         | 32/401 [00:22<05:18,  1.16it/s]training loss: 0.3805:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3181:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2864:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3495:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2545:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2788:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2489:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2469:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2422:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2839:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2757:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3060:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3399:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2244:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2619:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2669:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3040:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3115:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3130:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3037:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3319:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2847:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2806:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2571:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2660:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2611:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2726:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2426:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2692:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3155:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3018:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2993:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2952:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3063:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2599:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2558:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2639:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3578:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2681:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2398:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3557:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3161:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2887:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2622:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2581:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2712:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2983:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3595:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2329:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3284:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.1949:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3017:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2635:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2718:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2803:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3209:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2613:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3559:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2735:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3302:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3084:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3001:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3061:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3415:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2998:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2960:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2621:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3123:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2423:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2186:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3183:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.3412:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2829:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2536:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2840:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2563:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2653:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2797:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.2935:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.1199:   8%|▊         | 33/401 [00:22<04:21,  1.41it/s]training loss: 0.1199:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3040:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2705:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3063:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2614:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2967:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2313:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2842:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3054:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3589:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3433:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2466:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2665:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3794:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3381:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3055:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2976:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2664:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2775:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2507:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2608:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3053:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3137:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2723:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2533:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2713:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3551:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2460:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2602:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2853:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3494:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2741:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3199:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2809:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2826:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2412:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3723:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3241:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2613:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3090:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2776:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3030:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2676:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2593:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3288:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2554:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2420:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2588:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3001:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2448:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2536:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2794:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2593:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2440:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2734:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2444:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3143:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2467:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2723:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2737:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2781:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3131:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3219:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3184:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2737:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.3258:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2950:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2465:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2420:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2509:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2718:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2731:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2453:   8%|▊         | 34/401 [00:22<03:44,  1.63it/s]training loss: 0.2993:   8%|▊         | 34/401 [00:23<03:44,  1.63it/s]training loss: 0.2360:   8%|▊         | 34/401 [00:23<03:44,  1.63it/s]training loss: 0.2523:   8%|▊         | 34/401 [00:23<03:44,  1.63it/s]training loss: 0.3248:   8%|▊         | 34/401 [00:23<03:44,  1.63it/s]training loss: 0.2453:   8%|▊         | 34/401 [00:23<03:44,  1.63it/s]training loss: 0.2655:   8%|▊         | 34/401 [00:23<03:44,  1.63it/s]training loss: 0.3804:   8%|▊         | 34/401 [00:23<03:44,  1.63it/s]training loss: 0.3804:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2627:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3394:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3709:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3120:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2644:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2344:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2730:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2448:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2749:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3189:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2864:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2861:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2958:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3199:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2735:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2975:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2522:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3534:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2618:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3351:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3508:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2983:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2606:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2226:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3356:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2828:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3078:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2908:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2541:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3122:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3303:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3214:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2925:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2883:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3021:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2755:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2939:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2196:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3182:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2804:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2689:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2878:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2752:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2708:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3331:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3453:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2878:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2396:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2541:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2984:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3286:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3213:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2912:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2625:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2349:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2772:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2610:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3154:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2602:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2633:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2419:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2987:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3511:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3403:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3103:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2867:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2934:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2486:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2988:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2327:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2809:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3020:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2700:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2403:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2776:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3169:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.3049:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.2792:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.1956:   9%|▊         | 35/401 [00:23<03:23,  1.80it/s]training loss: 0.1956:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2920:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2767:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3199:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2711:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2683:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2903:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2602:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2493:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3104:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3040:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2249:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2869:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3542:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3380:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3263:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2662:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3307:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2842:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2907:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2602:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2665:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3287:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2943:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3155:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3251:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2725:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2475:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2364:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2545:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2736:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2531:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2658:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2948:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3073:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3634:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3056:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2862:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3239:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3117:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2529:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2995:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2915:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3072:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2673:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3104:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2867:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3081:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3638:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2738:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2466:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2272:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2917:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2318:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3369:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3117:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3195:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3468:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2794:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2911:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3407:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2555:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3717:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2874:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2952:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3205:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2414:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2661:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3022:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2702:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2513:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2848:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2705:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2856:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3143:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2476:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2472:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.3490:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2494:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2455:   9%|▉         | 36/401 [00:23<02:56,  2.07it/s]training loss: 0.2455:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2930:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3273:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2709:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3942:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3016:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2929:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3063:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2601:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3164:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2907:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2923:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2686:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2852:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3705:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3364:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2735:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3444:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2677:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2887:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3146:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2848:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3394:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2814:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2761:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2866:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3673:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3093:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3077:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2515:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2552:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2991:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3701:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2841:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2257:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2655:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2462:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2820:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2745:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2881:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3635:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3407:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3466:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3233:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3041:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2438:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2439:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2984:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3044:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2436:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2854:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2798:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3537:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2521:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2992:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2413:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2649:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2949:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3176:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3101:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2950:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2792:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2691:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2476:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3194:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2761:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3037:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2820:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3232:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3022:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2593:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2963:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3053:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2973:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2259:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2831:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.2601:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3057:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.3016:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.1851:   9%|▉         | 37/401 [00:23<02:37,  2.31it/s]training loss: 0.1851:   9%|▉         | 38/401 [00:23<02:24,  2.51it/s]training loss: 0.2834:   9%|▉         | 38/401 [00:23<02:24,  2.51it/s]training loss: 0.2484:   9%|▉         | 38/401 [00:23<02:24,  2.51it/s]training loss: 0.2771:   9%|▉         | 38/401 [00:23<02:24,  2.51it/s]training loss: 0.3145:   9%|▉         | 38/401 [00:23<02:24,  2.51it/s]training loss: 0.2705:   9%|▉         | 38/401 [00:23<02:24,  2.51it/s]training loss: 0.2565:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3184:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3481:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2999:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2526:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2680:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3637:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3156:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3441:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2699:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2593:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2092:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3145:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3255:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3238:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2072:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3056:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2419:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3427:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3889:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2483:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3023:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2509:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2661:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2332:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2913:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3167:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2854:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3559:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2676:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3068:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2250:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3038:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2719:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2987:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2504:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3005:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2734:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3433:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3389:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2443:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2493:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2780:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2337:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2942:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3027:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2645:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2845:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2794:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2866:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2588:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2319:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2813:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2538:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3641:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2730:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2675:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2740:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3285:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2941:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2537:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2494:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2832:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3105:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2852:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2263:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2674:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2758:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3187:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2896:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3204:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.3547:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.2923:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.1324:   9%|▉         | 38/401 [00:24<02:24,  2.51it/s]training loss: 0.1324:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2208:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3003:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3106:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3145:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2590:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2720:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3296:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2873:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2572:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2774:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2820:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2685:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2638:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2683:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2974:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3205:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3455:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2662:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2913:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2948:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2705:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.1965:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3030:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3118:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2425:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.2544:  10%|▉         | 39/401 [00:24<03:11,  1.89it/s]training loss: 0.3228:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3091:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2912:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3295:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2591:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2704:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2679:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2488:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2506:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3138:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2700:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3281:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2779:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2461:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2951:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2409:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2934:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2582:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2731:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2913:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2922:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2412:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2947:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2012:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3362:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2610:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3017:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2726:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2975:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2488:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3064:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2593:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2162:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2812:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2503:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3520:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2589:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2597:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2772:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2965:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2981:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2756:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2897:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3230:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.3446:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2942:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2399:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2621:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2724:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2618:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2806:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.2583:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.4315:  10%|▉         | 39/401 [00:25<03:11,  1.89it/s]training loss: 0.4315:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3280:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2804:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3181:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2885:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2949:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3327:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2809:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3051:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2577:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2539:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3080:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2746:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3189:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2999:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2633:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2640:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2452:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3034:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2694:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2275:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2916:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2543:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3088:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2573:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3304:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2816:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2832:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2790:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2949:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2914:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2823:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2615:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3095:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3303:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3023:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2495:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2720:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2998:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2794:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3028:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2030:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2872:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3131:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2880:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3331:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2533:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3756:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2831:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2568:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3526:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2379:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2594:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3137:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2815:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3131:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2780:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2294:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3180:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3536:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2754:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2674:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2685:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2687:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2832:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2955:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2459:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2784:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2901:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2371:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.3116:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2790:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2402:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2372:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2789:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2978:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2784:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2900:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.2571:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.1537:  10%|▉         | 40/401 [00:25<02:57,  2.03it/s]training loss: 0.1537:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.3263:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2226:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2900:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2577:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.3167:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.3149:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2625:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.3110:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.3021:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2230:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2866:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2487:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.3375:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2699:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2591:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.2454:  10%|█         | 41/401 [00:27<06:57,  1.16s/it]training loss: 0.3466:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3110:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2373:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2848:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2876:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3434:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3080:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2047:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2536:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2570:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2789:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2362:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3188:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2958:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2927:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2592:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2257:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3033:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2593:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3070:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2948:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2085:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2794:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2372:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3162:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2878:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2918:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2621:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2758:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3221:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3221:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2357:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2741:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3442:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2861:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3492:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2777:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2966:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3361:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2118:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2831:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2581:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2959:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2949:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2950:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2692:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3030:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2686:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2804:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2468:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3227:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3131:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2975:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2749:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2434:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2692:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3266:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2858:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3441:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.3276:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2902:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.2971:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.1553:  10%|█         | 41/401 [00:28<06:57,  1.16s/it]training loss: 0.1553:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3492:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3864:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2382:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2575:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2398:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2664:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3403:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3321:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3030:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2962:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2552:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2884:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2953:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2969:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3667:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2783:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2980:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2525:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3084:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2521:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2591:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3165:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2991:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2845:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2873:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3423:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3150:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3542:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2711:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2861:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2674:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3288:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3458:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3356:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2812:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2862:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2423:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2570:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3410:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3232:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3251:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3136:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2940:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2535:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3680:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2611:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2432:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3496:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3296:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2313:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2512:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2792:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2656:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2789:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3377:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3064:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2491:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2814:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2680:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2970:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2572:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2682:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2742:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2652:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2528:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2933:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2948:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2545:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3051:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2607:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2740:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2570:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2879:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2620:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3003:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.3005:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2453:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.2971:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.1807:  10%|█         | 42/401 [00:28<05:26,  1.10it/s]training loss: 0.1807:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2759:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3166:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3312:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2472:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2942:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2614:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2830:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2773:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3037:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2799:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2988:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2752:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2676:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3719:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2665:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2743:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2567:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2901:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2624:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3121:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3118:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3026:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3139:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3057:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2991:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3427:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2844:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3449:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2410:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2974:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2875:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2986:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2925:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2949:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2648:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2671:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2647:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2846:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3258:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3334:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2188:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3342:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3302:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3389:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2182:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3014:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3079:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3065:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3058:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2963:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2286:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2996:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3154:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3136:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3088:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3234:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3244:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2592:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3172:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2655:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2832:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3119:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3019:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3193:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2880:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3216:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2771:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3319:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2766:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3111:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2251:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2860:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3352:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2882:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2688:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3112:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3189:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.2888:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3462:  11%|█         | 43/401 [00:28<04:21,  1.37it/s]training loss: 0.3462:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2671:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2713:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2315:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2728:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2308:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2606:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.1817:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2842:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2452:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.3380:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2842:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.3463:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2611:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2883:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.3198:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2864:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2528:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2329:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2527:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.3398:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.3252:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2383:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2638:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2947:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2587:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2554:  11%|█         | 44/401 [00:28<03:37,  1.64it/s]training loss: 0.2352:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3072:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2845:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2770:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2792:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2833:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2560:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2877:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3016:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2239:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2521:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3381:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2838:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2812:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3280:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2711:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2525:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2525:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3021:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2558:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3141:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2847:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2511:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3143:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2730:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2765:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2723:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2518:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2724:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2963:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2524:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2852:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2978:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2771:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2696:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2929:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2331:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2654:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2868:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2774:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2650:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3062:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3190:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.3398:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2963:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2455:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2637:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2475:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2851:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2604:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2655:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2985:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2812:  11%|█         | 44/401 [00:29<03:37,  1.64it/s]training loss: 0.2812:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2521:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2826:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2901:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2777:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2479:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2695:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2824:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2385:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2584:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3200:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2220:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2609:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2813:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2883:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2427:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2893:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2704:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3354:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2864:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2654:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2975:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2627:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3149:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2824:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2666:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2662:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3038:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3024:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3045:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2716:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2774:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2825:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2457:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2722:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2808:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3028:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2462:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2823:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2901:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2429:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3014:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2702:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2974:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3396:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3386:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3366:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3036:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3111:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2640:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3475:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2758:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2751:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2834:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2903:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3047:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2469:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3139:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2895:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3422:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2013:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2725:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3363:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2615:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3104:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2824:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2714:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2605:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2904:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3167:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3385:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2548:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2646:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3412:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2997:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2233:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2368:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2440:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.2742:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3513:  11%|█         | 45/401 [00:29<03:05,  1.92it/s]training loss: 0.3513:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2600:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3048:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2494:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2933:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2428:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2747:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2997:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3097:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2935:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2777:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2315:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2953:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2640:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3121:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2726:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2822:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2484:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2943:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2978:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3236:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2325:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3372:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2897:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2844:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3073:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2720:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2764:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3009:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2759:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3080:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2603:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2899:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2704:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3350:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2818:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2811:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2661:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2585:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3213:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2949:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2430:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2879:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3045:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2185:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2554:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2552:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3015:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2539:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3235:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3179:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2842:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3034:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3068:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2906:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2419:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2894:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2692:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2668:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3200:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3035:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2408:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2792:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2840:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3011:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2960:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2903:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2727:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2888:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2849:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3001:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3413:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2681:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2727:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2409:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3362:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.3019:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2317:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2439:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2786:  11%|█▏        | 46/401 [00:29<02:43,  2.17it/s]training loss: 0.2786:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3648:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2791:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2488:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2602:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3199:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3155:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2370:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2374:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3241:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2686:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2348:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3097:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2977:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2462:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2602:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2625:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2789:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2821:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2728:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2554:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2624:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2732:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3244:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2834:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2987:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3036:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2531:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2759:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2218:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2727:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2869:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2484:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3256:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2653:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.3358:  12%|█▏        | 47/401 [00:29<02:28,  2.38it/s]training loss: 0.2821:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3430:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2261:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2755:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3202:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2811:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2260:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3656:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2753:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2816:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3118:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3213:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3106:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2941:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2972:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3439:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2201:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2275:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3192:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3046:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2632:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2447:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2399:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2892:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2756:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2636:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2389:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3072:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2716:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2904:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3007:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2897:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2539:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3089:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2997:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2889:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2806:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2834:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3339:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3175:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3269:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2731:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.2895:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3762:  12%|█▏        | 47/401 [00:30<02:28,  2.38it/s]training loss: 0.3762:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3096:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2440:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2941:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3281:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2777:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3660:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2593:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3324:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2801:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2143:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3357:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2890:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3255:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2612:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2379:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2954:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2695:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2604:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3004:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2420:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3103:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2516:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2866:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3086:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2754:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3764:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3094:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2979:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2530:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2174:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2283:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2400:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2782:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2813:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3047:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2679:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2933:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3102:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3077:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2323:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3127:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2806:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2622:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3204:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2492:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2585:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3227:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2366:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2657:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2885:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2289:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3220:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2894:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2722:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3077:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2903:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2813:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2633:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2389:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2290:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3168:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3179:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3151:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3210:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2640:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2768:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3851:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2888:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2242:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2578:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2839:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2945:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3170:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2286:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2961:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2727:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.3105:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2762:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2892:  12%|█▏        | 48/401 [00:30<02:17,  2.56it/s]training loss: 0.2892:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2845:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2843:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2714:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2830:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3254:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3168:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2942:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2697:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2699:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2907:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2655:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2678:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2833:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3386:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2814:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3043:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2429:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3080:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2390:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2305:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2892:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2857:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2884:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3580:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2795:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3257:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2923:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2683:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3011:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2446:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3132:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3189:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2589:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2995:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2600:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2772:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3276:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2395:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2658:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2733:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3009:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2943:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3127:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2880:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2862:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3596:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3055:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2310:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2458:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2635:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2983:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3372:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2501:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2770:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2965:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2751:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2845:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2779:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2913:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3134:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2660:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3097:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2694:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2788:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2928:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3403:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2521:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3729:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2510:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3083:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3365:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3209:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3128:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2614:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2845:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2266:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3186:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.2599:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3076:  12%|█▏        | 49/401 [00:30<02:09,  2.73it/s]training loss: 0.3076:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2633:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2156:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3459:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3269:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3125:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2412:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3252:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2300:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2753:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3437:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3211:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2914:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2549:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2669:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2790:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2737:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2556:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2886:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3515:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3204:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2462:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2512:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3125:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2916:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2782:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3139:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3650:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2789:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2612:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2598:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2493:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3027:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2484:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2944:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3088:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2442:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2731:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2747:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3691:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3161:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3391:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3495:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2706:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2563:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2446:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3595:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3280:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2940:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.3070:  12%|█▏        | 50/401 [00:30<02:03,  2.85it/s]training loss: 0.2987:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2200:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3235:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3082:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2729:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2657:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2740:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.1956:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3126:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3054:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2996:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2263:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2802:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3110:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3202:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3030:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3063:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2756:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2380:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2612:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3322:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3189:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2719:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3042:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3572:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3412:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2491:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.3154:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.2721:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.1697:  12%|█▏        | 50/401 [00:31<02:03,  2.85it/s]training loss: 0.1697:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2777:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2756:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2917:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3207:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3182:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2763:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2775:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2657:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2709:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2937:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2646:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2697:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3308:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2237:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2806:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3141:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3249:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2816:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2617:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2497:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2969:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2626:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2199:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2437:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2165:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2645:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3183:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2732:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3506:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3011:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3096:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2231:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3752:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2631:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3280:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2563:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3266:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3178:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2652:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3239:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2804:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2424:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3140:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3036:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2498:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2988:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2883:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2588:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2338:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3034:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3040:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2819:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3408:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2557:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2901:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2886:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2910:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3624:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2336:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2636:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2880:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2514:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3169:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2843:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2523:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2404:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2885:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3023:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2915:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2574:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2629:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2678:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3308:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2653:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3086:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2469:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.2746:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.3100:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.4521:  13%|█▎        | 51/401 [00:33<06:16,  1.07s/it]training loss: 0.4521:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2787:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2290:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2598:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2924:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2768:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2835:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.3050:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2330:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2554:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.3050:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2537:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.3013:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2831:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2668:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2709:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2951:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2945:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2816:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2187:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2419:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2906:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2656:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2291:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2589:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2728:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2627:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2891:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2807:  13%|█▎        | 52/401 [00:33<04:55,  1.18it/s]training loss: 0.2974:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2970:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2420:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2927:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3139:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3180:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2603:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2805:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.4065:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2765:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3086:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3001:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2774:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2924:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2816:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3154:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3019:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2811:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2145:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2832:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2616:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2828:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2549:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2745:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2532:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2438:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3024:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2948:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2327:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2498:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2747:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2641:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3009:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2768:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2635:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3030:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2658:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3165:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2863:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2958:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3013:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2475:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2593:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2768:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2642:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2534:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3039:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3105:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.3196:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.2517:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.6055:  13%|█▎        | 52/401 [00:34<04:55,  1.18it/s]training loss: 0.6055:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2354:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2869:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3243:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2829:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3267:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3498:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2607:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.1747:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2751:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2942:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3087:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2530:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2681:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2353:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2400:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3454:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2663:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2736:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2763:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2778:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2729:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3529:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3054:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2607:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2977:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2688:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2929:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3479:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3088:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2909:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3492:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3343:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3148:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2473:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2266:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2960:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2147:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2925:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3022:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2946:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2146:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2548:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2518:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2195:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2518:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2265:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3119:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2674:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2683:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2678:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2751:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2650:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3283:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2998:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3199:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2975:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2383:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3007:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2825:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2559:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3057:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2699:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2912:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2753:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2779:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2222:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2730:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2930:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2960:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2183:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3106:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3284:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3353:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2889:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2662:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2725:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.2297:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.3008:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.1904:  13%|█▎        | 53/401 [00:34<04:00,  1.45it/s]training loss: 0.1904:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2861:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2727:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2669:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2035:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2614:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2644:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2712:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2785:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2512:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2780:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2436:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3419:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3297:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2143:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2557:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2083:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3021:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2404:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2392:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2778:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3169:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2572:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2301:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3321:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3225:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2825:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3090:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2833:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2907:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2674:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2315:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3145:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2583:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2980:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3226:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2963:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2574:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2701:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3074:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2801:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2491:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3605:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2595:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2718:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2637:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2547:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2691:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3513:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3266:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2874:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2296:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2439:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2999:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3109:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2691:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2813:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2673:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2857:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3041:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3035:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3067:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3309:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2457:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2516:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2221:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2966:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2839:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2304:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2214:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2714:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2534:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2715:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3061:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.3060:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2827:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2386:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2555:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2944:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2509:  13%|█▎        | 54/401 [00:34<03:22,  1.71it/s]training loss: 0.2509:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3120:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2742:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2669:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2327:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2500:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2868:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2360:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3558:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2810:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2601:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2795:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3494:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2936:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2808:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3042:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2169:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3354:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3635:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2308:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2608:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2919:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2749:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3184:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2760:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2716:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2948:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3131:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2738:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2978:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2817:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2568:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.3475:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2932:  14%|█▎        | 55/401 [00:34<02:54,  1.98it/s]training loss: 0.2291:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2827:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2361:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3018:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2973:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2928:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2715:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3221:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2801:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2700:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2720:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3034:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2826:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3052:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2857:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2764:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3162:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2923:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2552:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3134:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3159:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3418:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2959:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3446:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2479:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2748:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2770:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3230:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2628:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3640:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2526:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3018:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3059:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2517:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2302:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2963:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2877:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2740:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2675:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2913:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2478:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2536:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2950:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2516:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.2806:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3384:  14%|█▎        | 55/401 [00:35<02:54,  1.98it/s]training loss: 0.3384:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3149:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3561:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2610:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2704:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2614:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2934:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3159:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2732:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2401:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3765:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2787:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2515:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2728:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2881:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2474:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2598:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3315:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2887:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2541:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2566:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2633:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2901:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2533:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2852:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3169:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2196:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2440:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2712:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2865:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3350:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2549:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2745:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3038:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2489:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2712:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3262:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2629:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2677:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2650:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3360:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2645:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2642:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3214:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2784:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2678:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2975:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3012:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2922:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2670:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2709:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2484:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3473:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2964:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3326:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2785:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2735:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3086:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3549:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2781:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2130:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2249:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2821:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2862:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3196:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2623:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2433:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3271:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3022:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2702:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2429:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2593:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2518:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2875:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2703:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3005:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3076:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.3118:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.2653:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.5124:  14%|█▍        | 56/401 [00:35<02:34,  2.23it/s]training loss: 0.5124:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3272:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2655:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2550:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2720:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2542:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2844:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2696:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2509:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2688:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3555:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2630:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2975:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3137:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3291:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2906:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2911:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2661:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3013:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2469:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2644:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2883:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2804:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3947:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2205:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3051:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2356:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2475:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2515:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3047:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2953:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2653:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2669:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2951:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2679:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3562:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3024:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3436:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2809:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2334:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2512:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2699:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2539:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3249:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3700:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2859:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2883:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2608:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2913:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2935:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3588:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2309:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3521:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2779:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3143:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2442:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2497:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3032:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3010:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2585:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2821:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2843:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2774:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3171:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2831:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2232:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2900:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2630:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2889:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2561:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2844:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2802:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3231:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2943:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3178:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3238:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.3027:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2565:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2302:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2268:  14%|█▍        | 57/401 [00:35<02:20,  2.44it/s]training loss: 0.2268:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2647:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3019:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2319:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2533:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2891:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2891:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3663:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2915:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3038:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2712:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3082:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2928:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2647:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2885:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3297:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3192:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2599:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2665:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2600:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2740:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2565:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2897:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2401:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2851:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2359:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2809:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3010:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2826:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2567:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3024:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2951:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3394:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3263:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2934:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2374:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2490:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2201:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2362:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2192:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2917:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2555:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.3058:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2615:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2336:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2691:  14%|█▍        | 58/401 [00:35<02:10,  2.62it/s]training loss: 0.2838:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2979:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2781:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2646:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2714:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2985:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3068:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3199:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2629:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2743:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2909:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3239:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2984:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3142:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2678:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3210:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2653:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2925:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3361:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2449:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2856:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2987:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3157:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3333:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2968:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3130:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2877:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2299:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3109:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3262:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.3027:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2629:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2786:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2587:  14%|█▍        | 58/401 [00:36<02:10,  2.62it/s]training loss: 0.2587:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2561:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3281:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3235:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2945:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3300:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2264:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2791:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2703:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2957:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2897:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2694:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3340:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3477:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2809:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2431:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2328:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2853:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3208:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2339:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2953:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2444:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2852:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2337:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2663:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2940:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3455:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3029:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2566:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3015:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2854:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2827:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3101:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2777:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2592:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2673:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3355:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2709:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2732:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2701:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3169:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2376:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3196:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2247:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2561:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2106:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2671:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2595:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2155:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3053:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3148:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3158:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2259:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2999:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3100:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2806:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3293:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2554:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2911:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2818:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2871:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2883:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2639:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2249:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2963:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2861:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2848:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2981:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2716:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2958:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2905:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3265:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3097:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3145:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2707:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2527:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2779:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.3062:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2821:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2543:  15%|█▍        | 59/401 [00:36<02:08,  2.67it/s]training loss: 0.2543:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2285:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2607:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2912:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2940:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3002:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3178:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2717:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2509:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2868:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3091:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2104:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2610:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2862:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2599:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2842:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3014:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2605:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3131:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2263:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3105:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2209:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2667:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2480:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2271:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3180:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3102:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3008:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3202:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2682:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2590:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2443:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3336:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2537:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3554:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3080:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2433:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2461:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2618:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2313:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3027:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3179:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2687:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2940:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2992:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3003:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3315:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2653:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2957:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2884:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2950:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2351:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2905:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3321:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2460:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2960:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3306:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3135:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2350:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3467:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2983:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2747:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2964:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2014:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3025:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2297:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2608:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3384:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2526:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2408:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3296:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.3686:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2670:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2963:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2907:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2750:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2283:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2813:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2989:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2756:  15%|█▍        | 60/401 [00:36<02:09,  2.64it/s]training loss: 0.2756:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2578:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3001:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2826:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2920:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2735:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3296:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2729:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2560:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3179:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2944:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2892:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2556:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2550:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3220:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3305:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3123:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3050:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3346:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2719:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2472:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3262:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2164:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3253:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3211:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2489:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2949:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3395:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2751:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3373:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2476:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2748:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3013:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2786:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2992:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3284:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2486:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2896:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2968:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2723:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3053:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3075:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3084:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2938:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3177:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2679:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3594:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2534:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2728:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2849:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2326:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3047:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3052:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2859:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3530:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3087:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2350:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2706:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2486:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2919:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2711:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2416:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3120:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3291:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2928:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2879:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2289:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2830:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2909:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3439:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2105:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2826:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2832:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2929:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2643:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2240:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.2657:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3215:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.3342:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.5418:  15%|█▌        | 61/401 [00:39<05:48,  1.02s/it]training loss: 0.5418:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3660:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2434:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3329:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2569:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2830:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3396:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3172:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2444:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2475:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2865:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2785:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2762:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2869:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2512:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3070:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2212:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3621:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2974:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2311:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2838:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2691:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2367:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2802:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3200:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2677:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2509:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3261:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3446:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3073:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2493:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2354:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2567:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3136:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2577:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3092:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2460:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2734:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2804:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2274:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3243:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2459:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2380:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2920:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2375:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2825:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3081:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2959:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3657:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3157:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2738:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2428:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3405:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3059:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2921:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3095:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2739:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3022:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2832:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2677:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2882:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2317:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2828:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3052:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2982:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2848:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2383:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2867:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2919:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2699:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2725:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2722:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2482:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2865:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3018:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2938:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2450:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2700:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.2948:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3680:  15%|█▌        | 62/401 [00:39<04:35,  1.23it/s]training loss: 0.3680:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2782:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2940:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3188:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2495:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2694:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2392:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3105:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2629:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2681:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2711:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2378:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3340:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3187:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2893:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3141:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2734:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2707:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2549:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3173:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2831:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2997:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2298:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2755:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3255:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2873:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2736:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2639:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2793:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2762:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2797:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2907:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2181:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2569:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2754:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2609:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3195:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2785:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2661:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2885:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2568:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2880:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2920:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2833:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2472:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3225:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2978:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2891:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2658:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2333:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2999:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3039:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3112:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3219:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2618:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2593:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2821:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2372:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3144:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2706:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2899:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2850:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2876:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2097:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3068:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2936:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.3351:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2603:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2984:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2738:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2674:  16%|█▌        | 63/401 [00:39<03:43,  1.51it/s]training loss: 0.2488:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2846:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2770:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2795:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2967:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2886:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2452:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2723:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2951:  16%|█▌        | 63/401 [00:40<03:43,  1.51it/s]training loss: 0.2951:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2845:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2715:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2474:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2548:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2983:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3410:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2701:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2934:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3147:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2799:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2688:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2661:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2830:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2551:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2982:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2587:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2823:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2621:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3329:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3034:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3038:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2385:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3005:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3270:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2781:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2490:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2849:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3142:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3003:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2560:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2726:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2566:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2953:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2543:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2753:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2934:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3380:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3408:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2501:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2751:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2566:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2596:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3559:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2781:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2642:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2376:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2639:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3336:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2618:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2588:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2557:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2714:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2501:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3347:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3271:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2638:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3054:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2015:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2506:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3501:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2758:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2539:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3670:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2780:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2694:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3016:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2306:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3085:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2823:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2391:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3005:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2894:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2392:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3036:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2148:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3055:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.3022:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.2575:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.1220:  16%|█▌        | 64/401 [00:40<03:07,  1.80it/s]training loss: 0.1220:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3374:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3050:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3305:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3348:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3019:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3037:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2616:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2628:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2955:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3013:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2520:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2783:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2583:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2731:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2889:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3234:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2660:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2727:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2541:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2300:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2629:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2154:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2708:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3814:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2778:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3048:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2759:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.4337:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3246:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2516:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2869:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3096:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3338:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3139:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2977:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2780:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2956:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3321:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2933:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2758:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3122:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3409:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2548:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3235:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3392:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3023:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3224:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2763:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2591:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2710:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2663:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2829:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2548:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2907:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2746:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3452:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3030:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2377:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2941:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2655:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2931:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3219:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2479:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2998:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2002:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2625:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2926:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2345:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2806:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2946:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2834:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2957:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2936:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3157:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2372:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2749:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3409:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.2738:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3730:  16%|█▌        | 65/401 [00:40<02:42,  2.06it/s]training loss: 0.3730:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2703:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2926:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2177:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2749:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2896:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2804:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2605:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2601:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2646:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2583:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2878:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3155:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2779:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2945:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3342:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2245:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3394:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2824:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2719:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2592:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3501:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2843:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3002:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2825:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2867:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2646:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3199:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2988:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2546:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2923:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3012:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3075:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2801:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2798:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2951:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3643:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2784:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3015:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2151:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2932:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3229:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3351:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2681:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2282:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3163:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3114:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2761:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3291:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2648:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2697:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2594:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2942:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2955:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2531:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3572:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3058:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3632:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.1991:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3024:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2778:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2990:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3179:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3071:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3230:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2977:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2773:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2585:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3101:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2816:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2402:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2782:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2812:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3047:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2526:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3446:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3139:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2974:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.2756:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3344:  16%|█▋        | 66/401 [00:40<02:25,  2.30it/s]training loss: 0.3344:  17%|█▋        | 67/401 [00:40<02:13,  2.50it/s]training loss: 0.3127:  17%|█▋        | 67/401 [00:40<02:13,  2.50it/s]training loss: 0.3126:  17%|█▋        | 67/401 [00:40<02:13,  2.50it/s]training loss: 0.2991:  17%|█▋        | 67/401 [00:40<02:13,  2.50it/s]training loss: 0.2797:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2797:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2820:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3023:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2488:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3290:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3047:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2855:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2990:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2776:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2915:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2730:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2915:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3024:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3366:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3010:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3117:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2703:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2688:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2640:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2472:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2741:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3016:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2957:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3237:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2851:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3084:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3168:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3160:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2661:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2762:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3002:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3128:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2952:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2734:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2709:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2529:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2818:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2838:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3411:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2444:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2239:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3163:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2507:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2874:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2882:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2924:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3039:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2803:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2844:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3177:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3054:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2341:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3202:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2808:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2620:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3012:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2507:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2470:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2598:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2812:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2480:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2611:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2997:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3625:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.1970:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3106:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2293:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2744:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2772:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2956:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3069:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3290:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.2750:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.3036:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.4108:  17%|█▋        | 67/401 [00:41<02:13,  2.50it/s]training loss: 0.4108:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3617:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2466:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2732:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2816:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2653:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3312:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2724:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2778:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2624:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3306:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2379:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2526:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2788:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3473:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2630:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3222:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2820:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2359:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2788:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2479:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2527:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2875:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2961:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2567:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2775:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2950:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3160:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3010:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2879:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3073:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2846:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2714:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3124:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3156:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2650:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3220:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3020:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2387:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2763:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2754:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3140:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3378:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2862:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2647:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3182:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3415:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2407:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3060:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3079:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2535:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2624:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2885:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2540:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3006:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2882:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2691:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2985:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2460:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3258:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3188:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2814:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2549:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3002:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2522:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2748:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2936:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3407:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2763:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2853:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2504:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2753:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2593:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2731:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2194:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3445:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2904:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.2663:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.3152:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.1539:  17%|█▋        | 68/401 [00:41<02:05,  2.66it/s]training loss: 0.1539:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3025:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2997:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2903:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2656:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2617:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2574:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3116:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2897:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2715:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2757:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3166:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2920:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2634:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2742:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2958:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2709:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2816:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2670:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2784:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3045:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3256:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2468:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2843:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3426:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3222:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2573:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2787:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2870:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3119:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2740:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2789:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3180:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2637:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3655:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3105:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2695:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2956:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2242:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2549:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3046:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2721:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2425:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3308:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2878:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3199:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2820:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3060:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2885:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3211:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2662:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3246:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2782:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3031:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2672:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3779:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2980:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2833:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2756:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3152:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2798:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2244:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2525:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3021:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2840:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2802:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2988:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2570:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2692:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3285:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2163:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2491:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2665:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2527:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3023:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2900:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2361:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.3054:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.2777:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.4971:  17%|█▋        | 69/401 [00:41<01:59,  2.79it/s]training loss: 0.4971:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2510:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2535:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2212:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2743:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2427:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2952:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.3255:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2493:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.3504:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2542:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.3043:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2590:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2736:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2562:  17%|█▋        | 70/401 [00:41<01:54,  2.89it/s]training loss: 0.2648:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3021:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2624:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2382:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2889:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2440:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2773:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2721:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2696:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3240:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2657:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3128:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2679:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2611:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3164:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2736:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2694:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2433:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2955:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2566:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2987:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2784:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2952:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3037:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2563:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3306:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2392:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2595:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3049:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2496:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3292:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2705:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2531:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3213:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3052:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2908:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2980:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3030:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2768:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2594:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2349:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2970:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3001:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2583:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2516:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2883:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2909:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2849:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2640:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2572:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3416:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2800:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2477:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3066:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3363:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2738:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3197:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2967:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2869:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2457:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.3141:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2829:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2925:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2902:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2349:  17%|█▋        | 70/401 [00:42<01:54,  2.89it/s]training loss: 0.2349:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2543:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2726:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2694:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3173:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2585:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2814:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2565:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3092:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3068:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2748:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2501:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2724:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2982:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2930:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3004:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2473:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2766:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2892:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2838:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3098:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2802:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2448:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3090:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2798:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2557:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2657:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2587:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2313:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3450:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3300:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2458:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2515:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3047:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2831:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3164:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2721:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.3093:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2197:  18%|█▊        | 71/401 [00:44<06:07,  1.11s/it]training loss: 0.2912:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3618:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3270:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3148:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2776:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2795:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2639:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2421:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2702:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2492:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2852:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2450:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2907:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2711:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2585:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3086:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2697:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3111:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2391:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2834:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2671:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2289:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2194:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2978:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3246:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2336:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3208:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2884:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2617:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2603:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2799:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2556:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3035:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3017:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2572:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2917:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2439:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2332:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2959:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.3222:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2647:  18%|█▊        | 71/401 [00:45<06:07,  1.11s/it]training loss: 0.2647:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2666:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2852:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2798:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2862:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2922:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2298:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3203:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2977:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2724:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2994:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2791:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2683:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2480:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2627:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3356:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2597:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2508:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3002:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2985:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3418:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2587:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2926:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2764:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2829:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3108:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3190:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2897:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2758:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2620:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2648:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2543:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2368:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3018:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3165:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2421:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3230:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2704:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2961:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2481:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3335:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3004:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2879:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2649:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3237:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3420:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2500:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3035:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2879:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2545:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3144:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3263:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3031:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2664:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3031:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2674:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2550:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3092:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2913:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3128:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3177:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2482:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2548:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2750:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2841:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2738:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3335:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2832:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2616:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2724:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2278:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3205:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2707:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2881:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2983:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2830:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3457:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2340:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.3035:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2011:  18%|█▊        | 72/401 [00:45<04:47,  1.14it/s]training loss: 0.2011:  18%|█▊        | 73/401 [00:45<04:42,  1.16it/s]training loss: 0.2914:  18%|█▊        | 73/401 [00:45<04:42,  1.16it/s]training loss: 0.2858:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3304:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3122:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3032:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2975:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2193:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2731:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3268:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2730:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3260:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2955:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3317:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2994:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2635:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2692:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2621:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3514:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2766:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2214:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3179:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2988:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2912:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2329:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3057:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2566:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2150:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2984:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3636:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3020:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2920:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2466:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2488:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3051:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2773:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2556:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2718:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2971:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2314:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2475:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2981:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2811:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2471:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2686:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2102:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3052:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3651:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2820:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3103:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2622:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2407:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2985:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3256:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.1992:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2772:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3297:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3014:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2559:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2779:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2894:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2785:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2580:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2694:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3100:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2822:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2598:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2606:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2750:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2689:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3244:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2512:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3159:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2834:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2648:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2757:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.3069:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2535:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2350:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2109:  18%|█▊        | 73/401 [00:46<04:42,  1.16it/s]training loss: 0.2109:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2759:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3121:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2512:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2751:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2635:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3038:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2270:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2662:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2286:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3001:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3209:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2868:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3141:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2460:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2854:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2348:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2722:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2990:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2916:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2692:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2570:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2606:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2170:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3761:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2560:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2437:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2757:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2761:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2818:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2382:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2395:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2885:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2618:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2815:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3388:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2794:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2348:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2938:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3131:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3226:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2660:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2701:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2905:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2911:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2980:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2196:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2921:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2917:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2532:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2718:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2841:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2700:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2698:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2254:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2242:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2954:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3057:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3188:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3041:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3265:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2375:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2424:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2881:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2655:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2185:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2093:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2697:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2214:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2651:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2141:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3106:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2699:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2450:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2656:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2907:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2465:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.3359:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2987:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2709:  18%|█▊        | 74/401 [00:46<03:48,  1.43it/s]training loss: 0.2709:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2727:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2440:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2904:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3058:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2945:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3010:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2793:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2854:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2968:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3114:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3177:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2811:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3061:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2304:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2555:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2855:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2597:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2720:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2855:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3044:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2871:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3130:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3076:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2881:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3259:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3258:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2493:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2327:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2945:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2542:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3045:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3237:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3011:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2548:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2714:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2968:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3002:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2784:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2720:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2748:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2473:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3065:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2872:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3012:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2841:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2128:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2529:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3413:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2802:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2942:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2929:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2821:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2981:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2555:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3017:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2581:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2605:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2537:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3478:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3078:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3265:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3358:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2798:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2877:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3168:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3269:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3097:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2782:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2923:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2774:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2440:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.3079:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2569:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2677:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2650:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2681:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2529:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2641:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2349:  19%|█▊        | 75/401 [00:46<03:10,  1.71it/s]training loss: 0.2349:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2615:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2588:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.3151:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.3130:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2856:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2696:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2662:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.3133:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2036:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2271:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2709:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2944:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2677:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.3129:  19%|█▉        | 76/401 [00:46<02:43,  1.99it/s]training loss: 0.2852:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2469:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2960:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3255:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2632:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2515:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3166:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2977:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3327:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3139:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2950:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2780:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3267:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2971:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2653:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2316:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2649:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2790:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3193:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3094:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2726:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3100:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2930:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3169:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2636:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2657:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2606:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2830:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2674:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2793:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3277:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2257:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2397:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3153:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2383:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2835:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3395:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3419:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2952:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2849:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2781:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2699:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2453:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2821:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3283:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2196:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2888:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2734:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2233:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2257:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2597:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2687:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2680:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2276:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3274:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2865:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2900:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2822:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3113:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3029:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2561:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2357:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2865:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.2929:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3737:  19%|█▉        | 76/401 [00:47<02:43,  1.99it/s]training loss: 0.3737:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3211:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2649:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2920:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3657:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2195:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.4000:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2988:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3015:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2882:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2897:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2913:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2773:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2951:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2862:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2556:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2679:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2963:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2237:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2720:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2483:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2620:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3187:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2618:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2654:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2775:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2466:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2659:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2418:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2804:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2960:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2511:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2825:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2830:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3057:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3659:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3031:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2498:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2845:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2990:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2495:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3136:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2710:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2898:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2454:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2526:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3198:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2470:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3258:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2884:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3251:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3461:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2355:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2719:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2796:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2392:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2882:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2432:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2539:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3035:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3461:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3363:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2307:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3079:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2848:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2809:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3059:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2401:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2976:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2547:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3255:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2817:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3089:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2578:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2943:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2700:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2446:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.2768:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3384:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3603:  19%|█▉        | 77/401 [00:47<02:24,  2.24it/s]training loss: 0.3603:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3660:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2358:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2766:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2086:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2577:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2936:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2521:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2171:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3099:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2744:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2769:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2402:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3025:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3030:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2993:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3071:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3158:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3480:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3077:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2453:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2768:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2526:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2896:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2986:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2931:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2993:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2966:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2854:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2929:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2611:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2410:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2799:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3615:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2556:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3014:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2830:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3036:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2494:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2718:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3248:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3304:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3040:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2325:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2620:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2744:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3402:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2926:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3095:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2441:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3065:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3068:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2832:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2713:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2949:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2493:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3179:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2993:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2362:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3361:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2723:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3227:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2935:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3110:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3767:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2644:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2666:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2460:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2503:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3134:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2884:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.3291:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2627:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2763:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2326:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2592:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2315:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2487:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2575:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2944:  19%|█▉        | 78/401 [00:47<02:11,  2.45it/s]training loss: 0.2944:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.1965:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2871:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.3534:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2965:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2356:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2584:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2172:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2288:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2727:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.3126:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2517:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2859:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2625:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2660:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2855:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2547:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.3038:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2836:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2628:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2602:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.3074:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.3052:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2638:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2532:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.3206:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.3293:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2802:  20%|█▉        | 79/401 [00:47<02:02,  2.63it/s]training loss: 0.2321:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2773:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2765:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2121:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2750:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3143:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2349:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2464:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2720:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2634:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2542:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2241:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2366:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2717:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2795:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2813:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2815:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2995:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3181:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2466:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2534:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3149:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2909:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2427:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2336:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3116:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2181:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2330:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3059:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2529:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3360:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2820:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2667:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2973:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2667:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3792:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2851:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2703:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3200:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3415:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3175:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2169:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.3009:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2060:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2457:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2737:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2749:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2724:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2729:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2916:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.2837:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.1830:  20%|█▉        | 79/401 [00:48<02:02,  2.63it/s]training loss: 0.1830:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2773:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2523:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2320:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2891:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2656:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2506:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.1972:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2913:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2798:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2944:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2788:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3275:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3063:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2741:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2555:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2987:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3056:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3443:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3116:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2719:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3155:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2924:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3341:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2870:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3062:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2942:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2689:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2984:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2837:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2652:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2456:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2663:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2889:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2949:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2728:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3347:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2493:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2768:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2889:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3117:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3466:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2438:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3633:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2233:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3149:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2653:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.1970:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2649:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2839:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2498:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2693:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3205:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3130:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2707:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2672:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2397:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3244:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2155:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2877:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3461:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2361:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2744:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2594:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2643:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2649:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2223:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2604:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2617:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2817:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2933:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3136:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2918:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2762:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2662:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2671:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2818:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.2933:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3402:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3251:  20%|█▉        | 80/401 [00:48<01:55,  2.77it/s]training loss: 0.3251:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3126:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2267:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2554:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2866:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3062:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3175:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3063:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2790:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2934:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2880:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2524:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2504:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2322:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2668:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2796:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3234:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.4072:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2799:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2373:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3219:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2964:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2741:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2783:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2626:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2532:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3333:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3410:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2513:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2819:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2976:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2785:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2672:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2763:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3320:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3155:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3480:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2986:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2609:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2715:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3299:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2737:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3182:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2766:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2520:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.3269:  20%|██        | 81/401 [00:50<05:31,  1.04s/it]training loss: 0.2904:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3532:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2144:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2125:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2597:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3457:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3713:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3473:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3094:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3197:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2899:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2937:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3114:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3203:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2645:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2996:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2938:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3046:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2670:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2227:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2865:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2808:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3034:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3170:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2870:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2709:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.1977:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2651:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2911:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2800:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2584:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2974:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.2534:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3185:  20%|██        | 81/401 [00:51<05:31,  1.04s/it]training loss: 0.3185:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2763:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2483:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3016:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2608:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3487:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2815:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3145:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2229:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3010:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2884:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3607:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3161:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2506:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2253:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3443:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3234:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2909:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2647:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2719:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2271:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2715:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3374:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2916:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2731:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2591:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2862:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2645:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2567:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2551:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3261:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3168:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2987:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2715:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2868:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2832:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2947:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3009:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3643:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2970:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2905:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2527:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2504:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2551:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3030:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2872:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2702:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2679:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2385:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3348:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2663:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2448:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2311:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2674:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2559:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2715:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2870:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2038:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2479:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2717:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3012:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2731:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3032:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2577:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2263:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2840:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2964:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2973:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3606:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3234:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2636:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3176:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2602:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2361:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.3034:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2572:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2839:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2598:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2623:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2838:  20%|██        | 82/401 [00:51<04:21,  1.22it/s]training loss: 0.2838:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2207:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2856:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2041:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2869:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3373:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2545:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3471:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2479:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2644:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2568:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3152:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2408:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2494:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2814:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3443:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2596:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2467:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2242:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2478:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3306:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2993:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2730:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3076:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2324:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2918:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2682:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2274:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2674:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2795:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2650:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2644:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3165:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2921:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2802:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2862:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3028:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2564:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2584:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2532:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2312:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2717:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2842:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2810:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2915:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2211:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3039:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2681:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2432:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2529:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3030:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2598:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2556:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2639:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3122:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2715:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3125:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3187:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2569:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2293:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2408:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2779:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3094:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2743:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2460:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2958:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3139:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2591:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2961:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2498:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2905:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2463:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2607:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3298:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2746:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2207:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2476:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2710:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.2553:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3593:  21%|██        | 83/401 [00:51<03:32,  1.49it/s]training loss: 0.3593:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3124:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2826:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3483:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2491:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2895:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2919:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3359:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2790:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2615:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2738:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2984:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2725:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2985:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2784:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3100:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2442:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3222:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2636:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2707:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2692:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2262:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3218:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3347:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2590:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2915:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2733:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2566:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2563:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2994:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3312:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2844:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3119:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2675:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2692:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3134:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2452:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3340:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2538:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2713:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2793:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3081:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3276:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2899:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2816:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2663:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3281:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2465:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2747:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2404:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2848:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2885:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2741:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2148:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2503:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2439:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.3098:  21%|██        | 84/401 [00:51<02:59,  1.77it/s]training loss: 0.2637:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2484:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2567:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2627:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.3197:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2626:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.3226:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2921:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2799:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2860:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2706:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2638:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2859:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2639:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2902:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.3025:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2529:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2517:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2963:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.3227:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2861:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.2752:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.5050:  21%|██        | 84/401 [00:52<02:59,  1.77it/s]training loss: 0.5050:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3154:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3154:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2643:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2675:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2430:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3338:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3221:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2981:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3101:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3048:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2151:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2687:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2528:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2667:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2756:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2756:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2555:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2134:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2738:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2788:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3015:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2271:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2593:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2853:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2178:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2436:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2408:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2877:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2826:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2850:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2510:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2410:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2247:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2863:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3367:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2547:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3295:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2570:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2994:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3081:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2200:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3017:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2094:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2989:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3092:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3072:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3185:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2681:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2669:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2452:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2805:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2795:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3217:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2641:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2608:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2808:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3400:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3387:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2953:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2771:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2648:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2290:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3226:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2425:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2710:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3328:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3173:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2936:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3248:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2971:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2077:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3082:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2714:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2488:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2828:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2689:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.3010:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2416:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2260:  21%|██        | 85/401 [00:52<02:34,  2.04it/s]training loss: 0.2260:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2895:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2667:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2279:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2197:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2830:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2991:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3123:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2737:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2411:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3638:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3274:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2725:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3401:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3031:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2942:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2864:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3043:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2556:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2505:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3573:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2441:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2476:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2928:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3042:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3217:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3040:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2986:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2726:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2727:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3081:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2495:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2768:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2338:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2737:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2539:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2746:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3140:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2640:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2969:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2780:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3162:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2651:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3036:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2748:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2462:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2569:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2295:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3374:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3065:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2969:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2456:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2457:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2362:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2769:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3040:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2756:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3351:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2592:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3171:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2540:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2180:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2346:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3324:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2846:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2543:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3610:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3130:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2513:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2785:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2450:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2723:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2247:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3453:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2282:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2576:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3132:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2788:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.2323:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3554:  21%|██▏       | 86/401 [00:52<02:18,  2.28it/s]training loss: 0.3554:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.3522:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2393:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2956:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.3479:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2583:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.3080:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2588:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2617:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2556:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2935:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2687:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.3250:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2940:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2924:  22%|██▏       | 87/401 [00:52<02:11,  2.38it/s]training loss: 0.2554:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2604:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3162:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2541:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2609:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3148:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2244:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3059:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2951:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2322:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2873:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2884:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3106:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2733:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2674:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2226:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2608:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3241:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2645:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2467:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3168:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2535:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2874:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2756:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2910:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3297:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2975:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2787:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2676:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2714:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2646:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2693:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2884:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2799:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2464:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2585:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3240:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2642:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2642:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2437:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2553:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3280:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2616:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2353:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2818:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2807:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2130:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2903:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2767:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3094:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.3019:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2979:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2490:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2905:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2178:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2740:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2794:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2728:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2984:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2465:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2609:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2811:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2533:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2767:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2335:  22%|██▏       | 87/401 [00:53<02:11,  2.38it/s]training loss: 0.2335:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2970:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3523:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3047:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3197:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2763:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2774:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2899:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2531:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3111:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2616:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3112:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2737:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2716:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2940:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2878:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3429:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2825:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2308:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2260:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3006:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2872:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2858:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2472:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2866:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2367:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2545:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2632:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3252:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2827:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2718:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2569:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3139:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2105:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2279:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2556:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2758:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3224:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2443:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3174:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2732:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2688:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3094:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3059:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2526:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2493:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2423:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2780:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2858:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2640:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2525:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2467:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2887:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2458:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2205:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2516:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2556:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3066:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2926:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2777:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3431:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3177:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2588:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2360:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2461:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2981:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2389:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3437:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3679:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2661:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2705:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2853:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3578:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2471:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2629:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2557:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.3751:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2607:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.2582:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.6333:  22%|██▏       | 88/401 [00:53<02:23,  2.18it/s]training loss: 0.6333:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2597:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3335:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2591:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2600:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2779:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2568:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2279:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2855:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2431:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2540:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2478:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3345:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2690:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2955:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2600:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3106:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2963:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2858:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2695:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3318:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2821:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2628:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2676:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2199:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.1775:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3007:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2861:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2630:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2798:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2355:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2532:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.1840:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2545:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2040:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3369:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2706:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2622:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2600:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3047:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2587:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3480:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3114:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2842:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2388:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2335:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3520:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2700:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3108:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2547:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2427:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2980:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2825:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2498:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2566:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2893:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2615:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2791:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2800:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2481:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3109:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2494:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2348:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3661:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2603:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2921:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2889:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2874:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2881:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2376:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2757:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3378:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2602:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2693:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2959:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.3521:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2830:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2903:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.2501:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.4741:  22%|██▏       | 89/401 [00:53<02:09,  2.41it/s]training loss: 0.4741:  22%|██▏       | 90/401 [00:53<02:01,  2.56it/s]training loss: 0.2801:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3454:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3193:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2915:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2552:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3120:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3102:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3045:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2759:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2323:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2714:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2765:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2142:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2428:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2233:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2738:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3162:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2321:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2992:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3037:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2801:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2768:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2893:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2805:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2345:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2503:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3354:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2728:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2341:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2719:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2929:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2903:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3006:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2787:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2346:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2474:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3311:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2850:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.1965:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3029:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2426:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3104:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2506:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3115:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2082:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3740:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2673:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2561:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3142:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2756:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2424:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2555:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3387:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2487:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2689:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3052:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2794:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3248:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3312:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2705:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3349:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2253:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2760:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3453:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2801:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2943:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2595:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2504:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2727:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2806:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.3614:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2624:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2851:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2387:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2609:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2668:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2281:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.2792:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.4729:  22%|██▏       | 90/401 [00:54<02:01,  2.56it/s]training loss: 0.4729:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2687:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2942:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2548:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2200:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2679:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3150:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3125:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2307:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2493:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2742:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3000:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2864:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2117:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3279:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2946:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2709:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3052:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2589:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3072:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2958:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2239:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2352:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3124:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2778:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2677:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2759:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2467:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2776:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2202:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2771:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2342:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2981:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2924:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2525:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2251:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2294:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2752:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2959:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2469:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2534:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2451:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2809:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2548:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2455:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2835:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2938:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2523:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2748:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3001:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2675:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2170:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3033:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3003:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3046:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3260:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2608:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3000:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3016:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2519:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3334:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2856:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2471:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2656:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2629:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2341:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2903:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2571:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2928:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2919:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2531:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2150:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2839:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2676:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2915:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2652:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2673:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.3246:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2832:  23%|██▎       | 91/401 [00:56<05:32,  1.07s/it]training loss: 0.2314:  23%|██▎       | 91/401 [00:57<05:32,  1.07s/it]training loss: 0.2314:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3005:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2225:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2916:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2701:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2375:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2584:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2762:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2587:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3129:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3139:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2463:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3143:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2406:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2468:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2621:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2382:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3140:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3050:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2887:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2540:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2589:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2263:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2451:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2891:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2881:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3097:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2961:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3007:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2467:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2880:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3019:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3351:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2614:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2753:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3606:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2791:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2444:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2671:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3613:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3005:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2695:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2830:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2806:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3071:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2727:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2815:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2223:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3053:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3024:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2984:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2698:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2343:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2621:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2437:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2635:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2918:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2162:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2700:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2740:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2232:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2530:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2027:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2632:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2905:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2884:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2306:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3144:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2990:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2864:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3123:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2142:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2925:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2793:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2649:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2878:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2804:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2695:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.3404:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2182:  23%|██▎       | 92/401 [00:57<04:25,  1.17it/s]training loss: 0.2182:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2576:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2273:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2961:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2347:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2694:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2333:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2901:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2907:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2742:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3458:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2914:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2670:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2335:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2511:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2814:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3495:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2969:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3054:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3123:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2756:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2541:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3132:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2966:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2931:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2802:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2670:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2446:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2438:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2849:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2428:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3265:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2715:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3137:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2769:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2211:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2731:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2446:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2721:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2317:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2801:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3186:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2584:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2604:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2667:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2930:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2726:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2727:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2504:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2708:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2890:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3184:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2696:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2807:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2504:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3619:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2390:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2671:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2915:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3232:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2832:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3011:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2858:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3218:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2513:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2752:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2625:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3244:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2745:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2809:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3654:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2771:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2681:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2369:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2539:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2504:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.1906:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.2935:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.3109:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.4083:  23%|██▎       | 93/401 [00:57<03:34,  1.44it/s]training loss: 0.4083:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3414:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2883:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3043:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2924:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2943:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2983:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2645:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2590:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2660:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2363:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2419:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3004:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2695:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2914:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2751:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3177:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2803:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3300:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2604:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2417:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2916:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3095:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2976:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3424:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2251:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3128:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2657:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2814:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3477:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2833:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2891:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2946:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3369:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3629:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2652:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2847:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2656:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3258:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2988:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2645:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2291:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2215:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3051:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2532:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2845:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2769:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2864:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2933:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2270:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3266:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3469:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2868:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3006:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2961:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2815:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2456:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3056:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2943:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2450:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2485:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2946:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2334:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2299:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2540:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3160:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2784:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2269:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2583:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3021:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2969:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2406:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3127:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.3066:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2602:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2297:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2944:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2966:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2785:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2607:  23%|██▎       | 94/401 [00:57<02:59,  1.71it/s]training loss: 0.2607:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2940:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2753:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2896:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2414:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2982:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2823:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2825:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2986:  24%|██▎       | 95/401 [00:57<02:34,  1.98it/s]training loss: 0.2372:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2718:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2856:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2580:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2901:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2226:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3158:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3152:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3142:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2641:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2260:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2684:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2398:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2571:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3284:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2663:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3059:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2560:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2659:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3099:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2889:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2718:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3004:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2593:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2805:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2619:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2909:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3869:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2841:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2902:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2438:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2575:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2880:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2575:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3091:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2979:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2904:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2435:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3068:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3091:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2382:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2862:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3239:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2811:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2496:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.1972:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2345:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2030:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2948:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2749:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3163:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2984:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3030:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3265:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2240:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2755:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2680:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2832:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3044:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2210:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2810:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2685:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3044:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2348:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2818:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2668:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3134:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3107:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3067:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.2516:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3155:  24%|██▎       | 95/401 [00:58<02:34,  1.98it/s]training loss: 0.3155:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3146:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2731:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3228:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3269:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2324:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2151:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2322:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2432:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2612:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2988:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3125:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3086:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3278:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3196:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2401:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2997:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2773:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2941:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2450:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2694:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2844:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2942:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2196:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2796:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2874:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2991:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2189:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2740:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3134:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3139:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2584:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2395:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2591:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3111:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2718:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2156:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2649:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2830:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2649:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3233:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2784:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2487:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2951:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2673:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2699:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2383:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2620:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2670:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2708:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2672:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3616:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2495:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2851:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2744:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2881:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2728:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2855:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2830:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2191:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2531:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2658:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3197:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2371:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3137:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2116:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2788:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2832:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2887:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2931:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2480:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2684:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3522:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2597:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2958:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.3157:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2779:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2670:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2457:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2738:  24%|██▍       | 96/401 [00:58<02:17,  2.22it/s]training loss: 0.2738:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2716:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3070:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2570:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3123:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2755:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2640:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2370:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2895:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3377:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3026:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2500:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2634:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2285:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2852:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3222:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2706:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2944:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3028:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2754:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2489:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3203:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3135:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2987:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3134:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2862:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2692:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2595:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2693:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2772:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2692:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2628:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2766:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3087:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2681:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2582:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2642:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2872:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2650:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2577:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3032:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3430:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2469:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3055:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3146:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3165:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3377:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3464:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2154:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2749:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2589:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2813:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2024:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2481:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2601:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3063:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3381:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2349:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2476:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2795:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3175:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3144:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2651:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2589:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2649:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3055:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2362:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3094:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2990:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2415:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2457:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2946:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3185:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2435:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2753:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3124:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3172:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2688:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.3354:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2957:  24%|██▍       | 97/401 [00:58<02:07,  2.39it/s]training loss: 0.2957:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2393:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2896:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3069:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3002:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2823:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2456:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.3145:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2198:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2975:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2784:  24%|██▍       | 98/401 [00:58<01:57,  2.57it/s]training loss: 0.2423:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3000:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2483:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2885:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2395:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2808:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2455:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2543:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2793:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3198:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2481:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2081:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2758:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3139:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2838:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3406:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3040:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2583:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3442:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2729:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2820:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2577:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2907:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3281:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3025:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2716:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2496:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2442:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2319:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2520:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2379:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3477:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2659:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3033:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2777:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3526:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2745:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2702:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2762:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3105:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2489:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3341:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2660:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2833:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3476:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3412:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3680:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2547:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2220:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2831:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3249:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2562:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3295:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2788:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2866:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2345:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2932:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2698:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2293:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2902:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2704:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3248:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2651:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2039:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2402:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2695:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2921:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.2854:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3033:  24%|██▍       | 98/401 [00:59<01:57,  2.57it/s]training loss: 0.3033:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2606:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2283:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2465:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2842:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2183:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3457:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2678:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2887:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2492:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2487:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3966:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2562:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2871:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2929:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2321:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2582:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2475:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2634:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2559:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3398:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2795:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2514:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2736:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2998:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2635:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2511:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2706:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2728:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2556:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2726:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2210:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2589:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3290:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2960:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3224:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3379:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2816:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2850:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2648:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2313:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2923:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3101:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2665:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2851:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2775:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2530:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3109:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2891:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2706:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2423:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2516:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3397:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2555:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2761:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3057:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2230:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2926:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2816:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3345:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2846:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2586:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3017:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3350:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2901:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3157:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2615:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3038:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2662:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3009:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2276:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3356:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2480:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3045:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2890:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2559:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.3437:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2803:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.2466:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.1534:  25%|██▍       | 99/401 [00:59<01:53,  2.66it/s]training loss: 0.1534:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2946:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2300:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2788:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2844:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3174:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2552:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3118:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2895:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2887:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2971:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2425:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2541:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2793:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3200:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2701:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2558:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2335:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2760:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3229:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2746:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3181:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.1974:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2476:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2558:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2828:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2578:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3075:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3240:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2618:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2934:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2588:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3112:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2728:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2985:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2847:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2602:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3002:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2376:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2366:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2450:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2455:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2485:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2988:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2563:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3087:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.3347:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2522:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2406:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2199:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2931:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2749:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2753:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2773:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2135:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2807:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2851:  25%|██▍       | 100/401 [00:59<01:58,  2.54it/s]training loss: 0.2811:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2789:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2722:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2718:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2847:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2999:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2441:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2409:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2998:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2596:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.3181:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2605:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2791:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2917:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2585:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2907:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2595:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.3204:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2885:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2655:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2898:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2158:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2384:  25%|██▍       | 100/401 [01:00<01:58,  2.54it/s]training loss: 0.2384:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2932:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2855:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3188:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2947:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2533:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2715:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3341:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2770:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3154:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2837:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2625:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2620:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3205:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2547:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3042:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3057:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3565:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.1950:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2248:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2386:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3090:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3533:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2654:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2307:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2817:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3123:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2510:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2654:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2359:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3148:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2854:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2956:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3254:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2371:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2845:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3202:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2914:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2313:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2721:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3518:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2819:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2593:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2466:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3008:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2512:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2468:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2868:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2647:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3005:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2585:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3079:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2836:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2642:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2268:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2973:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2489:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2730:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2826:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3297:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2675:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2972:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3132:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2651:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3594:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3607:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2886:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2215:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2848:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2894:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2588:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2774:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3097:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2719:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.3263:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2493:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2810:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2419:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.2968:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.4606:  25%|██▌       | 101/401 [01:02<05:23,  1.08s/it]training loss: 0.4606:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2273:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2667:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2474:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2466:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3314:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3163:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2097:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2948:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2706:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3399:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2899:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3222:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2517:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2650:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2584:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2294:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3003:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2467:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3001:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2373:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2852:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2775:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2386:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2864:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2357:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2181:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2728:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3334:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3080:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2458:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2507:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2079:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2552:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2917:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2611:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2356:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2733:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2667:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3140:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2604:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2699:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2571:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2839:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2746:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2976:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2969:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2726:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2609:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2775:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3250:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3705:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2632:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2452:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2758:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2897:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2350:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3178:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2422:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2811:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2803:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2529:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2152:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.3442:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2478:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.1746:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2322:  25%|██▌       | 102/401 [01:02<04:14,  1.17it/s]training loss: 0.2447:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.2538:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.3052:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.2954:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.2390:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.2729:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.2620:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.2662:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.3161:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.2612:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.3024:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.2536:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.3321:  25%|██▌       | 102/401 [01:03<04:14,  1.17it/s]training loss: 0.3321:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2825:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2562:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3326:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2954:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2741:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2558:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2664:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2427:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2466:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2675:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3187:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2910:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2405:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2360:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2038:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2526:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2497:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3051:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2515:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2677:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2438:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3134:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2955:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2464:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2626:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2457:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2493:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2442:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2898:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3069:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2868:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3171:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2495:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3043:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3483:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3264:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2861:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2661:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3039:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2641:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2440:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3330:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2551:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2926:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2601:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2304:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2944:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2743:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2543:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2637:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3270:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2288:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3025:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2467:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2403:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2602:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3214:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2839:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2542:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2606:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2420:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2286:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2792:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3149:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2523:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2489:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3233:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2687:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3242:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3077:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2571:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2714:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2862:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2679:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2777:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2577:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2418:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.3189:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2902:  26%|██▌       | 103/401 [01:03<03:26,  1.44it/s]training loss: 0.2902:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2917:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2706:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2164:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2766:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2611:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2924:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2990:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2696:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2783:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2747:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2393:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2557:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2976:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3323:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2726:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3109:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3266:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3257:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2744:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2458:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2461:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3272:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2114:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3164:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3111:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2866:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2788:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2897:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3022:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2844:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2652:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2200:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2312:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2760:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2355:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2908:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2647:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2988:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3248:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2651:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2724:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3049:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2612:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2489:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3050:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2710:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2571:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3156:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2533:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2390:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2745:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2174:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2608:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2843:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2991:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2644:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2928:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2915:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2840:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2999:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2507:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3350:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2963:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2664:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2925:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2619:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2983:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2822:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2750:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3159:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2790:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3192:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2690:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2242:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2666:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2897:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2830:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.2783:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3946:  26%|██▌       | 104/401 [01:03<02:56,  1.69it/s]training loss: 0.3946:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3324:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2520:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2948:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2118:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2552:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2817:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2928:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2787:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3070:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2135:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2474:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2333:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2613:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2379:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2667:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2275:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2841:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3042:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3166:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2296:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2366:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3625:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2353:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2468:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2644:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2667:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2882:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2857:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2428:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2676:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2470:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2797:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2334:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3293:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3069:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3143:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2447:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2826:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2773:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2961:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3503:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2436:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2468:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2045:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3111:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3042:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2095:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2461:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3350:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.3161:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2777:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2991:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2281:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2541:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2690:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2487:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2701:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2974:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2626:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2210:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2317:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2763:  26%|██▌       | 105/401 [01:03<02:30,  1.96it/s]training loss: 0.2794:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2153:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2890:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.3375:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2805:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2016:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2489:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.3211:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.3016:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.3270:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2784:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2669:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2507:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2601:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2590:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2512:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2380:  26%|██▌       | 105/401 [01:04<02:30,  1.96it/s]training loss: 0.2380:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2905:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2563:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2456:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2831:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2687:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2675:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2430:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2541:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2457:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2641:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2461:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2376:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2427:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2454:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2535:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2631:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2691:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2590:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2890:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2836:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2624:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.3043:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2279:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2814:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.3101:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2537:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2872:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.3463:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2146:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2784:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2980:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2819:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2886:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2635:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2599:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2227:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2755:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2580:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2961:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2533:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2439:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2709:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2536:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.3426:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2959:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2956:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2233:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2542:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2832:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2686:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2503:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2540:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2359:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2171:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2144:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2832:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2846:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2702:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.3597:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2555:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2533:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2691:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2601:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.3177:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2842:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2947:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2737:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2525:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2713:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2482:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2803:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2353:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2623:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2824:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.3250:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2796:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2299:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2874:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2123:  26%|██▋       | 106/401 [01:04<02:57,  1.66it/s]training loss: 0.2123:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2602:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2324:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2843:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2969:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.1689:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2675:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.3257:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2699:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2396:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2848:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2957:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2725:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.3040:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.3205:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2721:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2814:  27%|██▋       | 107/401 [01:04<02:38,  1.86it/s]training loss: 0.2781:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2654:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2501:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2593:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2961:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3102:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2884:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3168:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3201:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2772:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2489:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2481:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2252:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3208:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3022:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3211:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2760:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3096:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2476:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2978:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3071:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2681:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2694:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2274:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2595:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2946:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2559:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2886:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2403:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2833:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3058:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3245:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2920:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.1774:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2426:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2280:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2429:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2814:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2761:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2733:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2841:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2756:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2826:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2621:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2719:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2693:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2470:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2917:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2779:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2996:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2409:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3351:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2881:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2596:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3143:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.3137:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2959:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2784:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2190:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2785:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2351:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2832:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2851:  27%|██▋       | 107/401 [01:05<02:38,  1.86it/s]training loss: 0.2851:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2958:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2369:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2766:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2282:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2397:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3117:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2405:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2294:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2683:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2705:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2835:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2445:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2789:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2857:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3168:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2475:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2920:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2637:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2528:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3232:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2946:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2907:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2488:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3004:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3289:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2207:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2223:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2943:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2673:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2354:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2519:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2538:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3043:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2935:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2388:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2640:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2812:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3166:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2407:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2251:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2905:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3174:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2560:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2788:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2346:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2892:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3387:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.1937:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2961:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2610:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2944:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2275:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2469:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2889:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3262:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2137:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2323:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2056:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2592:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2923:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2324:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2553:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2415:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3619:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3313:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2984:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2210:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2589:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2564:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2259:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2515:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2386:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2390:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2642:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2553:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2773:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3228:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.2997:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3842:  27%|██▋       | 108/401 [01:05<02:17,  2.12it/s]training loss: 0.3842:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.3249:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2914:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2619:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2851:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2310:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2728:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.3147:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2613:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2754:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2518:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2875:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2502:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2104:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2962:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2487:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2685:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2418:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2559:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2648:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2411:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2180:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2842:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2376:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2294:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2689:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2282:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2826:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2372:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2521:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2428:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2986:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2596:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2777:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2231:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2678:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2323:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.3647:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2583:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.3286:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2661:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2365:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2802:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2935:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2231:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.3011:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2205:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2522:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.3197:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2376:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.3056:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2440:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2090:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2381:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2799:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2762:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2317:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.3002:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2252:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2522:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2537:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2561:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2847:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2350:  27%|██▋       | 109/401 [01:05<02:03,  2.37it/s]training loss: 0.2367:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2786:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2506:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.3107:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2779:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2623:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2826:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2635:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2646:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.3534:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2930:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2625:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2427:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2445:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2924:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2032:  27%|██▋       | 109/401 [01:06<02:03,  2.37it/s]training loss: 0.2032:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3108:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2831:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2488:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2615:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2616:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2684:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2280:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2358:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2747:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2802:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2469:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2170:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2682:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3094:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2690:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2769:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3217:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2376:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2668:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3407:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2587:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2346:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3135:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2778:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2514:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2772:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2931:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2959:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2253:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2994:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2437:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2442:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2674:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2897:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3007:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2634:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2774:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3296:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2507:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2976:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.1958:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2643:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2487:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2611:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3206:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3106:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2556:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3232:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2519:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2331:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2353:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2638:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2788:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2143:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2648:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2648:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2455:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2941:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2175:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2144:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2999:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2901:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2972:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2741:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2313:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2390:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2713:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2847:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3049:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2632:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2814:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2812:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2524:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2433:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3045:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2877:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2794:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.2143:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3180:  27%|██▋       | 110/401 [01:06<02:28,  1.96it/s]training loss: 0.3180:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2328:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3121:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2470:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2594:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2640:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2460:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3432:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2462:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2426:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2504:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3370:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2725:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3285:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2255:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2784:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2933:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2481:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2362:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3022:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2234:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2741:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3074:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2769:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2850:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2626:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2056:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3606:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3221:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3188:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3070:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2950:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3082:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3364:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2266:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2973:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3243:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2843:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2623:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2956:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2601:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3033:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3163:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3708:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2210:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2835:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3146:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2791:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2905:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2329:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2499:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2229:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2792:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3246:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2868:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2674:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2442:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2165:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2578:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2548:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2724:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2242:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2918:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2577:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.3041:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2852:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2683:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2686:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2563:  28%|██▊       | 111/401 [01:08<05:17,  1.09s/it]training loss: 0.2656:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2613:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.3323:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2124:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2864:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2724:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2813:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.3014:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2744:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2983:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2107:  28%|██▊       | 111/401 [01:09<05:17,  1.09s/it]training loss: 0.2107:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2731:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2573:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2410:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2496:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2950:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2834:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2946:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3317:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2392:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3373:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2365:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2598:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2632:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3040:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2840:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2767:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2550:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2786:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2428:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2339:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2727:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2503:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2349:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3111:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2674:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2954:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2539:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2780:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2166:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2404:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2550:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2774:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3327:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2977:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2675:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2530:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2694:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2864:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3028:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2695:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2995:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2578:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2793:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2936:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2935:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3081:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2276:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2425:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2083:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2267:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.1823:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2765:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2839:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2522:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3351:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2737:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2917:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2700:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2567:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2803:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2279:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2992:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2539:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2506:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2497:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2370:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2655:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2640:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2531:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2864:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2945:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2431:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2771:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2352:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2394:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.3035:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2903:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2705:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2995:  28%|██▊       | 112/401 [01:09<04:08,  1.16it/s]training loss: 0.2995:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2739:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2396:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2707:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3171:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2100:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2790:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2875:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2826:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2837:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2368:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2724:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2718:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2649:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2657:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2577:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2332:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2905:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2474:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2692:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3289:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2370:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3131:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2786:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2385:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2935:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2969:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2358:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2081:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2648:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2519:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2370:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2381:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2792:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2331:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2470:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2376:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2590:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3040:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2488:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2345:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2814:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2758:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2975:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2423:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2808:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2889:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3249:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2363:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3131:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2652:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2569:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2949:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2591:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2638:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2607:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2863:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2433:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3206:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3169:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2980:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2785:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3123:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3049:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3073:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2494:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2427:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.1880:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2190:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2599:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2797:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2338:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2441:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2538:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2816:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2984:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2708:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.3291:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.2803:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.1807:  28%|██▊       | 113/401 [01:09<03:20,  1.43it/s]training loss: 0.1807:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2259:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3247:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2610:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2214:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2351:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2387:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2782:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2958:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2493:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2279:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2456:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3004:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2665:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2783:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2456:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2753:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2667:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2775:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2816:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3528:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2878:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3586:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2879:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2252:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2361:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2762:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2449:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2595:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2875:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3027:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2952:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2243:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3431:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2623:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2912:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3445:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2190:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2512:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2239:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2551:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2686:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2771:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2761:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2958:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2463:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3148:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2718:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2769:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2694:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2771:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2461:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.1942:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2353:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2471:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2744:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2590:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2049:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3065:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2242:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2389:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2833:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3078:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3020:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2254:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2565:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2117:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2929:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.3785:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2371:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2804:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2577:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2795:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2119:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2465:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2255:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2452:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2260:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.2807:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.1640:  28%|██▊       | 114/401 [01:09<02:48,  1.71it/s]training loss: 0.1640:  29%|██▊       | 115/401 [01:09<02:24,  1.98it/s]training loss: 0.3354:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2994:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3238:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2842:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2671:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2921:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3162:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2336:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2410:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2914:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2804:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2692:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2694:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2827:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2695:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2228:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2451:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2422:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2517:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2912:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2104:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3260:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3145:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2265:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2562:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2405:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2544:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2339:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2597:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2531:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2710:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2089:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2325:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2733:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2904:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2140:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2581:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2996:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3097:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2620:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.1730:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2614:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2457:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2878:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2572:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2732:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2151:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2730:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2333:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2240:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2568:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2577:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2849:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2685:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2336:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2614:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3117:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2305:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2937:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2413:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2601:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2573:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3126:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2711:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3118:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2391:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2484:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2399:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.3055:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2844:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2261:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2557:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2962:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2773:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2642:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2118:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2752:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2851:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2345:  29%|██▊       | 115/401 [01:10<02:24,  1.98it/s]training loss: 0.2345:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2905:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3013:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3050:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2786:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3148:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2306:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3182:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2425:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3295:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2293:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2160:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2680:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2386:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2107:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2156:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2706:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2984:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2581:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2888:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2590:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2790:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2435:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2817:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2553:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2601:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3393:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2175:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2388:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2800:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2360:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2436:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2167:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2743:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2943:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2026:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2843:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.1946:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2077:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3118:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2825:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3154:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2169:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2614:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2374:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2943:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2690:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3053:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2575:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2480:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2851:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2550:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2897:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3513:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2603:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3008:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2420:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3495:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2667:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2703:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3241:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2653:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2664:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2502:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3361:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2875:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2943:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2642:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2288:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3023:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2509:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2442:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.3026:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2124:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2860:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2551:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2231:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2700:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.2363:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.1558:  29%|██▉       | 116/401 [01:10<02:08,  2.23it/s]training loss: 0.1558:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2274:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2276:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2947:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2397:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2643:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2816:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2540:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2470:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2657:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3403:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2944:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2432:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2696:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3373:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2176:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2323:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2592:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2845:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2558:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3060:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2291:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2506:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2690:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2877:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2869:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3189:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2421:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2412:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2675:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2494:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2765:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2575:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2646:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2042:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2764:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2842:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2817:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2619:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2271:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2745:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2907:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2957:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2999:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2477:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2106:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3353:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3094:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3163:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.1978:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3074:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2759:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2527:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2996:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2970:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2619:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2661:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2946:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2327:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3316:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2872:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2311:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2996:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2550:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2300:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2959:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2667:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2487:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3082:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3083:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2238:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2585:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2581:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2863:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2581:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2405:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.3290:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2612:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.2721:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.4335:  29%|██▉       | 117/401 [01:10<01:57,  2.42it/s]training loss: 0.4335:  29%|██▉       | 118/401 [01:10<01:49,  2.60it/s]training loss: 0.2795:  29%|██▉       | 118/401 [01:10<01:49,  2.60it/s]training loss: 0.2604:  29%|██▉       | 118/401 [01:10<01:49,  2.60it/s]training loss: 0.2120:  29%|██▉       | 118/401 [01:10<01:49,  2.60it/s]training loss: 0.2566:  29%|██▉       | 118/401 [01:10<01:49,  2.60it/s]training loss: 0.3017:  29%|██▉       | 118/401 [01:10<01:49,  2.60it/s]training loss: 0.2661:  29%|██▉       | 118/401 [01:10<01:49,  2.60it/s]training loss: 0.2315:  29%|██▉       | 118/401 [01:10<01:49,  2.60it/s]training loss: 0.2734:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2856:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2349:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2647:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2470:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2987:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2192:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2821:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2607:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2304:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2550:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3033:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2593:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2528:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3348:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2590:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2632:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2494:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2112:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2628:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2724:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2599:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2722:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3316:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3131:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3033:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2575:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.1948:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2544:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2102:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2512:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2362:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2317:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2416:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2732:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3042:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3080:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2481:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2458:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2376:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2559:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2782:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2359:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2872:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2633:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2509:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2834:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3006:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3049:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2067:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2448:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2324:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2602:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2491:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2514:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3193:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2238:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2691:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2150:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2502:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2727:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2750:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2276:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3103:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2600:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2684:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2742:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2545:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2429:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.2914:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.3077:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.1388:  29%|██▉       | 118/401 [01:11<01:49,  2.60it/s]training loss: 0.1388:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2763:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2741:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2210:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2531:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2682:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2451:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2311:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2527:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.1839:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2828:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2974:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2604:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2604:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2523:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2508:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2086:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2725:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2893:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2944:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3235:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3121:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2816:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2688:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2674:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2685:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2221:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2492:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2691:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2276:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2655:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2394:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2679:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3011:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2918:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2422:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.1819:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2634:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2664:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2745:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2445:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3420:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3263:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2748:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3137:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2468:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2940:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2549:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2461:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2232:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3035:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2048:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2871:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2353:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3172:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2687:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2813:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3421:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2274:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2602:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2721:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3073:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2048:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2362:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2469:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2541:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2787:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2101:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2483:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2829:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2243:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2379:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2598:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2598:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2692:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2462:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2154:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2106:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.2173:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3171:  30%|██▉       | 119/401 [01:11<01:43,  2.73it/s]training loss: 0.3171:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2612:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2887:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2454:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2394:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2464:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2705:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2137:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2664:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2335:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2651:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2583:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2291:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2789:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.3339:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2704:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2493:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2393:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2685:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2274:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2746:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2875:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.3347:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2596:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2462:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2272:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2944:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2826:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.3053:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2513:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2472:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2161:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2232:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.1953:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2189:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2261:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2800:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2723:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2700:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2237:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2786:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2452:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2652:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2522:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2304:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2182:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2652:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2750:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2577:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2626:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2238:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2547:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2895:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2098:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2166:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.3027:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.3034:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2632:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2886:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2406:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2619:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2732:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2823:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.3358:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2364:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2508:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2641:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.1784:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2914:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2824:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2451:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2591:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.3148:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2898:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2684:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.1961:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2309:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2824:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2304:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2880:  30%|██▉       | 120/401 [01:11<01:38,  2.85it/s]training loss: 0.2880:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3396:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2357:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2912:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2549:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2422:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3043:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2853:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2219:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2870:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2697:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2764:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2842:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2361:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3134:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3028:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2414:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3103:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3121:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2424:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2798:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2527:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2201:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.1983:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2264:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2646:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2207:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2880:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3812:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2654:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2518:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2847:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2282:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2733:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2423:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2750:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3190:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2952:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2849:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3030:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2714:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2761:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2484:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2898:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2684:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2501:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3244:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2581:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2089:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2099:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2441:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2615:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2288:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3069:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2478:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2655:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2575:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2331:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2725:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2172:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2525:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2934:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2916:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2761:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2739:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2842:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3252:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2680:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2513:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2790:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2160:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2765:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2366:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3078:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2327:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2482:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.3039:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2829:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2465:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2754:  30%|███       | 121/401 [01:14<04:42,  1.01s/it]training loss: 0.2754:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2282:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2362:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2873:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2283:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2889:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2170:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2250:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.3578:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2635:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2662:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2448:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2463:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2668:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2628:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2719:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2650:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2080:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2993:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2316:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2453:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.3292:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2727:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2873:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2517:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2157:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2472:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2541:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2362:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2487:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2549:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2239:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2425:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2298:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2572:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2066:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2713:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2714:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.3135:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2175:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2428:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2058:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2682:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2845:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2378:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2632:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2426:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2607:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2867:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.3382:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2733:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2302:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2468:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2701:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2393:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2513:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2399:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2578:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2290:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2772:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2306:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2269:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2305:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2428:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2396:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2528:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2736:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2866:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2365:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2256:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2441:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2247:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2439:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2768:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2534:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2362:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2757:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2478:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.2229:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.3055:  30%|███       | 122/401 [01:14<03:44,  1.24it/s]training loss: 0.3055:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2304:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2850:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2402:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2360:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2874:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2108:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2114:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2495:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2653:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2739:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2546:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2709:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2814:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2395:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2402:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2231:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2526:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2762:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2969:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2532:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2781:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2279:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2450:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2795:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2394:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2578:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2379:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2456:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2918:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2767:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.3157:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2341:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2577:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2232:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2566:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2753:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2807:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2514:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.3045:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2606:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2537:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2943:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.3028:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2496:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2494:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2483:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2780:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2810:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.3213:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2177:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2557:  31%|███       | 123/401 [01:14<03:02,  1.52it/s]training loss: 0.2013:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.3009:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2600:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2315:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2764:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2386:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2577:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2125:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2579:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2564:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2589:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2642:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2925:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2403:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2327:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2093:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2281:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2480:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.3149:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.3256:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2364:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2919:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2443:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2807:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2379:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2038:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2418:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2362:  31%|███       | 123/401 [01:15<03:02,  1.52it/s]training loss: 0.2362:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2345:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2629:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2772:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2313:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2845:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2429:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2138:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2940:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.3058:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2871:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2385:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2842:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2606:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2465:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2918:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.1990:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2600:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2684:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2604:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2331:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2435:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2650:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2507:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2731:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2329:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2490:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2454:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2306:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2607:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2788:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2322:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2618:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2356:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2412:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2988:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2151:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2753:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2662:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2521:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2452:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2848:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2596:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2962:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2293:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2531:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2557:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2057:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2606:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2781:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2607:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2909:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2350:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2746:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2485:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2654:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2156:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2691:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2687:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2327:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2333:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2318:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2022:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.1996:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2546:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2659:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2808:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2920:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2517:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2492:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2775:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2285:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.3037:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2645:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.3234:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.3028:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2900:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2321:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2681:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2806:  31%|███       | 124/401 [01:15<02:34,  1.80it/s]training loss: 0.2806:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2511:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2614:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2541:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2856:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2305:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2406:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2730:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2401:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2476:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2948:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2945:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.3007:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2669:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.1999:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2215:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.3027:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2507:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2580:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2878:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2233:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2241:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2434:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2449:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.3068:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2748:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2422:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2055:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2809:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2716:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.3045:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2048:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2380:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2451:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.3168:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2556:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2588:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2199:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2749:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2655:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2443:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2271:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.3024:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2626:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2800:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2942:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.3021:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2861:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2862:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2516:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2734:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2094:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2357:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2937:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2625:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2803:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2929:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2798:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2243:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2491:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2649:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2777:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2481:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2450:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2709:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2588:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.3307:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2155:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2815:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2383:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2996:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2719:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2581:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2138:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2546:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2767:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2843:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2391:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2435:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2707:  31%|███       | 125/401 [01:15<02:22,  1.93it/s]training loss: 0.2707:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2802:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2991:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2459:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.1870:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2948:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2350:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2536:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2563:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2137:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2500:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2123:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2820:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2125:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2568:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2459:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2715:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2626:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2604:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2554:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2317:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2318:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2607:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.1894:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2934:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2390:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2911:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2382:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2223:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2462:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2474:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2608:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2461:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2631:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2698:  31%|███▏      | 126/401 [01:15<02:05,  2.19it/s]training loss: 0.2444:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2784:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2397:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2676:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2502:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2351:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2049:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2533:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2508:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2176:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2277:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.3236:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2429:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2501:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2916:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.3389:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2361:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2000:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2104:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2171:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2583:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2884:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2143:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.3157:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2391:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2622:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2759:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2234:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2040:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2156:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2749:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2335:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2208:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2713:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2679:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2457:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2998:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.3605:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2728:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2651:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2209:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2692:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.3075:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.2768:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.1924:  31%|███▏      | 126/401 [01:16<02:05,  2.19it/s]training loss: 0.1924:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2715:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2921:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2463:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2163:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2176:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.1935:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2781:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2834:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2244:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2341:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2456:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2887:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2249:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2211:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2377:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2652:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2935:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2400:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2811:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.3011:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2756:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2065:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2642:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2344:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2083:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2361:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2733:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2598:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2611:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.3378:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2431:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.1982:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.1943:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2536:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2921:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2581:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.3053:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2354:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2533:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2170:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2838:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2282:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2436:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2611:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2363:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2680:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2065:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2721:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.3550:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2753:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2632:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2917:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2845:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2837:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2200:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2403:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2542:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2551:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2780:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2706:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2555:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2598:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2498:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2398:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2968:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2197:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2510:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.3049:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2434:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2430:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2842:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.3075:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2348:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2279:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2468:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2976:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2283:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.2806:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.3424:  32%|███▏      | 127/401 [01:16<01:54,  2.40it/s]training loss: 0.3424:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2271:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3368:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2408:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2511:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2290:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2839:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2203:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3363:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3067:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2336:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2336:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2625:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2509:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3047:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2620:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2672:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2235:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3418:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2284:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2671:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3065:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2118:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2481:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2849:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2520:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2325:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2182:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2148:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2716:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2188:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2414:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2147:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2161:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2260:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2389:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2951:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2530:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2844:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2384:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3151:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2253:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2100:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2260:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2865:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2570:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.1983:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2792:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3117:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2398:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2715:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2152:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2429:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2030:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3430:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2522:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2623:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2914:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2882:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2559:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2566:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2431:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2442:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.1945:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2840:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2128:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2713:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2738:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.1997:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2675:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2455:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2310:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2530:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2416:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2433:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2322:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2312:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2643:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.2830:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3817:  32%|███▏      | 128/401 [01:16<01:46,  2.56it/s]training loss: 0.3817:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2380:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2665:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2595:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2751:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2714:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2472:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2474:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2375:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2683:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2610:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2356:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2393:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2375:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2393:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2768:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2376:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2171:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.1980:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2492:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2219:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2842:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2456:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2976:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2750:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2193:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2562:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2058:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.3568:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2285:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2597:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2570:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2840:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2740:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2131:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2714:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2772:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2223:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2441:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.1940:  32%|███▏      | 129/401 [01:16<01:41,  2.69it/s]training loss: 0.2884:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2709:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2465:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2695:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2547:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.3046:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2411:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2618:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2115:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2846:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2320:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2453:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.1817:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2647:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.3048:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2668:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.1954:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.3154:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2779:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2992:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2623:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2143:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.3255:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2348:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2672:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2561:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2410:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2367:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2548:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2239:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2205:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2144:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2688:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2569:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2566:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2507:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2769:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2748:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2098:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2171:  32%|███▏      | 129/401 [01:17<01:41,  2.69it/s]training loss: 0.2171:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.3074:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2816:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2204:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2081:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2366:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2739:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2439:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2502:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2915:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2455:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2091:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2446:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2189:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2591:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2664:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2854:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.3029:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2592:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2767:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2685:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2466:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2180:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2878:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2313:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.3102:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2911:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2393:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2717:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2568:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2620:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2494:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2739:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2783:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2797:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2549:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2868:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.1915:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2420:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2680:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2285:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2580:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2544:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2689:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2719:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2222:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2195:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2644:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2436:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2075:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2175:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.3406:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.3343:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2251:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2405:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2757:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2322:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2293:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2767:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.3028:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2250:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2153:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2671:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2499:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2643:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2273:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2268:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.1902:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2891:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2430:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2347:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2539:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.3159:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2289:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2291:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2581:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2600:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2697:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2367:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2084:  32%|███▏      | 130/401 [01:17<01:37,  2.79it/s]training loss: 0.2084:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2130:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2491:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2362:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.3164:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2630:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2319:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2355:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2740:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2042:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2364:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2411:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2443:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2237:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2451:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2199:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2686:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2127:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.3228:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2472:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2400:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2227:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2678:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2536:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2511:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2436:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2677:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2298:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2588:  33%|███▎      | 131/401 [01:19<04:48,  1.07s/it]training loss: 0.2169:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2451:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2365:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2332:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.3325:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2473:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2509:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2760:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2906:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2475:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2598:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2372:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2099:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2657:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2532:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2492:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2348:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2537:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2628:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2272:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2160:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2816:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2929:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2320:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2429:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2914:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2683:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2442:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2587:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2231:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2706:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2789:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2529:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.3441:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2420:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2374:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2915:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2637:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2500:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2614:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2927:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2136:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2929:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2764:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2537:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2656:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2903:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2599:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2553:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.2239:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.1713:  33%|███▎      | 131/401 [01:20<04:48,  1.07s/it]training loss: 0.1713:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2680:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2473:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2520:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2919:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2326:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2341:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2491:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2704:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2462:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.3126:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2326:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2309:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.3219:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2707:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2308:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2831:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2814:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2176:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2548:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2508:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2700:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2427:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2208:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2931:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2312:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2548:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2698:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.3129:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2592:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.3340:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2373:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2450:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2416:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2570:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2577:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2654:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.1944:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2237:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2612:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2665:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2120:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2758:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2595:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2289:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.3164:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2702:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2629:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2545:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2580:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.1996:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2876:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2193:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2020:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2756:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2134:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2198:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2882:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2699:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2472:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2770:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2520:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2259:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2447:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2473:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2610:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2814:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2485:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2351:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2685:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2522:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2688:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2385:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2934:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.3154:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2302:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2729:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2219:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2181:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2269:  33%|███▎      | 132/401 [01:20<03:46,  1.19it/s]training loss: 0.2269:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2442:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.1946:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2352:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2111:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2388:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2851:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.3010:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2350:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2797:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2167:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2849:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2851:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2545:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2235:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2052:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2682:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2468:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2987:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2535:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.3011:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2637:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2428:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2296:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2683:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.1853:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2160:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2306:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2849:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2993:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2438:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2514:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2961:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2627:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2498:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2891:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2165:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2429:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2184:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.3087:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2207:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2874:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2012:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2288:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2263:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2560:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2621:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2605:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2316:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2191:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2738:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2698:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.3069:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2557:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.1962:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2321:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2344:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2728:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2325:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2690:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2048:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2560:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2892:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2505:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2442:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.1985:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2092:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2643:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.3155:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2791:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2488:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.3079:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2361:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2595:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2853:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2699:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.3036:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2106:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2047:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2171:  33%|███▎      | 133/401 [01:20<03:03,  1.46it/s]training loss: 0.2171:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2413:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2792:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2422:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2291:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2806:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2705:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2727:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2342:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2863:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2331:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2356:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.3173:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2316:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.1719:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2688:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2463:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2940:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2317:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2415:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.3037:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2640:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2420:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2520:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2335:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.3595:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2410:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.1856:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2859:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2632:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2067:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2710:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.1909:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2703:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2145:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.1822:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2567:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.1897:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.1985:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2624:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2553:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2945:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2247:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.3115:  33%|███▎      | 134/401 [01:20<02:33,  1.74it/s]training loss: 0.2754:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2685:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2670:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.1837:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2968:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2067:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2377:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2438:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2344:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2208:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2530:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2153:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2150:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2713:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2217:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2394:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.3008:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2424:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.3310:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2331:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.1890:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2394:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2280:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2498:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2403:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2493:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2351:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2041:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2239:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2759:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2648:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2191:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2259:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2504:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2482:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2402:  33%|███▎      | 134/401 [01:21<02:33,  1.74it/s]training loss: 0.2402:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2433:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2358:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2958:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2157:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2045:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2106:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2388:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2754:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2393:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2504:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2329:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2354:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2287:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2703:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2570:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.3267:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2282:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2783:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2397:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2982:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2677:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2763:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2802:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2199:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.3234:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2535:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2846:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2554:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2353:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2155:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2403:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2514:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.3084:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.3074:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2686:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2144:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2664:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2629:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2391:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2578:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2879:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2431:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2043:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2676:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.3005:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.3222:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2505:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2318:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2498:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2453:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2349:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2533:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2414:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2608:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2905:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2220:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2229:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2054:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2110:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2417:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2297:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2712:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2376:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2414:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2332:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.3059:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2067:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2241:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2317:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.3579:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2466:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2168:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2381:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2393:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2729:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2622:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2370:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2463:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2772:  34%|███▎      | 135/401 [01:21<02:11,  2.02it/s]training loss: 0.2772:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2548:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.3449:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.1515:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2330:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2300:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.1879:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.1925:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2480:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2185:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2816:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2582:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2800:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2002:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.3346:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2340:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2588:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2515:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2266:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2666:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2065:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2097:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2564:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2823:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2400:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2439:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2598:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2883:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2691:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2397:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2591:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2095:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2030:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2257:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2338:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2262:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2217:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2689:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2208:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2864:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2172:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2399:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2242:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2609:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2000:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2073:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2625:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2702:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2275:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2859:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2637:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2575:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2423:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.1951:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.1822:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2396:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2289:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2561:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2267:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2310:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2226:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2557:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2716:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2727:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2510:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.3113:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2578:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2104:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2454:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.1954:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2703:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2603:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2563:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2806:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.1973:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2932:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2716:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2855:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.2821:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.3788:  34%|███▍      | 136/401 [01:21<01:56,  2.28it/s]training loss: 0.3788:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2400:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2175:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2534:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.3051:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2309:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2403:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2285:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2514:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2889:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.3150:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2107:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2366:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2717:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2500:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2638:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2707:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2829:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2794:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2478:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2674:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2820:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2445:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2719:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2338:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2541:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2824:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2101:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2480:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2453:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2660:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2082:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2568:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2092:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2396:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2367:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.3181:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2256:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2685:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2539:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2687:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.1974:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2082:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2350:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2971:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2695:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2383:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2649:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2169:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2496:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2642:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2532:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2920:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2517:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2305:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2741:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2421:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2349:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2740:  34%|███▍      | 137/401 [01:21<01:45,  2.49it/s]training loss: 0.2875:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2272:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2615:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2915:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2246:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2222:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.1647:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2982:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2422:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2204:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2363:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2491:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.1902:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2345:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2309:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2659:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2497:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2692:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.2549:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.3051:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.1219:  34%|███▍      | 137/401 [01:22<01:45,  2.49it/s]training loss: 0.1219:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2165:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2527:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2677:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2392:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.1969:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2790:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2457:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2504:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2594:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2011:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2658:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.1890:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2648:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2810:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2583:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2025:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2444:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2472:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2609:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2308:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2257:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2132:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2528:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2205:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2782:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2117:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2718:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2496:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2205:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2217:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2339:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2526:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2630:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2418:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2490:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2966:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2424:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2219:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.1994:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2955:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.3182:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2621:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2672:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2642:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2800:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2985:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2547:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2195:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2374:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2792:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2655:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2669:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2536:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.1868:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2931:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2589:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2654:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2577:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2784:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.1953:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2445:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2039:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2450:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2082:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2255:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2676:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2519:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2408:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.3440:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2315:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2205:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.1927:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2172:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2793:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2106:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2554:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2521:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2506:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2591:  34%|███▍      | 138/401 [01:22<01:38,  2.66it/s]training loss: 0.2591:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2330:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2329:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2843:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2210:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2657:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2495:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2583:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2745:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2458:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2551:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2629:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2444:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2540:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2831:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2131:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2972:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.1807:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2438:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2873:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2214:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2366:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2623:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.1929:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2083:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2299:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2220:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2398:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2550:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2509:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2399:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2032:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2912:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2886:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2635:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2583:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2543:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2071:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2969:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2855:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2182:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2173:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.1881:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2716:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2251:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2184:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2332:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2149:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2465:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2648:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2180:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2799:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2267:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2020:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2205:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2391:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2111:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2334:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2330:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2275:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2009:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2269:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2038:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2699:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2693:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2490:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2362:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2644:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2031:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2530:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2111:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2307:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2295:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.1813:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2570:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2192:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2842:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2554:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2616:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2463:  35%|███▍      | 139/401 [01:22<01:33,  2.80it/s]training loss: 0.2463:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.1866:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2057:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2163:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2214:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2804:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2139:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2149:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.1972:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2454:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2601:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2443:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2302:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.3024:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2139:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2353:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2341:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2997:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2309:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.3046:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2074:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2510:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2290:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2279:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.1968:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2190:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.3079:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2515:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2363:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2515:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2175:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2270:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2329:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2581:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2533:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2761:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2237:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2681:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2155:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2620:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2263:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.3203:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.3195:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2331:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2270:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2447:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.1928:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2502:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2711:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2616:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2339:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2231:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2184:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2433:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2449:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2344:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2185:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2841:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2237:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2406:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2513:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2487:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2518:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2630:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2500:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2491:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2709:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2070:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2364:  35%|███▍      | 140/401 [01:22<01:31,  2.86it/s]training loss: 0.2440:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.2334:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.2150:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.2967:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.2083:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.1979:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.2759:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.2425:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.2164:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.2856:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.1140:  35%|███▍      | 140/401 [01:23<01:31,  2.86it/s]training loss: 0.1140:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2658:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2828:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2442:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2390:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2028:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.3054:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2572:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2643:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2218:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.3549:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2556:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2339:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2135:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2578:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2547:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2254:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2717:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.3027:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2704:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2489:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2660:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2449:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1814:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2573:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2477:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2616:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2536:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2987:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1827:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2454:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1752:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2510:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2489:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2278:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2666:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2093:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2804:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2728:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2248:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2673:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2406:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2502:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2338:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2246:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2557:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1698:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2849:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2742:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2854:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2606:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2841:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2198:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2663:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2231:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2202:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2362:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2775:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2076:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2172:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2802:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2450:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2814:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2783:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2144:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2397:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2357:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2132:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2846:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2748:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2595:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1895:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1991:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2762:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2684:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2274:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2396:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.2579:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1930:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1497:  35%|███▌      | 141/401 [01:25<04:19,  1.00it/s]training loss: 0.1497:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2230:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2192:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2621:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.1999:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2168:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2201:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.1869:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2563:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2284:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2793:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2760:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2291:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2274:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2643:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2073:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2788:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2713:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2466:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2104:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2527:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2711:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2515:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2249:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2526:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2353:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2274:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.1927:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2053:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.3066:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2429:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2373:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2413:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2445:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2000:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2578:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2089:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2026:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2587:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2767:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2751:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2057:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2540:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2064:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2217:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2641:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2242:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2200:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2298:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2395:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2626:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.3168:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2290:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2789:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2344:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2197:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2317:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2450:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2459:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.3186:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2374:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2383:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2784:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2376:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2078:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2519:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2551:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.1846:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2733:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2135:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2571:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2919:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2529:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2470:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.1850:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2179:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.3088:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2490:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2428:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2479:  35%|███▌      | 142/401 [01:25<03:25,  1.26it/s]training loss: 0.2479:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2126:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2314:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2463:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2422:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2468:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.1967:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2305:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2201:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2812:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2191:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.1993:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2180:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2114:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2471:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.3224:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.1922:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2688:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2410:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2292:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2650:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2337:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.1561:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2592:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2779:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.1964:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2707:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2672:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.1938:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.1986:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2069:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2308:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2598:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2693:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2009:  36%|███▌      | 143/401 [01:25<02:47,  1.54it/s]training loss: 0.2577:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2482:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2134:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2504:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2071:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.3016:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.3182:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2288:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2389:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2173:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2081:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2520:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2558:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2460:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2420:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2510:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2287:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2407:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2588:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.1910:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2635:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2191:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2625:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2587:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2900:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2660:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2139:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2839:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2765:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2452:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2300:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2691:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2845:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2593:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2526:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2432:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2344:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.3100:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2086:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2154:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2881:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.3164:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2848:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2215:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2081:  36%|███▌      | 143/401 [01:26<02:47,  1.54it/s]training loss: 0.2081:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2512:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2756:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2466:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2824:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2876:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2375:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2112:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2072:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2391:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2498:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2349:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2460:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2284:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.3110:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2465:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2454:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.1989:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2478:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2074:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2884:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2265:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2593:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2012:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2711:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2493:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2396:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2271:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.1906:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2452:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.1664:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2849:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2074:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2087:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2647:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2380:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2465:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2414:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2547:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2510:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.1617:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.3012:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2362:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2222:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2780:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2450:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2182:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2638:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2120:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2152:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.3425:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2174:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2515:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2398:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2049:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2477:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2489:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2263:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2222:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2567:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2615:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2482:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2309:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2013:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.1823:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2730:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.3051:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2431:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2276:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2656:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2075:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.3081:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2074:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2415:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2842:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2037:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2336:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2197:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.2693:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.1937:  36%|███▌      | 144/401 [01:26<02:21,  1.81it/s]training loss: 0.1937:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.1960:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2718:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2379:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2214:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2170:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.1918:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2237:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2008:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2712:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2067:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2070:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2319:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2249:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.1787:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2330:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2284:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2447:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2213:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2561:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2264:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2093:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2148:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2233:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2023:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.3081:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2603:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.3031:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.3034:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2823:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2471:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2671:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2468:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2127:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2074:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2326:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2543:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2230:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2532:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2499:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.1677:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2253:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2169:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2263:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2611:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.1861:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2514:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2181:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2584:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2040:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2045:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2303:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2446:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2297:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2541:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2511:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2393:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2590:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2492:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2245:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2675:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2553:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2859:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.1935:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2670:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2458:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2394:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2459:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2446:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2021:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.3102:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.1831:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2685:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2036:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2319:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2172:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2188:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2664:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.3045:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2373:  36%|███▌      | 145/401 [01:26<02:02,  2.09it/s]training loss: 0.2373:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2471:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2370:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2839:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2130:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1937:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2513:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2380:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2252:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2710:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2063:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2599:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2615:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2788:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2409:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2402:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2475:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2392:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2290:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2076:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2571:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2957:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2324:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2261:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2237:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1946:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2355:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2020:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2307:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2069:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.3115:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2735:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2307:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2112:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1912:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2210:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2451:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2697:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2402:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2509:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1897:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2261:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2135:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1698:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2066:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1895:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2521:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1821:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.2083:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1676:  36%|███▋      | 146/401 [01:26<01:49,  2.34it/s]training loss: 0.1980:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2556:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.1711:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2499:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2290:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2520:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2013:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2567:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2322:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2788:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2394:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2959:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2468:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2171:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2376:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2147:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2679:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2404:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2155:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.3033:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.3132:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2660:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2089:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2099:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2323:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2287:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2393:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2421:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2872:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2228:  36%|███▋      | 146/401 [01:27<01:49,  2.34it/s]training loss: 0.2228:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2619:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2374:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2101:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2590:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.1833:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2296:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.3116:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2078:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2310:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2535:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2517:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2008:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2527:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2456:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.3102:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2174:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2757:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2263:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.1683:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2012:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2995:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.1957:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2334:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2776:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2003:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.1705:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2316:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.1842:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2684:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2367:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2463:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2196:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2762:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2301:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2395:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2144:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.1755:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2417:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.3267:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2796:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2575:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2236:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2581:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2393:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2324:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2418:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2771:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2463:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2359:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2659:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2166:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2123:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2297:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2623:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2038:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2573:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2134:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2148:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2248:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2611:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2376:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2521:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.3142:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2242:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2858:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2591:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.1963:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2295:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2428:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2284:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.1984:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2336:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2326:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2744:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2670:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2525:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2284:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2260:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2945:  37%|███▋      | 147/401 [01:27<01:39,  2.55it/s]training loss: 0.2945:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2749:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2375:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2894:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2778:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2613:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2923:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2231:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1825:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2444:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2247:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2638:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2102:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2102:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1886:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1929:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1902:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2750:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2307:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.3021:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2695:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2174:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2569:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1831:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2227:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2071:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2789:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2032:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2296:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2991:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2624:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2364:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1891:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.3132:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2405:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.3026:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2316:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2003:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2343:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2466:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2264:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2915:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2204:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2625:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2361:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2250:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2143:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2934:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2174:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2077:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2251:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.3124:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2500:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2210:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2583:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2100:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2670:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2416:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2387:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2077:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2962:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2753:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1960:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1943:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.1974:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2089:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2911:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2645:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2386:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2124:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2482:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2714:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2284:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2643:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2180:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2773:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2936:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2026:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2117:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2827:  37%|███▋      | 148/401 [01:27<01:33,  2.71it/s]training loss: 0.2827:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2587:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2499:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2403:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2952:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2669:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2588:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2353:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2347:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2218:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2184:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2898:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2101:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2767:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.3024:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2230:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2155:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1905:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2377:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2442:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2706:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2599:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2431:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2185:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2540:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2394:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1881:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2001:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2711:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2623:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2559:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1839:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2674:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2918:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2172:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2585:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.3077:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1813:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1946:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2622:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2324:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2340:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2075:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2359:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2622:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2289:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2268:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2520:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2386:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1940:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2082:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2181:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2656:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2446:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2031:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1936:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2665:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2684:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2199:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1629:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2602:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.1723:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2618:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2001:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2316:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2240:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2826:  37%|███▋      | 149/401 [01:27<01:28,  2.85it/s]training loss: 0.2471:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2622:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2318:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2729:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2802:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.1855:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2665:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2052:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2456:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.3087:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2539:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.1799:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2569:  37%|███▋      | 149/401 [01:28<01:28,  2.85it/s]training loss: 0.2569:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.1797:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2754:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2429:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2296:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2593:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2799:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2167:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2406:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2584:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2151:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.1750:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2501:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.3026:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2265:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2392:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2861:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2539:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2369:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2436:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2122:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2407:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2710:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2186:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.3091:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.1964:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2235:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2270:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.1568:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2700:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2769:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2678:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2040:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2559:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2096:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2501:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2672:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2280:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2995:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2382:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2280:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2675:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2488:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2349:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2239:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2136:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2160:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2227:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2186:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2644:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.3184:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.3136:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2595:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2501:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2547:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2582:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2058:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2301:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2842:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2298:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.1831:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2439:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2772:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2921:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2384:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2832:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2202:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2921:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2914:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2375:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2347:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2481:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.3091:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.1807:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2120:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.1916:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2650:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2127:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.2410:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.0895:  37%|███▋      | 150/401 [01:28<01:25,  2.95it/s]training loss: 0.0895:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2710:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.3121:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2454:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2479:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1671:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2284:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2507:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2671:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2013:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2363:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2505:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2017:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2523:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2234:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2817:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1855:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2169:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2168:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2815:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2450:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2948:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2619:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2194:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2294:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1857:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2316:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2508:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2755:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2475:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2185:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2029:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1843:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1980:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2093:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2245:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2043:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2084:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2508:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1924:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2071:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2327:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2508:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1986:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2230:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2222:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1693:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2266:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2632:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2605:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2306:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.3212:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2205:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2394:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2783:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1702:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2337:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1726:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2328:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1983:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2315:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2389:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2578:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2040:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2735:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2416:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.1909:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2478:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2768:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.3315:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2801:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2649:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2573:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2157:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2821:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2200:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2080:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2177:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2128:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2385:  38%|███▊      | 151/401 [01:30<04:15,  1.02s/it]training loss: 0.2385:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2130:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2775:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2706:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2538:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2530:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2007:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2117:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2541:  38%|███▊      | 152/401 [01:30<03:20,  1.24it/s]training loss: 0.2087:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2160:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.1923:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2480:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2491:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2667:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2163:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2080:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2232:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.1938:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2597:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.3184:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2089:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2300:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.3073:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2831:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2786:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2302:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2468:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2681:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.3038:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2245:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2617:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2432:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2208:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2480:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2825:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2904:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2327:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2335:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2537:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.1948:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2133:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2205:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2041:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2205:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2564:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2021:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.1836:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2306:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2005:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2389:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2610:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2366:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2053:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2111:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2491:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2439:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2495:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2611:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2643:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.1822:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2404:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2787:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2317:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2907:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2345:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2766:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2486:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2165:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2324:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2369:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2095:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2296:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2506:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2237:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2378:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2080:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2132:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2557:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2349:  38%|███▊      | 152/401 [01:31<03:20,  1.24it/s]training loss: 0.2349:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2295:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2486:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.3139:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2387:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2076:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2879:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2164:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.1929:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2231:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2709:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2672:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.1823:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2356:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2230:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2694:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2708:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2313:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2519:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2474:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2530:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2386:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2081:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2158:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.1831:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2344:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2050:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2258:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2150:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2730:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2240:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2408:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2118:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2267:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.3093:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2535:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2903:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2309:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2049:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2542:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2204:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2134:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2505:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2109:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2233:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2164:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2423:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2467:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2683:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2309:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.1739:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2151:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2397:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2738:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2916:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2404:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2109:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.1546:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2233:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2531:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2062:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2329:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2315:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2595:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2629:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2557:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2308:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2449:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2286:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2491:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2429:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2228:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2222:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2218:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2323:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2550:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2368:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.1816:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.2125:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.1626:  38%|███▊      | 153/401 [01:31<02:43,  1.52it/s]training loss: 0.1626:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2144:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2224:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.3118:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2429:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2197:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.3131:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2347:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.1899:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2629:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2238:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2825:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2214:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2787:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2445:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2415:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2266:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2579:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2351:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.1582:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2629:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2271:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2867:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2290:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2768:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2298:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2230:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2429:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2424:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.1848:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2141:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2228:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2099:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2510:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2442:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.1637:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2420:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2960:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2082:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2368:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2133:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2142:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2488:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.3151:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2418:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2913:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2252:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2469:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2250:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2766:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2353:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2269:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2013:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2287:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2014:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2517:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2314:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2688:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.1950:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2327:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2350:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2293:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2612:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2436:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2646:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.1965:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.1858:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2347:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2948:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2350:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2877:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2039:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2562:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2373:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2036:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.1978:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2629:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2337:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2742:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2711:  38%|███▊      | 154/401 [01:31<02:16,  1.81it/s]training loss: 0.2711:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2240:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2175:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2626:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2303:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2827:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2169:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2193:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.3020:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2433:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2730:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2866:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2328:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2701:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2131:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2800:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2007:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2460:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.1849:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2205:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2616:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2097:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2354:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2442:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2211:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2086:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2250:  39%|███▊      | 155/401 [01:31<01:58,  2.08it/s]training loss: 0.2857:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2148:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2377:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2175:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.1817:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2629:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2206:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2035:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2155:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2773:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2620:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.1938:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2074:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2439:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2612:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2381:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2199:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2331:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2331:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2418:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2269:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2860:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2020:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2519:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2121:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2712:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2340:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2396:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2456:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2566:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2311:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.1964:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2988:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2388:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.1908:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2635:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2230:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2441:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.1745:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2477:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2530:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2905:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2399:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2241:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2407:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2456:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2092:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2327:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.3045:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2465:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2213:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.2088:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.1495:  39%|███▊      | 155/401 [01:32<01:58,  2.08it/s]training loss: 0.1495:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2196:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2422:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2200:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.3281:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2316:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2058:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2282:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2140:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2902:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1891:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2639:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2486:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2063:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2303:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2873:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2815:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2046:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2544:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2445:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2228:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2140:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2269:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2594:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2687:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2236:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2251:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2497:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1955:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2234:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2004:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2370:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2314:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2091:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2549:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2313:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1956:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2438:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2220:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2895:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2269:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1993:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2632:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2214:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2267:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2104:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2474:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2612:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2698:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.3186:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2343:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1744:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2455:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1900:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2278:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1913:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2118:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1621:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2251:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2788:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1815:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2562:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2281:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2465:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2607:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2113:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1899:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.3176:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2471:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2618:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2704:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2090:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1801:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2080:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1801:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2713:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2493:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.1940:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.2436:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.4049:  39%|███▉      | 156/401 [01:32<01:45,  2.33it/s]training loss: 0.4049:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2581:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1975:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2070:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2259:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2228:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2398:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1890:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2225:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2020:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2407:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1810:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2028:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2482:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2370:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2039:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2270:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2169:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1937:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2345:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2701:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2492:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2086:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2669:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2563:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2169:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1947:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2379:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2809:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2303:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2881:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1771:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2119:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2310:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2284:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2206:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2699:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2232:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2098:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2615:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2052:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2343:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1984:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2332:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1963:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2302:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1802:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2396:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2154:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1915:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2351:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2081:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2328:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2510:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2176:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2368:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2131:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2695:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2689:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2231:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2323:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2199:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2194:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.3239:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2008:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2146:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2566:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2133:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1998:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2563:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2410:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2392:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2818:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2310:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2268:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2591:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2422:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.1793:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.2226:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.0932:  39%|███▉      | 157/401 [01:32<01:36,  2.52it/s]training loss: 0.0932:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.1993:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2307:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2668:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2318:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2255:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2574:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2499:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2138:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2584:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2664:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2017:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2613:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2050:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2202:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2178:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2544:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.1613:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2012:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.3194:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2431:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2213:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2307:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2892:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2408:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2137:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2315:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2574:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2350:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2364:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2613:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2409:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2642:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.1854:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2499:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2243:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2382:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2586:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2753:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2345:  39%|███▉      | 158/401 [01:32<01:30,  2.68it/s]training loss: 0.2341:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2316:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1992:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1997:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2397:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.3026:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2818:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2329:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2135:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2501:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2190:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2300:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2807:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1921:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2337:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1552:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2305:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1863:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2572:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2069:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2937:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1980:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1945:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2090:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2519:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2886:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2706:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2310:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2300:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2111:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2738:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1900:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2526:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2438:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.3220:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.1995:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2801:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2078:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2220:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2199:  39%|███▉      | 158/401 [01:33<01:30,  2.68it/s]training loss: 0.2199:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.1919:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.3113:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2020:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.3124:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2546:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2421:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2247:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.1926:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.1977:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2424:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2592:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2336:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2782:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2695:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2391:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2549:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2168:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2103:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2216:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2556:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2466:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.3015:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2037:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2666:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2710:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2243:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2301:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2553:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2195:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2054:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2376:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2360:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2807:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2724:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2477:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2241:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2217:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.1934:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2830:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2461:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2656:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2121:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2493:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.1647:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2545:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2073:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2265:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2360:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2586:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2223:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2631:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2142:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2424:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2532:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2639:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2149:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2408:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2486:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2183:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2645:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.1918:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2763:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.3148:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2582:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.1889:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2191:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2028:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2362:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2235:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2323:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2400:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2281:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2242:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2183:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2650:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.1795:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2734:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.2182:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.3396:  40%|███▉      | 159/401 [01:33<01:25,  2.83it/s]training loss: 0.3396:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2034:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2457:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1810:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2241:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.3056:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2006:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2106:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2355:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2644:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2097:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2931:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1943:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2482:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2387:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2859:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2456:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1870:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2641:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2364:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1440:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2447:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2885:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2329:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2248:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2255:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2116:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2174:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1951:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2214:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2799:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1799:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2255:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2025:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.3009:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2580:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1948:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2029:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2538:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2773:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1635:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2165:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.3018:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2416:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2376:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1632:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2459:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2061:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1748:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1961:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2135:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2105:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2866:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2369:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2351:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2996:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2270:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2063:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2518:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2418:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2597:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2286:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2714:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2010:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2744:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2403:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2923:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2855:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2367:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.3176:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2522:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1967:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1968:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2500:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2511:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2521:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.2422:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1862:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1962:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1553:  40%|███▉      | 160/401 [01:33<01:21,  2.94it/s]training loss: 0.1553:  40%|████      | 161/401 [01:35<03:58,  1.01it/s]training loss: 0.2321:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2110:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2794:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2206:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2863:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2367:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2195:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2097:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2229:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2272:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2475:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2817:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2792:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1886:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2107:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2177:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2128:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2052:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2426:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1997:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2224:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1961:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1790:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1608:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2362:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2314:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1713:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2475:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.3101:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2410:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1988:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2475:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1916:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1541:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2418:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2648:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2567:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2035:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2393:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2920:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2868:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2723:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2347:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1851:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2855:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2123:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2057:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2808:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.3031:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2114:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2198:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2809:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2266:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1876:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2213:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1806:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2350:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2637:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2010:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2285:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2659:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2050:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1829:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1757:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2011:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2841:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2896:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2190:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2435:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2154:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2601:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2792:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1965:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2240:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.1949:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2770:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2585:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2560:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2171:  40%|████      | 161/401 [01:36<03:58,  1.01it/s]training loss: 0.2171:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2045:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2567:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2353:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2298:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2334:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2380:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.1998:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2457:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2433:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2280:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2823:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.1955:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2582:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2882:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2102:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2855:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2433:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2222:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2371:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2894:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2157:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2443:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2161:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2550:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2054:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2563:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2179:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2231:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2294:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2226:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2602:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2820:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2549:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2502:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2373:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2148:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2238:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2098:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.1688:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2703:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2349:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2571:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2219:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2334:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2664:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2393:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2603:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2844:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2318:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2380:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2277:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2123:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.1833:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2019:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2445:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.1829:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2641:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2105:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2347:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2520:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2499:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2137:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2362:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2125:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.1977:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2084:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2560:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2217:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2476:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2413:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2292:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2300:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2325:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2150:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2201:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.1815:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2111:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.1997:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2812:  40%|████      | 162/401 [01:36<03:14,  1.23it/s]training loss: 0.2812:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2841:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2915:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2987:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2373:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2581:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1939:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2273:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2449:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2342:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2559:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1732:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1941:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2549:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2048:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2639:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2440:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2696:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2548:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2139:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2856:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2103:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1967:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2325:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2141:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1983:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1998:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1957:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2296:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2366:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2512:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2305:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1916:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2210:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2327:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2073:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2319:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.3087:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2058:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1965:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2128:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2133:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2726:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2835:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2390:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1956:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1765:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2351:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2637:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2500:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1978:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2007:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2822:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.1712:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2480:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2504:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2821:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2129:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2123:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2831:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2123:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2191:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2285:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2963:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.3100:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2117:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2228:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2340:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2189:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2102:  41%|████      | 163/401 [01:36<02:40,  1.48it/s]training loss: 0.2446:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.1707:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.1927:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.2170:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.2184:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.1988:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.2014:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.2228:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.2239:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.3339:  41%|████      | 163/401 [01:37<02:40,  1.48it/s]training loss: 0.3339:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2739:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1462:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2003:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2436:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2282:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2435:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2252:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2297:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2364:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1931:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1936:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2431:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2071:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2174:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1641:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2579:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2052:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2614:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2112:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2404:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2081:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2153:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1932:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2864:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2180:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2261:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2209:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2614:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2646:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2388:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2325:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1899:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2594:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2698:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2441:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1917:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1922:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2152:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1919:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2557:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2749:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2057:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2079:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2727:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2247:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2036:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2632:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2319:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2383:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2597:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1878:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2244:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2891:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2715:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2491:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2563:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2301:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2045:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2510:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2522:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2211:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2405:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1790:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2013:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1879:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2418:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1935:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2456:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2405:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2000:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2382:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2335:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2539:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2066:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2775:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2082:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.2997:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1991:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1887:  41%|████      | 164/401 [01:37<02:14,  1.77it/s]training loss: 0.1887:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2085:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2188:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2031:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2287:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2512:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.3010:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2471:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2267:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2391:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2186:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2062:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1980:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2005:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2273:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1818:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2159:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2138:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2028:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2250:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1980:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1927:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2782:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2934:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2848:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2256:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2524:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2139:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2867:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2560:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2041:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2783:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2236:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2166:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1950:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2446:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1725:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2367:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2545:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2359:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2070:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2069:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1905:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2451:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2545:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2440:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1852:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2457:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2492:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2551:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2204:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1745:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1634:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2327:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1834:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2545:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2744:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2105:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2006:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1874:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2746:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2250:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2812:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1959:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2267:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2200:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2490:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1874:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2259:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2547:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2693:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2285:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2509:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2883:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2673:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2154:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1796:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.2433:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1878:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1598:  41%|████      | 165/401 [01:37<01:55,  2.04it/s]training loss: 0.1598:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1610:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2433:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2041:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2655:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2125:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2244:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2106:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2289:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2425:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2369:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2088:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2171:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2222:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2095:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2413:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2354:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2241:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2968:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2071:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2097:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2532:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1922:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2252:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2524:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1991:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2284:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1892:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2552:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2784:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2587:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2322:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1648:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2066:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2546:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2018:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2046:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2633:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2245:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2381:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1676:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1848:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2679:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2013:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2161:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2737:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2519:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2169:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1983:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2339:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2934:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2756:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2509:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1864:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2094:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1819:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2396:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.3202:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1989:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.3549:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2194:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1974:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2059:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1758:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2007:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2212:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2259:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1837:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2209:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.1517:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2550:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2672:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2499:  41%|████▏     | 166/401 [01:37<01:45,  2.22it/s]training loss: 0.2416:  41%|████▏     | 166/401 [01:38<01:45,  2.22it/s]training loss: 0.1891:  41%|████▏     | 166/401 [01:38<01:45,  2.22it/s]training loss: 0.2189:  41%|████▏     | 166/401 [01:38<01:45,  2.22it/s]training loss: 0.2280:  41%|████▏     | 166/401 [01:38<01:45,  2.22it/s]training loss: 0.2731:  41%|████▏     | 166/401 [01:38<01:45,  2.22it/s]training loss: 0.2007:  41%|████▏     | 166/401 [01:38<01:45,  2.22it/s]training loss: 0.3308:  41%|████▏     | 166/401 [01:38<01:45,  2.22it/s]training loss: 0.3308:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1968:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2008:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2246:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2007:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2197:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2430:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1880:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2916:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2634:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2196:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.3630:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2618:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2313:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1790:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2205:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2193:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2296:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1906:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2471:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2529:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2089:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1837:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2412:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1995:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2408:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2842:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1961:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2403:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2005:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2156:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1930:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2680:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1904:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1895:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2287:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2548:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1861:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2386:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2194:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2200:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1891:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2578:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2071:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2573:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2332:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2205:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2121:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2008:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2062:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2286:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2136:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2075:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2104:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1911:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2012:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2213:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2559:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2551:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2476:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2242:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2211:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1987:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2666:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2223:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2626:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2051:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2448:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1922:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2019:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2520:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2117:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2170:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1737:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2968:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2467:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2065:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2415:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.2312:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1904:  42%|████▏     | 167/401 [01:38<01:36,  2.43it/s]training loss: 0.1904:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1944:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2053:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2065:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1955:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2093:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2016:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2155:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2624:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2808:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2282:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1445:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2582:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2785:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1847:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2164:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2130:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2353:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2059:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2182:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2447:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1813:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2424:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2129:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2249:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2390:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2009:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2210:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2973:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1987:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1988:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2781:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2271:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2295:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2726:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1916:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1892:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1939:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1980:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2195:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2578:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2358:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2538:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1648:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1998:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2374:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2095:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1901:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2000:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2047:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2165:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2092:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2299:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1854:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1906:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2921:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1726:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2383:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2448:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2768:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2010:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2229:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2116:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2287:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2320:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2281:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2237:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2350:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2516:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2266:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2344:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2128:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1710:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2076:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2488:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1853:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2050:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.2030:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1616:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1537:  42%|████▏     | 168/401 [01:38<01:29,  2.61it/s]training loss: 0.1537:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2167:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2247:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1822:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2193:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2353:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1742:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2055:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2211:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2139:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2069:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1771:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2463:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2447:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2353:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2482:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2744:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2288:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2598:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2237:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2248:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2059:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2464:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2391:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1862:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2572:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1878:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2717:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1804:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2922:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2027:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1782:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2281:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2921:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2371:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2741:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2863:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1767:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2508:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2287:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2051:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2369:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2871:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2607:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2630:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1828:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1975:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1840:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2018:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1750:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2216:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2308:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2365:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2404:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1877:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2841:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1769:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1843:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2074:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2345:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1716:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2227:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1786:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2117:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1952:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1817:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2100:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2130:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1866:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2137:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1980:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1835:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2140:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1947:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1768:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.2782:  42%|████▏     | 169/401 [01:38<01:23,  2.77it/s]training loss: 0.1826:  42%|████▏     | 169/401 [01:39<01:23,  2.77it/s]training loss: 0.2473:  42%|████▏     | 169/401 [01:39<01:23,  2.77it/s]training loss: 0.2475:  42%|████▏     | 169/401 [01:39<01:23,  2.77it/s]training loss: 0.3009:  42%|████▏     | 169/401 [01:39<01:23,  2.77it/s]training loss: 0.3009:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2308:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2115:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2250:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1620:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2267:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2418:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2806:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2127:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2768:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2438:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2324:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2162:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2162:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2772:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2101:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1875:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1660:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2187:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2233:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2669:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2090:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2167:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1937:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2193:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2059:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1638:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2567:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2072:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2023:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2377:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2018:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2144:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2222:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2258:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2008:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2508:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2172:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1848:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1902:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2277:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1980:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2042:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1871:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2182:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1983:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2023:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1663:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2418:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2377:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2264:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2194:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2354:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2585:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2361:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2531:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2518:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2567:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2190:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2364:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2427:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2549:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2318:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1673:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2297:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2114:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1865:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2825:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2391:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1794:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2218:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2929:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2002:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2664:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2073:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1697:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2412:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2229:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.2159:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1627:  42%|████▏     | 170/401 [01:39<01:23,  2.77it/s]training loss: 0.1627:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2394:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2685:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2039:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2269:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2343:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2053:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1781:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1857:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1913:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1825:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2530:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2479:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2055:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2374:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1944:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1907:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2158:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2191:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2621:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2063:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2228:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2001:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2810:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1944:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2345:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1669:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1980:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1952:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2155:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2458:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1842:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1890:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2323:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2382:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2365:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2311:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2471:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2658:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2307:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2739:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2055:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1896:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2470:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2025:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2099:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2591:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2478:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2305:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1835:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2269:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1876:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1755:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2225:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2278:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1801:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2064:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2312:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2052:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.3575:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1896:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1957:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2215:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2273:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2375:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2189:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1963:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2432:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2413:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2888:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1904:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2301:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2620:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2972:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2343:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2135:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2136:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2003:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.2107:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1889:  43%|████▎     | 171/401 [01:41<03:52,  1.01s/it]training loss: 0.1889:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1931:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2261:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2516:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2121:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2053:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2642:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2452:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1904:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2406:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2356:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1987:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2296:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1756:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1728:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2625:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1892:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2769:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.3033:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2487:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2388:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2510:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2577:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1932:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2216:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2158:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2067:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2213:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1798:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2067:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1929:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2271:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.2132:  43%|████▎     | 172/401 [01:41<03:04,  1.24it/s]training loss: 0.1769:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1997:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2086:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2227:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1802:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2586:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2592:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2534:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2006:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2393:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2476:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2119:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1826:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2043:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2148:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1766:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2353:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2557:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1987:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2459:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2073:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2183:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2015:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2624:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2383:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2110:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2076:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1756:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2615:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1909:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2600:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1907:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2225:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1699:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1798:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2081:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2123:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1779:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2202:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1914:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2378:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2260:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2328:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2154:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2176:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.2776:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1886:  43%|████▎     | 172/401 [01:42<03:04,  1.24it/s]training loss: 0.1886:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2377:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1998:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2201:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2538:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1897:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2237:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2510:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2390:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2158:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2184:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2096:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2285:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1974:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2306:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1404:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2237:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1973:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2336:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1920:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2302:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2136:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2379:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2550:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2327:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1865:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2049:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2302:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2223:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2365:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2757:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2695:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1762:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2671:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2270:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1857:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2091:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2346:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2276:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2359:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1947:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2233:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1913:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2253:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.3009:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2292:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2348:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2183:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2415:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1713:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2011:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2663:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2097:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2665:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2337:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2167:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2692:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2179:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2500:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2207:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1730:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2570:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2047:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2602:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2073:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2036:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1974:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.3292:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2269:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2617:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2225:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2178:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1982:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1890:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2025:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2422:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1775:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1902:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.2732:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1966:  43%|████▎     | 173/401 [01:42<02:30,  1.52it/s]training loss: 0.1966:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2057:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2943:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2028:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2664:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1530:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2123:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2069:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2840:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1920:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1934:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1973:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2256:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2514:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2492:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2099:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1983:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2048:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2353:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1814:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2092:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1776:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2617:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1494:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2485:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2618:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1840:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1980:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2731:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2160:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1914:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2673:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2078:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2556:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2357:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2853:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2403:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2019:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2488:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2593:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2270:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1976:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2252:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1968:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.3199:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2241:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2052:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2396:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1992:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2846:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2288:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2137:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2408:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2120:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2102:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2348:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1984:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1594:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1954:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2290:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2167:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2324:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2469:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1954:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2032:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2016:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1862:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1696:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2346:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2259:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1444:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2597:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1719:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2339:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2667:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2237:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2341:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.1918:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2563:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2460:  43%|████▎     | 174/401 [01:42<02:07,  1.79it/s]training loss: 0.2460:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2523:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.1764:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.1718:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2237:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2390:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.3130:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2605:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.1642:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2468:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.1878:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2041:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2312:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.1972:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2193:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2092:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2290:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2425:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2032:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2384:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2278:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2239:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2114:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2522:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.1989:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2223:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2248:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.1623:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2564:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.1971:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2230:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2091:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2265:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2247:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2810:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2307:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2175:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2357:  44%|████▎     | 175/401 [01:42<01:51,  2.02it/s]training loss: 0.2155:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2401:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1999:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2313:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1989:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2197:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2313:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.3368:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2339:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1842:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2092:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2988:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1885:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2393:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1964:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2814:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2466:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2170:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.3152:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2829:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2188:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1955:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2094:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2790:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2185:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2520:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2587:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2575:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1607:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1881:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2317:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2208:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2488:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.1801:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2317:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2774:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2341:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2603:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2106:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2436:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.2302:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.3006:  44%|████▎     | 175/401 [01:43<01:51,  2.02it/s]training loss: 0.3006:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2309:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2124:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2266:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2174:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2074:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1981:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2034:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2298:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2063:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2310:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2510:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2205:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2177:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2165:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1853:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2620:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1747:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2358:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1917:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2109:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1997:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2607:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2228:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1906:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2096:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2432:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1781:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1570:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2146:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1827:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2448:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2679:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2258:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2108:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2292:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2586:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2506:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2172:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2478:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1879:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2448:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2120:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2465:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2140:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2493:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1592:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2060:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2077:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2006:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2994:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.3092:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2149:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2975:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2197:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1894:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2223:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2273:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2744:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2285:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2062:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2114:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2447:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2124:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2478:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2217:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1939:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2362:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2225:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2640:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2381:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2521:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2515:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2423:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1891:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2831:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.3004:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2228:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.2664:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1869:  44%|████▍     | 176/401 [01:43<01:38,  2.29it/s]training loss: 0.1869:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1915:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2383:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2045:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2749:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2254:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2226:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2027:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2159:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2328:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2707:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1945:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1745:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2832:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2084:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2402:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1931:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2032:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2264:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2726:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1930:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1745:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2392:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2511:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2175:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1529:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2582:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1841:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2472:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2287:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2325:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2990:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2022:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1909:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2155:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2946:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2575:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2085:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2838:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2580:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1895:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2463:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1845:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1888:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2090:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2259:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2507:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2787:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2020:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1521:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2907:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2421:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2361:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1879:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2388:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2113:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2529:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2221:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2504:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2430:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1917:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2186:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2434:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1815:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2240:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2055:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2141:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2375:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2143:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1934:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2288:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2297:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2208:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1971:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2759:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2461:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1954:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1922:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.2080:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1266:  44%|████▍     | 177/401 [01:43<01:29,  2.52it/s]training loss: 0.1266:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1736:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1752:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2151:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1725:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2909:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2893:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1963:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1518:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2196:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2136:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1758:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2615:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2922:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1766:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2314:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1918:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1849:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2808:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2316:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2425:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2147:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2244:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2261:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1885:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2804:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2178:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1736:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1736:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2217:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2630:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2350:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2405:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.1697:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2183:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2345:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2335:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2554:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2162:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2266:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2214:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2740:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2319:  44%|████▍     | 178/401 [01:43<01:22,  2.70it/s]training loss: 0.2398:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2410:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2821:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2476:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2653:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2212:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2131:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2326:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1818:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2604:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1654:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2694:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1945:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2693:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1901:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1914:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2302:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2587:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2227:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2365:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2029:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1732:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2169:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1918:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2563:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2207:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2116:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2304:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1911:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2258:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1963:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2194:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1827:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2057:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.2087:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1788:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1489:  44%|████▍     | 178/401 [01:44<01:22,  2.70it/s]training loss: 0.1489:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2092:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2315:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2516:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2051:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1785:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2295:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2674:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2173:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2406:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2296:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2029:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1873:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2449:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2198:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2101:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2241:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1904:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2283:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2273:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2657:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2175:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.3062:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2215:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2034:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2171:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2037:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2430:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2988:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2053:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2418:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2630:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1765:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1812:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2130:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2221:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2502:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1771:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2031:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2254:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2035:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2482:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2008:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2718:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1972:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1831:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2068:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2465:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1954:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2203:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1995:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2076:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2329:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2586:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2383:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1904:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2216:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2049:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2390:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2188:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2074:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1944:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2367:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2382:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2349:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2162:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2659:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2503:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1777:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1895:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2117:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2153:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2248:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2042:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2782:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2377:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2367:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.1915:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2408:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2161:  45%|████▍     | 179/401 [01:44<01:32,  2.41it/s]training loss: 0.2161:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1824:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2645:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2455:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2262:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2402:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1715:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2427:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1807:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1988:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1601:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2023:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1596:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2407:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2080:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2271:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1839:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2157:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2174:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2629:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2096:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2092:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2182:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2356:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2294:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2158:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2517:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2052:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2404:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2192:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2545:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2339:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.3059:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2277:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2397:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2365:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2228:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1943:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2307:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2278:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2400:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2197:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2549:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2482:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2276:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2100:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2325:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2263:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2466:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2017:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2053:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2051:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2577:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2122:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2585:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2391:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2333:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1942:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2425:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2029:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2071:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1775:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2050:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2259:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2142:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2144:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2178:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2233:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2475:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2275:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2107:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2812:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2154:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2068:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2310:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2486:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2201:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2424:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.1637:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2749:  45%|████▍     | 180/401 [01:44<01:26,  2.57it/s]training loss: 0.2749:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1606:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2284:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2387:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2039:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2345:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2186:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2452:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1989:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2353:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2765:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2141:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2133:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2813:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2538:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1919:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2339:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2705:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1969:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2162:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2338:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1716:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2101:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2121:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2050:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2372:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2544:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1689:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2084:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2213:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2316:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2319:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2369:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2839:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1943:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2275:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.3029:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1995:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2277:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1864:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2146:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2054:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2436:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1675:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1910:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1604:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1758:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1996:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2098:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1916:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2554:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1764:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2434:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2188:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1882:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1991:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2169:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2013:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2609:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2079:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1665:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2844:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1677:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2520:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1902:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1883:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2143:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2317:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2416:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2142:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2325:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1848:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2158:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2084:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2516:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2478:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2552:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2505:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.2592:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1024:  45%|████▌     | 181/401 [01:47<04:08,  1.13s/it]training loss: 0.1024:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1953:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2736:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2633:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1779:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2152:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2146:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2294:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1884:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2466:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1794:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1780:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2368:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2245:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2073:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2567:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2919:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2878:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1566:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1817:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2171:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2575:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2335:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2117:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2362:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2000:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1906:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2902:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2126:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2275:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2141:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1992:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2260:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1415:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2420:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2369:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1949:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2168:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2361:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2030:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1852:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2775:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1877:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2123:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2427:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2569:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1379:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2228:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1889:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2357:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2444:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2805:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1964:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.1983:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2382:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2658:  45%|████▌     | 182/401 [01:47<03:13,  1.13it/s]training loss: 0.2136:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2352:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2177:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2084:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2295:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2353:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2101:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.1929:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2401:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.1992:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2245:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2322:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2624:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2727:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2371:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.3129:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.3054:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.1784:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2726:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2392:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2308:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.2641:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.1818:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.1713:  45%|████▌     | 182/401 [01:48<03:13,  1.13it/s]training loss: 0.1713:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1802:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2446:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2068:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2568:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2334:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2258:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1884:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1962:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1569:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2840:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2404:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2143:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2096:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2162:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2243:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2483:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2348:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.3271:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2629:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2042:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2845:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2652:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2332:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2816:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2211:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2122:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1916:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2146:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2052:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2874:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2018:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2798:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1582:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1872:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1969:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.3181:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1765:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2659:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2123:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2542:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2096:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2196:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1951:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1939:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1916:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1678:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2225:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2234:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1933:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2088:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2203:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2380:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2218:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2200:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1883:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2222:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2321:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1756:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2831:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1748:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1857:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2538:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2386:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1901:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1953:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1861:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2123:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1837:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2049:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2190:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1783:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1740:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.1875:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2016:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2225:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2051:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2756:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.2310:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.4362:  46%|████▌     | 183/401 [01:48<02:34,  1.41it/s]training loss: 0.4362:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2624:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2354:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2398:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2477:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2304:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2811:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2028:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2273:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2730:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1760:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2436:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2292:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2470:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1940:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2723:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1754:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2397:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1903:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2569:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2687:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1746:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1753:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2718:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2105:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1840:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2678:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2523:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2636:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2574:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2188:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2252:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2427:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1986:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2343:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2102:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2835:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1698:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2762:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1846:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2233:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2369:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2683:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1809:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2256:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2176:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2016:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2663:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2017:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2508:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1761:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1861:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2286:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1980:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2616:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1667:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2586:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2294:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2791:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2598:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2139:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1311:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2566:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2313:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2272:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2123:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1533:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1975:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2624:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2046:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2357:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1999:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1833:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1759:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2335:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1743:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2226:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1920:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.1771:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2449:  46%|████▌     | 184/401 [01:48<02:08,  1.69it/s]training loss: 0.2449:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2171:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2271:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2352:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2001:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1729:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2163:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1836:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2349:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2028:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2288:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2389:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2402:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2300:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2321:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2324:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2853:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2436:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2877:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2087:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1944:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2118:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2610:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.3295:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2136:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2105:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2597:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2080:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2130:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2485:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1666:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2386:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1987:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1962:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2611:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2719:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2060:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2389:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1907:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2281:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1790:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2712:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2263:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1566:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2586:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2102:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2151:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2339:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2203:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2858:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2143:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2625:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2214:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2003:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1496:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1553:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2465:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2043:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2546:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1743:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2215:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1756:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2007:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1842:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2573:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.1955:  46%|████▌     | 185/401 [01:48<01:49,  1.97it/s]training loss: 0.2121:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2743:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2767:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2576:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.1950:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.1917:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2004:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2819:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.1901:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2427:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2005:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.1750:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2622:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2754:  46%|████▌     | 185/401 [01:49<01:49,  1.97it/s]training loss: 0.2754:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2001:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2073:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2407:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2228:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1729:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1720:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2076:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2176:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2016:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2393:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2191:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2137:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1800:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2179:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2921:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2493:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2226:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1653:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2487:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2350:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2067:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1998:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2666:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2049:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1989:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2176:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2350:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1755:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2163:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2460:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2421:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2209:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1957:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2538:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.3132:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2223:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2507:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1861:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1899:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1721:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2199:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2622:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2217:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1964:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2321:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2828:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2104:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2392:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2150:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1803:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1872:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1870:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2218:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1983:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2072:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1756:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2535:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2408:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2371:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2138:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2344:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1922:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2115:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2539:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1749:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2975:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2409:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2642:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2020:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2442:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2059:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2120:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2030:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1674:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2059:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.2216:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1809:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1992:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1722:  46%|████▋     | 186/401 [01:49<01:37,  2.20it/s]training loss: 0.1722:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2292:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2200:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2242:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2269:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2753:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2255:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2032:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2373:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2735:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2199:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2609:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1758:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2391:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2554:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2351:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1999:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2914:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2217:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2282:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2818:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2573:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2077:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1896:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2714:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2123:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2620:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1993:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2004:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1610:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2139:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2563:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1999:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2221:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2523:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2180:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2828:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2259:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2063:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2017:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2138:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2413:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2415:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1557:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2066:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1926:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2057:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2405:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2449:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2551:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1645:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2142:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2058:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2168:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2774:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2232:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2298:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2355:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2465:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1931:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1957:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2578:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1759:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2388:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2602:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2288:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2081:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2014:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2383:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2351:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2054:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2053:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2813:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1934:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.3208:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2040:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1993:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.1421:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2227:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2592:  47%|████▋     | 187/401 [01:49<01:28,  2.43it/s]training loss: 0.2592:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2991:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1919:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2486:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1802:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1849:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2014:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2688:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2302:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1785:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1926:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1797:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2252:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2325:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2188:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1975:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1823:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2102:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1815:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1916:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2371:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2502:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2102:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.3297:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2674:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2409:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1938:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2197:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1780:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1427:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1960:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2164:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1949:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2293:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2130:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2435:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1919:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2278:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1705:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2012:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2296:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2277:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1744:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1853:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2329:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2372:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1854:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1911:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2372:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2048:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2782:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2265:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2698:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.3252:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2105:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2023:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2279:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1900:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2753:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2406:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2163:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2246:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2054:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2167:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1763:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2242:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2484:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2122:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2327:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2289:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2197:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2371:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2228:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2216:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1982:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2901:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2618:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.1930:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.2206:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.3340:  47%|████▋     | 188/401 [01:49<01:21,  2.63it/s]training loss: 0.3340:  47%|████▋     | 189/401 [01:49<01:16,  2.79it/s]training loss: 0.2522:  47%|████▋     | 189/401 [01:49<01:16,  2.79it/s]training loss: 0.2719:  47%|████▋     | 189/401 [01:49<01:16,  2.79it/s]training loss: 0.2704:  47%|████▋     | 189/401 [01:49<01:16,  2.79it/s]training loss: 0.2260:  47%|████▋     | 189/401 [01:49<01:16,  2.79it/s]training loss: 0.2055:  47%|████▋     | 189/401 [01:49<01:16,  2.79it/s]training loss: 0.2355:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2563:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1846:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2200:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2484:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1977:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1926:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2329:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1719:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2322:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2523:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2475:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2417:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1756:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1948:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2358:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2451:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1830:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2085:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2264:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1835:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1962:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2457:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2021:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2657:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1862:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2372:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1979:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2047:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2760:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2008:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2239:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2895:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2160:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1450:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1676:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2253:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.3282:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2006:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2782:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2048:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2185:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1628:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2101:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2190:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1900:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2134:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2373:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2134:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2228:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1611:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2052:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2297:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2304:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2415:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1868:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2347:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1947:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2126:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2286:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2116:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2253:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2129:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1931:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.3047:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2277:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2230:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1858:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2137:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2426:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2140:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.1939:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2063:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2417:  47%|████▋     | 189/401 [01:50<01:16,  2.79it/s]training loss: 0.2417:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2133:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1865:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1894:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2082:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1659:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1855:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2299:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2035:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2082:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2007:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2255:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2484:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1806:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2605:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2392:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2307:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2447:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2344:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2585:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1798:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2161:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2685:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1832:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2146:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1893:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1659:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1689:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2557:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2615:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1849:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1792:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2712:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2019:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2097:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1677:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1948:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2404:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2756:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2163:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2455:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2990:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1937:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1688:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2373:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1653:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2231:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1789:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2281:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2505:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2393:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2437:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2058:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2118:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2494:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2499:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2232:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2248:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1812:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2275:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1802:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1741:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2171:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2345:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2531:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2098:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1935:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2032:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2327:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2238:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2053:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1999:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.1491:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2359:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2669:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2094:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2464:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2232:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.3801:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2616:  47%|████▋     | 190/401 [01:50<01:12,  2.91it/s]training loss: 0.2616:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2032:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2094:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2700:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2102:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1726:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1911:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2310:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2773:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2327:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1649:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2254:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2248:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1740:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2937:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1872:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2353:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2183:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1751:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2022:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2033:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2432:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1976:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2513:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2091:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2302:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1944:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2793:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1746:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2213:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1960:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1840:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2392:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2744:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1671:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1966:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2563:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2395:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2044:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1950:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1857:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2043:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1791:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1984:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2016:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2603:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2052:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1843:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2090:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1718:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2307:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2886:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1617:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2153:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2109:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2744:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1924:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1980:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2199:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2799:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2319:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2156:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2005:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1488:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2356:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1871:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1696:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2300:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2452:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1992:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2224:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2441:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2378:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.3042:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2442:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1713:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2687:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2542:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.1914:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2490:  48%|████▊     | 191/401 [01:53<03:51,  1.10s/it]training loss: 0.2490:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2563:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2335:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1644:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2057:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1708:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2720:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1616:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2042:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1946:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2012:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2094:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2163:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2233:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1950:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2365:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2448:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2052:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2237:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1942:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2319:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2124:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2407:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1931:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1880:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1935:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2337:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2177:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2325:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1869:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2478:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2284:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1983:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2475:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1923:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2510:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2186:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2466:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1997:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1980:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2637:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2084:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2426:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2147:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2562:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1883:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1922:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1808:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2269:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1880:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1963:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1990:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1950:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2060:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1992:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2433:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1655:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2664:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2173:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2601:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1910:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2242:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1828:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.3315:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2713:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1988:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2698:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2651:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2231:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1803:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2302:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2494:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1893:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1682:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2112:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2279:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2159:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2098:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.2075:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1594:  48%|████▊     | 192/401 [01:53<03:01,  1.15it/s]training loss: 0.1594:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2344:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2824:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2296:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2170:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2676:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1842:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2008:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1911:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2154:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2262:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2841:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1961:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2017:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2409:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2250:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2148:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1920:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2141:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2765:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2016:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1705:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2202:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2129:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2752:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2046:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2236:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1897:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2513:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2920:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2146:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2796:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.3138:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1946:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1838:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2177:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2064:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2632:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2532:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2541:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2255:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2054:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2787:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2149:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1908:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2439:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1894:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1913:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2225:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.1986:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2040:  48%|████▊     | 193/401 [01:53<02:25,  1.43it/s]training loss: 0.2742:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2018:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2435:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2191:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2036:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2019:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2172:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2354:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2252:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2093:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2144:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2093:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2481:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2272:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2065:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2331:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2071:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2282:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2164:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2188:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2169:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2101:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.1982:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.1783:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2828:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.1209:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2272:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.2311:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.1990:  48%|████▊     | 193/401 [01:54<02:25,  1.43it/s]training loss: 0.1990:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2194:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2628:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1864:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2875:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2245:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1597:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2015:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1936:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2270:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2328:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2297:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.3088:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1819:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2154:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2201:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2009:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2084:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2627:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2021:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1579:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1641:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2068:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1782:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1861:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2589:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2503:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2141:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1743:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2023:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2095:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2228:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2398:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.3368:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2420:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1949:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1980:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2666:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2515:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1980:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2048:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2219:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2312:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2123:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2222:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2257:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1881:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2341:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2033:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1886:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2455:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2673:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2741:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1957:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1989:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2123:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2407:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2293:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2350:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2194:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2139:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1966:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2110:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2399:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1960:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2021:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1614:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1773:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1973:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2079:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2564:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2226:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2471:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2645:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2248:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2236:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2240:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2028:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.2782:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1153:  48%|████▊     | 194/401 [01:54<02:01,  1.70it/s]training loss: 0.1153:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2048:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1924:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2165:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1858:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1960:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2313:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2086:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2367:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2591:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1762:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2488:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1696:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2382:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2066:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2200:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2191:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1929:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2173:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2624:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2421:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2298:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2029:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2218:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2005:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2335:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2598:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2059:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2210:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2792:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2948:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1806:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1886:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2197:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2454:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2044:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1948:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2401:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1724:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2734:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2602:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2045:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2004:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2284:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2340:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2029:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2605:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2155:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1943:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1517:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2093:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2776:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2255:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2538:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2413:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2224:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1613:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1893:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2261:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2330:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2210:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1862:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1815:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2381:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2132:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2073:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2042:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2228:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2571:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1460:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2259:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2010:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1902:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2550:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2467:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2345:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1862:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2798:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.2123:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1075:  49%|████▊     | 195/401 [01:54<01:45,  1.95it/s]training loss: 0.1075:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2929:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.1659:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2166:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2365:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2029:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2414:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2079:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2166:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.1786:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2102:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2397:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2549:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2063:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2144:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2328:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2228:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2364:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2761:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2414:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2116:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.1742:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2378:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2187:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.3060:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2234:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2290:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2946:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.1766:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2234:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2121:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2701:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2177:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2406:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2093:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2126:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.1952:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2218:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2125:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2286:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2966:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.1665:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.1997:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2270:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2692:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2313:  49%|████▉     | 196/401 [01:54<01:36,  2.13it/s]training loss: 0.2327:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2415:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2235:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2380:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2083:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.1921:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2186:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.1903:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2255:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2564:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2878:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2284:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2135:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2467:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2158:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2054:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2117:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2480:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.1918:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2167:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.1932:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.3009:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2115:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.1858:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2388:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.1758:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.1785:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2355:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2162:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2252:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2346:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.1779:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2415:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2745:  49%|████▉     | 196/401 [01:55<01:36,  2.13it/s]training loss: 0.2745:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2595:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1417:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2460:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2893:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.3000:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1965:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2714:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2486:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2070:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2520:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2225:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1634:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2125:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2203:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1943:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2271:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2584:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1877:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1859:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2069:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2289:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1704:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2327:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2043:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1931:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1535:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2545:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1811:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1890:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2210:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1518:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2150:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2058:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2831:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2184:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2213:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2531:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2692:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1704:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2731:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2031:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1988:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2303:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2663:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1773:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2331:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2383:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2332:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2003:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2497:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2289:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1949:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2715:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1789:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2181:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1921:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2310:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1826:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2702:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2309:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2401:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1917:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2273:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1904:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1875:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1980:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2202:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1889:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2289:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1964:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2385:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2121:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2996:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2145:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1766:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2004:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1607:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.1720:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2359:  49%|████▉     | 197/401 [01:55<01:26,  2.37it/s]training loss: 0.2359:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2328:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2543:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1985:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2289:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1866:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2166:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2039:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2079:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2352:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2340:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1988:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1765:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2209:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1891:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1943:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2216:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2802:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2321:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2277:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2092:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2721:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1961:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2483:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2069:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2296:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2478:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1819:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2280:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2452:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2539:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1949:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2247:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2707:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2646:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1946:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2176:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2247:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2143:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2235:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2639:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1930:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2104:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2247:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2822:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2190:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2282:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2342:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2218:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2345:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1908:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2045:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2646:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2760:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1817:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1658:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2467:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2603:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2332:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2135:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2117:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1973:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1861:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2701:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1805:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2345:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1699:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1862:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2193:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2083:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1795:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2545:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2199:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.1960:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2687:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2249:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2013:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2240:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.2337:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.0691:  49%|████▉     | 198/401 [01:55<01:19,  2.57it/s]training loss: 0.0691:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2437:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2144:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2586:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2180:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2012:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2265:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1579:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2836:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2880:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1694:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1978:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2536:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2678:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2799:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2252:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2370:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.3052:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2755:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2345:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2288:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2355:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2340:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1783:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2198:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2181:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2283:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1811:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.3107:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2543:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1980:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1933:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2315:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2144:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2659:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1954:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2118:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2202:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2056:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1883:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1883:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1729:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2133:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1867:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2101:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2562:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2077:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2311:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1727:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2345:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2162:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2390:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2835:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.1977:  50%|████▉     | 199/401 [01:55<01:14,  2.72it/s]training loss: 0.2497:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2510:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1817:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2320:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2304:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1661:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1728:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1481:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1711:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2439:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2012:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1963:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2457:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1954:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1898:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1709:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1886:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1513:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2689:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2764:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1820:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1709:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1309:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2063:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.2915:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1929:  50%|████▉     | 199/401 [01:56<01:14,  2.72it/s]training loss: 0.1929:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2294:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2049:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1821:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2320:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2053:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1941:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1816:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1548:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1792:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2034:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1638:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2647:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1976:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2291:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2856:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2323:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2067:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1311:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1573:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1616:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2936:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2310:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2014:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2042:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2365:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1897:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2512:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2410:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1971:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2104:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2003:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2685:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2288:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2327:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2437:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2206:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2328:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2143:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2014:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2309:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2873:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2381:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2019:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2331:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2188:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2533:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2375:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2036:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2647:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2738:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2667:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1791:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2149:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1683:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2293:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2369:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2234:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1913:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2257:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2580:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2608:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2007:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2885:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1986:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2185:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2172:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.1708:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2532:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2204:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2038:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2140:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2132:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2593:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2294:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2196:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2289:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2049:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2397:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2489:  50%|████▉     | 200/401 [01:56<01:12,  2.78it/s]training loss: 0.2489:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1871:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2766:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2074:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2237:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1783:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1893:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1730:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2525:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1836:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2236:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2217:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2543:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2730:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2096:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1979:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2317:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2222:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2335:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2099:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2425:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2471:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2627:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2948:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1985:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2704:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1980:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2278:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2635:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1766:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2202:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2142:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1876:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2215:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2383:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2170:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2071:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1897:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2061:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2050:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1859:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2046:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2431:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1754:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1745:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1997:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2402:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1721:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1703:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1711:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2202:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2475:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2404:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2182:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2307:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2245:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2010:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1991:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1869:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2557:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2158:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2321:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1630:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2477:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1976:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1999:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2080:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1890:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2003:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2236:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.3337:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1821:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1972:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2845:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1989:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2003:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1608:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1820:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.2212:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1913:  50%|█████     | 201/401 [01:58<03:18,  1.01it/s]training loss: 0.1913:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2144:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.1557:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2310:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2525:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.1975:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2013:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2730:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.1582:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2223:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.1508:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2463:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2368:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2129:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2840:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2257:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2380:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2888:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2045:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.3233:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2182:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.2115:  50%|█████     | 202/401 [01:58<02:37,  1.27it/s]training loss: 0.1846:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2162:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1858:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2749:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1975:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2386:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2652:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2159:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2122:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2468:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2025:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2367:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2413:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2464:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1813:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1884:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1861:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2866:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2232:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1963:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2262:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1987:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1970:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2350:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2382:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2131:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2106:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1990:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1813:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1870:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1696:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2475:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2272:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1578:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2327:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1691:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2126:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2067:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2314:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2448:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2471:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2101:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2830:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2878:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1691:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2060:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2237:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1859:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2011:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1837:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2046:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2117:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2034:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1785:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.2602:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1970:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.1930:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.3802:  50%|█████     | 202/401 [01:59<02:37,  1.27it/s]training loss: 0.3802:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2421:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2492:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2010:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2330:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1958:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1864:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2540:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2029:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1696:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2100:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2311:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1787:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2068:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2839:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2286:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1635:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1480:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1948:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2451:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1780:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2035:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1676:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1854:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2451:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2297:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2189:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1828:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1982:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2041:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2312:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2213:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2153:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2180:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1985:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2331:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.3057:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1660:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1712:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2133:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2249:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1693:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2325:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1909:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2704:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2586:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2068:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2049:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2527:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2519:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2731:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2577:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2661:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2091:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2627:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2014:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2052:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2357:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1891:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2006:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1935:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1886:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.3408:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2433:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2195:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2683:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2467:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1615:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2246:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2012:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2264:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2458:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2134:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2566:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1952:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2580:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2239:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2446:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.2195:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1644:  51%|█████     | 203/401 [01:59<02:12,  1.49it/s]training loss: 0.1644:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1969:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2065:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2191:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2062:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2235:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2180:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1597:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2253:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1698:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2479:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2301:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2177:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2385:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1781:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2398:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1912:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1812:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2496:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1845:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2153:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1750:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2808:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2275:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2422:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1789:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2282:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2297:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2343:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1842:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1822:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2672:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2095:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2042:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2286:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1827:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2125:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1706:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2622:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1778:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2086:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.3017:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2915:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.3317:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2148:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2035:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2775:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2271:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2714:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2174:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2343:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2082:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2388:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2433:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2256:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1936:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.3147:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2199:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1960:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2815:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2228:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2372:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2519:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2569:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2140:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2565:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2116:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1811:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2843:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2024:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2366:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2292:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2146:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2269:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2229:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1972:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2278:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.2180:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1547:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1477:  51%|█████     | 204/401 [01:59<01:51,  1.77it/s]training loss: 0.1477:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2040:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2396:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.1968:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.1986:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2345:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2082:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2578:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2319:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2247:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2057:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2729:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2576:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2102:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2431:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2154:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.3003:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2470:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2686:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2562:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.1746:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2349:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.1916:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2058:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2036:  51%|█████     | 205/401 [01:59<01:35,  2.05it/s]training loss: 0.2189:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1895:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2433:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2394:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.3019:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2527:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1882:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1785:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2174:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2705:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1719:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2687:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2010:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1964:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2147:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2332:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2379:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1828:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2092:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1652:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2101:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2139:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1402:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2475:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1861:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2136:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2319:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1959:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2668:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2207:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2424:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1975:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2319:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1850:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2722:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1680:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2402:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2309:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1658:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2163:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1815:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2034:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2371:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2294:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2114:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2450:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2158:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2076:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2158:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1724:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2763:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2504:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.1962:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2220:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2625:  51%|█████     | 205/401 [02:00<01:35,  2.05it/s]training loss: 0.2625:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2501:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1949:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2088:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2280:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2208:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2479:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2620:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1805:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2392:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1605:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2864:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1996:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1833:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1499:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2382:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2830:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2285:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2105:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1878:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2007:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2060:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2057:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2040:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2090:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2426:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2597:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2414:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2111:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2635:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1870:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2035:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2367:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2582:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2278:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2794:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2106:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2318:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1998:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1860:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2384:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2549:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2475:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1842:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2727:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1843:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2503:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2334:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2170:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2320:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2403:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2304:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1812:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2682:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2207:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2182:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1824:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2136:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2115:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2561:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1680:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1768:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2827:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1974:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2277:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2465:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.1802:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2244:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2272:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2110:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2350:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2538:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2122:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2285:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2109:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2503:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2323:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2688:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2527:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2235:  51%|█████▏    | 206/401 [02:00<01:24,  2.31it/s]training loss: 0.2235:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2360:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2188:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2039:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2058:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2354:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2220:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1897:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2477:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2560:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2257:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2091:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1634:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2380:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1674:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1946:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2258:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1882:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2538:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1879:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2084:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1934:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1837:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1928:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2393:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2163:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2510:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2358:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1971:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2123:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1597:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2050:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1826:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2249:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2079:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1669:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2486:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2651:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1756:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1967:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1565:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1673:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2087:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2284:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2503:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2252:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1927:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2836:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2149:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2182:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1794:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2182:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2352:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2611:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2513:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2334:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2099:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1670:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2316:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2057:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2207:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2138:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2078:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1850:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1934:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2280:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2628:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1895:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1971:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1962:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2256:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2516:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1698:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2215:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2094:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1852:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2943:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2216:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.2131:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1973:  52%|█████▏    | 207/401 [02:00<01:17,  2.51it/s]training loss: 0.1973:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2168:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2138:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2253:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2736:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2180:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2152:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1691:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2438:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2470:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2300:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.3067:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1662:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2272:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2870:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2002:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2422:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1559:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1892:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1724:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2132:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1944:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2659:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1857:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1714:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2382:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2045:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1842:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1537:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2342:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2127:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2366:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1951:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2395:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2075:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2170:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2172:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2598:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.1852:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2378:  52%|█████▏    | 208/401 [02:00<01:12,  2.68it/s]training loss: 0.2821:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2077:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2056:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2158:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2442:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1825:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2129:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2071:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1802:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2451:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1508:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1873:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2918:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1970:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2239:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1791:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2098:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.3090:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2152:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2093:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2433:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.3060:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1903:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2194:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2455:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2182:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2980:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2863:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2547:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1577:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2192:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1403:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2355:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1734:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2456:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1763:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1843:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.2047:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1775:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1054:  52%|█████▏    | 208/401 [02:01<01:12,  2.68it/s]training loss: 0.1054:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1977:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2206:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2834:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1493:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2427:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2435:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1935:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2388:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2347:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1763:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2807:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2092:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2527:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1573:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2020:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1925:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2430:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1955:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2004:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2485:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2466:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2477:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2300:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2110:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2074:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.3811:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2356:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2088:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1582:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2285:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2611:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2305:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2295:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1706:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2164:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1951:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1722:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1881:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2746:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2143:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1741:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2539:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2897:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2319:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2090:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2002:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1767:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2304:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2341:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2260:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2438:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2023:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2109:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1158:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1747:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2403:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2452:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2102:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2228:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2390:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2585:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2501:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1860:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2711:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1808:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1849:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2137:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1601:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2336:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2309:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2186:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2241:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1952:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.1781:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2156:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2657:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2054:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2133:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2077:  52%|█████▏    | 209/401 [02:01<01:08,  2.82it/s]training loss: 0.2077:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2222:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2065:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2413:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1792:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2068:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1582:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2133:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2044:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1835:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2122:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1264:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2119:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2716:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2812:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.3012:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2011:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1672:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2192:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2132:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2015:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1754:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2496:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1780:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2036:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1853:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1992:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2044:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.3605:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1923:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2052:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2027:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2104:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2125:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2110:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2746:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2383:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1915:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2850:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2203:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2636:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2309:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2268:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1939:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2255:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1855:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1927:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2333:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2868:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2311:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2072:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2582:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2002:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2100:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2157:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2728:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2581:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2832:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2191:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1853:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2043:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2208:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2431:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2019:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1783:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2247:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2392:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1944:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2323:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2181:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2107:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1933:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2410:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2311:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.1794:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2330:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2089:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2710:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2624:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2427:  52%|█████▏    | 210/401 [02:01<01:05,  2.94it/s]training loss: 0.2427:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2120:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2104:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2293:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2379:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1774:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1981:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1589:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2137:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2485:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2139:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1961:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1942:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1932:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2871:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1793:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1786:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2509:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1803:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1983:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2519:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1674:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2345:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2188:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2581:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2155:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2222:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2309:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2140:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2227:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2440:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2820:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2602:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2432:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2788:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1916:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1730:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2181:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2163:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1997:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2502:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2157:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1914:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1775:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2043:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2104:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2543:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1906:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2231:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2182:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2317:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2083:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2971:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1798:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2711:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2275:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2548:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2020:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1615:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2585:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2350:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2165:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2318:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2259:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2405:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1562:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2291:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2337:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2409:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2363:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2675:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1985:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1918:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2107:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2595:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.1844:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2013:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2389:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2558:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2390:  53%|█████▎    | 211/401 [02:04<03:12,  1.01s/it]training loss: 0.2390:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2115:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1952:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1773:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2530:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2189:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1774:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2348:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2206:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2423:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2156:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1465:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2918:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2014:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1910:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1980:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2231:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2516:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1889:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1697:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2142:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2203:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2521:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2310:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2003:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2183:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2427:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2349:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2055:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2185:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2052:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1787:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2196:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1993:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2209:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2476:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2058:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2255:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2373:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1869:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2348:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1451:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2403:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.3265:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2026:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2096:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2657:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2296:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1866:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2382:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2159:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2299:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1607:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2236:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2355:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2321:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2196:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1911:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1739:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2635:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2156:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2300:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2485:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1887:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2008:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2141:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2347:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1993:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2340:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2336:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2012:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1641:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2449:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2701:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2149:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1523:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1921:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2435:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.1840:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2436:  53%|█████▎    | 212/401 [02:04<02:31,  1.24it/s]training loss: 0.2436:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2135:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2012:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1936:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2166:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2194:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1921:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1654:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2059:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2106:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2175:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2378:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2293:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1812:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1696:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2275:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2584:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1941:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2277:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.3171:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2058:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1834:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1719:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2098:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2269:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2220:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2132:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2032:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2260:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1755:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2525:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2078:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1991:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2901:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1571:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1591:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2188:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2293:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2057:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1611:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2192:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2036:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1380:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2078:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2391:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2393:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2202:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2200:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2384:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2669:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2260:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1986:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2022:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1691:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2095:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1842:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1972:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1373:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2290:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2375:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1674:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2438:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2306:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2480:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1992:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2405:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2612:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2754:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2276:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2623:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1645:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2188:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2051:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2167:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2272:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.1614:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.3113:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.2159:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.3063:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.3408:  53%|█████▎    | 213/401 [02:04<02:03,  1.53it/s]training loss: 0.3408:  53%|█████▎    | 214/401 [02:04<01:42,  1.82it/s]training loss: 0.2098:  53%|█████▎    | 214/401 [02:04<01:42,  1.82it/s]training loss: 0.2594:  53%|█████▎    | 214/401 [02:04<01:42,  1.82it/s]training loss: 0.1954:  53%|█████▎    | 214/401 [02:04<01:42,  1.82it/s]training loss: 0.2129:  53%|█████▎    | 214/401 [02:04<01:42,  1.82it/s]training loss: 0.2344:  53%|█████▎    | 214/401 [02:04<01:42,  1.82it/s]training loss: 0.1827:  53%|█████▎    | 214/401 [02:04<01:42,  1.82it/s]training loss: 0.2633:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2342:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2241:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2497:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2151:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2106:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2406:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1717:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2360:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1555:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2059:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1670:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2815:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2195:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1752:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2631:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1901:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2335:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2498:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2081:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2402:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2132:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1996:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1925:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1809:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1846:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2327:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2197:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2203:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2211:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1608:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2164:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2516:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2096:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2015:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2117:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2058:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2303:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2223:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2368:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2315:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2376:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2459:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2239:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2301:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2534:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2653:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2475:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2656:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2710:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1890:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1681:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1723:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2202:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2017:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2139:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1834:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2064:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2146:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2146:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2363:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2010:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1843:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2258:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2335:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2061:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1654:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2305:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1789:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2261:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.1931:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.2370:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.4758:  53%|█████▎    | 214/401 [02:05<01:42,  1.82it/s]training loss: 0.4758:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2182:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2430:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1650:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1947:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2366:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2476:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2192:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1840:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2277:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2124:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2134:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2205:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1777:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2153:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2334:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2072:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2339:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1759:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2754:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2181:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2098:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2024:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2179:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2259:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2798:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2155:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2618:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1953:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2072:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2337:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2223:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2038:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1557:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1833:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1389:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2183:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2573:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2529:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2172:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2423:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2073:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2155:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2660:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2120:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2556:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2539:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1959:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2246:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2207:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2632:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2197:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2616:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2581:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1954:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1814:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2261:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2710:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2177:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2193:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2487:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1779:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2843:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2219:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1868:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2266:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1862:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2007:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2666:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2502:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2080:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2093:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2279:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2317:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2473:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2263:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2740:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2255:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.2339:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1742:  54%|█████▎    | 215/401 [02:05<01:29,  2.09it/s]training loss: 0.1742:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2262:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2072:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2294:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1764:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2168:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2023:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1714:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2034:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1678:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2340:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2758:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1882:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1261:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2137:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1644:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2543:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2686:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2049:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2256:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2447:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2359:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2322:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1747:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2558:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2449:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1894:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2563:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2411:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2657:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2110:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2873:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1848:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2242:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2396:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1859:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2047:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1979:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2116:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2220:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1634:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2269:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2032:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2011:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2490:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1794:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2107:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2550:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2051:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2059:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2020:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2357:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2691:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1827:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2504:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1900:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.1950:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2254:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2353:  54%|█████▍    | 216/401 [02:05<01:27,  2.11it/s]training loss: 0.2327:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2510:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1965:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1977:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2249:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2554:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2307:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1835:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2859:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1976:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2099:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1962:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2020:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2632:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1981:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2203:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1732:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2394:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.2418:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1832:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1131:  54%|█████▍    | 216/401 [02:06<01:27,  2.11it/s]training loss: 0.1131:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1816:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2192:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2695:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2164:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2173:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2683:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2530:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2408:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2068:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2035:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2414:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2513:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2485:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1959:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2043:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2305:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2382:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2096:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1888:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2246:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2398:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2545:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1671:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2303:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2008:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2609:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2347:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2493:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2559:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2109:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2346:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1990:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2870:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2002:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2067:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1437:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2506:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2100:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2394:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1973:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1756:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2096:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1630:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1887:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1806:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1859:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2238:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2041:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1570:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2601:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2172:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2238:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2124:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2053:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2025:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2426:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2573:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1671:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2141:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1847:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2526:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2768:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2190:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1820:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2308:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2135:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2682:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2547:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2130:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2428:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1424:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2555:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2091:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1823:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2391:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1928:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2169:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.2634:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1479:  54%|█████▍    | 217/401 [02:06<01:19,  2.32it/s]training loss: 0.1479:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2167:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1854:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2152:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2399:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2360:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2810:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2319:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1942:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1764:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2512:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2514:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2351:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1956:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2623:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2732:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1717:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1742:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2329:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2281:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2220:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1493:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2126:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1771:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2550:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1953:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2273:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2536:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1774:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2132:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2011:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2226:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1856:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1590:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2292:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2153:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2369:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2501:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2051:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2791:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1814:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1781:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2119:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2102:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1478:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2164:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2180:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1935:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2087:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2267:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1881:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2136:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2673:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1954:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2352:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1947:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1994:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2048:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2586:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2010:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2544:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2842:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2337:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2065:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1713:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.1596:  54%|█████▍    | 218/401 [02:06<01:15,  2.42it/s]training loss: 0.2291:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2281:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2596:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2512:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.1985:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2113:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2711:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.1834:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.1500:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2102:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2463:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2954:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.2020:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.1668:  54%|█████▍    | 218/401 [02:07<01:15,  2.42it/s]training loss: 0.1668:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2098:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2316:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2159:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2065:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2003:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2582:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2417:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2122:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2140:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2266:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2461:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1886:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2300:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2491:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2678:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2345:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2083:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1936:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1852:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2437:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2071:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2493:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2556:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2313:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2699:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2772:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2210:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2421:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2152:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2541:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2062:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1960:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1547:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1566:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2340:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2375:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1913:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1974:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1814:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2442:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2570:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2447:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2381:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2055:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2416:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.3092:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2202:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2029:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2169:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.3142:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2005:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2063:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2698:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2767:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2023:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2152:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2086:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2148:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1824:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2132:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2669:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2268:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2425:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2854:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2069:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.3044:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1975:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2307:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1535:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2419:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1810:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1843:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2052:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2303:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2135:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2146:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1939:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.2369:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1939:  55%|█████▍    | 219/401 [02:07<01:28,  2.05it/s]training loss: 0.1939:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2692:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2624:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1740:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1363:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1958:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1913:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2625:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2627:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2318:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1823:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2537:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1998:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2291:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2441:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2831:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1957:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2013:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1962:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1979:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1827:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2008:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.1754:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2049:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2404:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2181:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2422:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2329:  55%|█████▍    | 220/401 [02:07<01:30,  1.99it/s]training loss: 0.2569:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2090:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1620:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2361:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2203:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1634:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2447:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2943:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2152:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2086:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2119:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1680:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2565:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2463:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2323:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1941:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1768:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2127:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1936:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2553:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1932:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2390:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2235:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2282:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2172:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2550:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2536:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2888:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2239:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2327:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2263:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1570:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2095:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2251:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1578:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2332:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2027:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1648:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1817:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1850:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2500:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1869:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2587:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2435:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2026:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2039:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2140:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.2606:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1940:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1683:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1955:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1821:  55%|█████▍    | 220/401 [02:08<01:30,  1.99it/s]training loss: 0.1821:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2203:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1943:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2702:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2110:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2420:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2078:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2068:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2645:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2048:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2205:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.3247:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2108:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2047:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1772:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1645:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1797:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1961:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2791:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1700:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2494:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1863:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2111:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2124:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2423:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1749:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1885:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2211:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2047:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1527:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2048:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1760:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2394:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2198:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1603:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2137:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2024:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2618:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2126:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2321:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2330:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1772:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1826:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1976:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1755:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2165:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1771:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2545:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2078:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.2142:  55%|█████▌    | 221/401 [02:10<03:35,  1.20s/it]training loss: 0.1968:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2473:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1999:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1872:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2206:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1998:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1920:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2484:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2433:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1854:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2985:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2402:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1900:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2406:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2157:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2521:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2336:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2052:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2636:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2285:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2413:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2355:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1765:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2322:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2041:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1828:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1689:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2447:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.2385:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1250:  55%|█████▌    | 221/401 [02:11<03:35,  1.20s/it]training loss: 0.1250:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2908:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2431:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2215:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1699:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2237:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2460:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1641:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2584:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2662:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2401:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2241:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1934:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2025:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2088:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2351:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2518:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2654:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1671:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2108:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1557:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1909:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1575:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2161:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2558:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1944:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2979:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2344:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2144:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2703:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1565:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2243:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1947:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2053:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2391:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2456:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1858:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2550:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1803:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2578:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1908:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2225:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1797:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1845:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2121:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2017:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2196:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2484:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1891:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2602:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1941:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2308:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2128:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2269:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2228:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2454:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1521:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1439:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1462:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2647:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2231:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2659:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2059:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2083:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1894:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2984:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1796:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2723:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2170:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2224:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.1989:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2414:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2077:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2307:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2097:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2135:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2166:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2291:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2114:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2413:  55%|█████▌    | 222/401 [02:11<03:14,  1.09s/it]training loss: 0.2413:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2019:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2478:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1723:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2367:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2171:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1789:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1776:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2332:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1864:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1672:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1758:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1824:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2078:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2258:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2789:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1957:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2252:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1894:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1808:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2790:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2648:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2110:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2544:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2271:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1910:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2072:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2209:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2331:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2589:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2200:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2321:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1996:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2229:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1980:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2698:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2260:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1623:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2513:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2275:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2335:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2698:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1839:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.2390:  56%|█████▌    | 223/401 [02:11<02:40,  1.11it/s]training loss: 0.1494:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2321:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2004:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2720:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2325:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2766:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1794:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2111:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2569:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1754:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2220:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2087:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1535:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1959:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1788:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1886:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2321:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2166:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1944:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1549:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1975:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1789:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2764:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2428:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2216:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2019:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2228:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2125:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1558:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1755:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2149:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.1870:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2249:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2269:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.2881:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.3154:  56%|█████▌    | 223/401 [02:12<02:40,  1.11it/s]training loss: 0.3154:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2275:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2163:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1996:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2190:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2106:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2227:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1813:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1699:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1852:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2663:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2075:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2130:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2297:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2347:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2572:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2178:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2497:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2533:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2498:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1928:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2186:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2531:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2394:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2114:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1792:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2444:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1965:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1679:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2509:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2415:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1604:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2654:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2837:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1883:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1830:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2383:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2253:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2470:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2138:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2398:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1875:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1627:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1831:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.3239:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2249:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.3000:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2367:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2173:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2596:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2120:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2300:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2356:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2198:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2715:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2620:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2466:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1865:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1801:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2909:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1626:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2974:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2358:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2716:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2094:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2211:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2567:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1804:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2164:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1953:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2045:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2248:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2804:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1998:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2281:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2585:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2041:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2522:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.2150:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1225:  56%|█████▌    | 224/401 [02:12<02:11,  1.35it/s]training loss: 0.1225:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1979:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2728:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.3264:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2116:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1429:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2511:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2231:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2122:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1754:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2475:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2079:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2275:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1759:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2105:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2110:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1660:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2256:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1849:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1838:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2409:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2290:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2358:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2523:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1957:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2224:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1937:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1956:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2401:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2344:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1648:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1963:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2714:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2414:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2336:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1908:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2154:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2306:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1881:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1844:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1903:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1696:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1954:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1668:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2273:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1548:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2323:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2188:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2375:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2166:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2536:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2049:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1700:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2241:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2350:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2312:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2532:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2556:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2206:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1941:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2255:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2370:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2881:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2335:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2075:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2320:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2139:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2437:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2560:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2033:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2395:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2041:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2569:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.1580:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2148:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2081:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2063:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2034:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.2134:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.3513:  56%|█████▌    | 225/401 [02:12<01:48,  1.63it/s]training loss: 0.3513:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1722:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2028:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.3244:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1756:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1735:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2356:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2039:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2194:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2612:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2044:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2120:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2141:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2186:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2193:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2526:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2013:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1946:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1872:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2534:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2026:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2092:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2319:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2286:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1881:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2228:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1326:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2579:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2234:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1887:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1300:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1951:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2212:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2382:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2216:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2530:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1733:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1646:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1719:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1850:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1918:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2559:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2389:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2620:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2140:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1891:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.1961:  56%|█████▋    | 226/401 [02:12<01:33,  1.87it/s]training loss: 0.2834:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2355:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1867:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2607:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1925:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2124:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2727:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1712:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2091:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2013:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1634:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2333:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2034:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1974:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1665:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2164:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2355:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1653:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1643:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1908:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1854:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2456:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1954:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2050:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2979:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1736:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1849:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2395:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2322:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.2103:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1735:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.1850:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.0809:  56%|█████▋    | 226/401 [02:13<01:33,  1.87it/s]training loss: 0.0809:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2322:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1721:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2303:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2227:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2291:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2367:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1952:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2450:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2116:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1952:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2635:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1838:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2278:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2374:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2261:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1985:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2004:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2191:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2364:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1575:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1620:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1604:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2509:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2534:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1778:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1990:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2248:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2494:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2070:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1991:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1687:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2335:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1916:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2751:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2228:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1839:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2543:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2054:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2140:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1687:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2321:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2019:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1810:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1792:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1787:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2307:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1984:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2089:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1716:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2953:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1662:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2253:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2217:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1907:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1953:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1951:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2687:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2298:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2337:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2296:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2526:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2482:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2189:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2023:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1779:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1929:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2205:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2436:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1663:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1774:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2474:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1974:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2105:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2752:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1578:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2201:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.1765:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2005:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2532:  57%|█████▋    | 227/401 [02:13<01:21,  2.12it/s]training loss: 0.2532:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2366:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2854:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2373:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2482:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2563:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2152:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1377:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2433:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2455:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1671:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1995:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2601:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1966:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2677:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2405:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1941:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2180:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2063:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2430:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2057:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2427:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1921:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2353:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1852:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1646:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2823:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1991:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1867:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2464:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1987:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2437:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2082:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2122:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2714:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2094:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2367:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1889:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2361:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2200:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1939:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1376:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1933:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2402:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2394:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2454:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1651:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2596:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1473:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1649:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1891:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2200:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2128:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2529:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2013:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2406:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2236:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2027:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2095:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1552:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2533:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2566:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1343:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2345:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1609:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2186:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2196:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2131:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1979:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2347:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1936:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2042:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1456:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2286:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1544:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1870:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.1845:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.3159:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.2182:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.3790:  57%|█████▋    | 228/401 [02:13<01:15,  2.28it/s]training loss: 0.3790:  57%|█████▋    | 229/401 [02:13<01:17,  2.23it/s]training loss: 0.2708:  57%|█████▋    | 229/401 [02:13<01:17,  2.23it/s]training loss: 0.2017:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1819:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2044:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2066:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2133:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1685:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1937:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1640:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2326:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2034:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1942:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2270:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2428:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1546:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2102:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2295:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1698:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2220:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1943:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2011:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2083:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2517:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2042:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2272:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1934:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1705:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2461:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2030:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2091:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2897:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2129:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2408:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1997:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1834:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2311:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1524:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2263:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2353:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1807:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2046:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1866:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2434:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2732:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2883:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1770:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2507:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2276:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2041:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2539:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1796:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2162:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2282:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2153:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2456:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2007:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1663:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2136:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2392:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2355:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2579:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2149:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2359:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1952:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1665:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1821:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1972:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2421:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1928:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2233:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2243:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2211:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2848:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.3004:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2403:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2799:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2084:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.2093:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1918:  57%|█████▋    | 229/401 [02:14<01:17,  2.23it/s]training loss: 0.1918:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1857:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2053:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1804:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1826:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2706:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1937:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2007:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2330:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2101:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2501:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1866:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2236:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2528:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2000:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2121:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2409:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2431:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2434:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1914:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2149:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2524:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2035:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2681:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1795:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2014:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2170:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1679:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2626:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2569:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1880:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2442:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2104:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1917:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2471:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2155:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1801:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2110:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2489:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1690:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1931:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2182:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1997:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2462:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2354:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2098:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2278:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1716:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2299:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1748:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2702:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2046:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1603:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2023:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2039:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1930:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2517:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1805:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2055:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2226:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1620:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1827:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1928:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1925:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2094:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2326:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1981:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2912:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1696:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1854:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1745:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2102:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2616:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2109:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1901:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2857:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2391:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1864:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.2049:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1807:  57%|█████▋    | 230/401 [02:14<01:16,  2.24it/s]training loss: 0.1807:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2585:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1659:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2012:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2026:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2147:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1881:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1729:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1897:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1968:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2759:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1708:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1909:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2151:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2487:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2001:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1935:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2179:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2062:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1900:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2300:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2645:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1855:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1946:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2311:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2603:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2684:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2084:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1746:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2218:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1813:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1903:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1829:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2351:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2683:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1923:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1683:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2483:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1868:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2281:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2160:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1935:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1998:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.3012:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2163:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2363:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2359:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2114:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2648:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2280:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2128:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2363:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2634:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2463:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2149:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2174:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2101:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2382:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1978:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1832:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1822:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2391:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2239:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2049:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2479:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2337:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2063:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2280:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1838:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2736:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2153:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2306:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2652:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2236:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1570:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2240:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.2508:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1771:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1897:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1518:  58%|█████▊    | 231/401 [02:17<03:13,  1.14s/it]training loss: 0.1518:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1999:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1959:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1551:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1861:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1878:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1765:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2375:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2902:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2184:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2670:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2369:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2117:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1678:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1731:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1678:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2051:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2192:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2351:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2396:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2474:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2325:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2079:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2207:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2481:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2354:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2484:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1973:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2050:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2199:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1782:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2170:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1961:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2549:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1840:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2543:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1560:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2258:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1751:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2275:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1975:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1526:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1460:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2406:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1930:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2555:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2199:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2186:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1783:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1918:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2211:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.3246:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1845:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1965:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1974:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2070:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2165:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2383:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2535:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2467:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2163:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2802:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1701:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2386:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2826:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1816:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2113:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1826:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1837:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2262:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2438:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1999:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2170:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2328:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2465:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2106:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1819:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.2409:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.1898:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.3661:  58%|█████▊    | 232/401 [02:17<02:30,  1.12it/s]training loss: 0.3661:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1920:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1983:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2000:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2253:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2537:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1990:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1988:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1865:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1703:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2283:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2652:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1905:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.3201:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2101:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2383:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2137:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2148:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1705:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2110:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2917:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2216:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1244:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2428:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1994:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2427:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2340:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1850:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2091:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1813:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2839:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2321:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2359:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2415:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1925:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2011:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2026:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2788:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1744:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2423:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2275:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1893:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2105:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2390:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1726:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2575:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1715:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2788:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2479:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2454:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1549:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.2197:  58%|█████▊    | 233/401 [02:17<02:00,  1.39it/s]training loss: 0.1950:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2082:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2476:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2130:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2122:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2277:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2460:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2609:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.1995:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2198:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2177:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2655:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.1837:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.1863:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2121:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2369:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2399:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2155:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2482:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2693:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2048:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2169:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.1638:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2043:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2707:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.1379:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2166:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2688:  58%|█████▊    | 233/401 [02:18<02:00,  1.39it/s]training loss: 0.2688:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2178:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1907:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2500:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2409:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2168:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2303:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2105:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1711:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2601:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2199:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2076:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2768:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1864:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2799:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2284:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1900:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1990:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2117:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2087:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1958:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1814:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2476:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2055:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1909:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2186:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2871:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1292:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1578:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2134:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2578:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2721:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1831:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2252:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2369:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1986:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1656:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1968:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2107:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2143:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1624:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2154:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2788:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2327:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1888:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2015:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2110:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2235:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1929:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2352:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2313:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1596:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1870:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1930:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2222:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2566:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1874:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2606:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1955:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2755:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2571:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1947:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2791:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2472:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2111:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2161:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2457:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2245:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2087:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2079:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2458:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2391:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2696:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2066:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2159:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2601:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2578:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1682:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.2013:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1995:  58%|█████▊    | 234/401 [02:18<01:39,  1.68it/s]training loss: 0.1995:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2145:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1812:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2134:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2835:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2432:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1878:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1806:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1894:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2265:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1950:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2348:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2629:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1974:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2026:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2482:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2112:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2318:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2009:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2568:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2160:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1827:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2341:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2403:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2617:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1695:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2141:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2509:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2337:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1963:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2572:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2088:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1900:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1988:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1834:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2530:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1873:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2439:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2075:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1962:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1707:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2679:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2284:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1972:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2538:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2495:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1873:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2101:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2780:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2169:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2228:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1773:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2597:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2006:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2221:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2230:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2326:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1702:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2069:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2395:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2063:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2222:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2360:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1841:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2378:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2310:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2397:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2514:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2597:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2284:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2118:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2329:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1954:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1886:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2163:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2449:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2644:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2408:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.2043:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1807:  59%|█████▊    | 235/401 [02:18<01:24,  1.96it/s]training loss: 0.1807:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2290:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1788:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1830:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2100:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2031:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2357:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2232:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1492:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2384:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2052:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2307:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.3045:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1995:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1867:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1974:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1828:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2373:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1959:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2143:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2297:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2456:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1808:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1814:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1690:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2698:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2178:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2108:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2206:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2044:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1741:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2699:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1803:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2003:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2665:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2184:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2017:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2163:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1657:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2047:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2133:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1864:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2560:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2206:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2163:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2102:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2920:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2271:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2051:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2608:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1987:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2225:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2141:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1862:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2106:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2445:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2239:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2385:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2221:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2031:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1907:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2570:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1918:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2300:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2434:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1812:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2672:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1724:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1701:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.1725:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2684:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2609:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2365:  59%|█████▉    | 236/401 [02:18<01:14,  2.23it/s]training loss: 0.2133:  59%|█████▉    | 236/401 [02:19<01:14,  2.23it/s]training loss: 0.1523:  59%|█████▉    | 236/401 [02:19<01:14,  2.23it/s]training loss: 0.2623:  59%|█████▉    | 236/401 [02:19<01:14,  2.23it/s]training loss: 0.2690:  59%|█████▉    | 236/401 [02:19<01:14,  2.23it/s]training loss: 0.1627:  59%|█████▉    | 236/401 [02:19<01:14,  2.23it/s]training loss: 0.1573:  59%|█████▉    | 236/401 [02:19<01:14,  2.23it/s]training loss: 0.2827:  59%|█████▉    | 236/401 [02:19<01:14,  2.23it/s]training loss: 0.2827:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2314:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2370:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2088:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2159:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2590:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2678:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2119:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.3601:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2521:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2324:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2102:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2201:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2643:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1970:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.3052:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2437:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2783:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1848:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1613:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2683:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1745:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1760:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2663:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1909:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2292:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2692:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2115:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2403:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2167:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2121:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2423:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1836:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2509:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2041:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2058:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1745:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2824:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1779:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1917:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2163:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2119:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2505:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2282:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2564:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2357:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1924:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2061:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2090:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2181:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2307:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2166:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2094:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2222:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2385:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2456:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2434:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1697:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2427:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2365:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1848:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1800:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1932:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2217:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2814:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2460:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2240:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1970:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1893:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2267:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2483:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2504:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1974:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1828:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2017:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2516:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1661:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.2011:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1668:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1373:  59%|█████▉    | 237/401 [02:19<01:06,  2.47it/s]training loss: 0.1373:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1641:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2262:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2469:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1785:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2506:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2380:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2415:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1968:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1661:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2769:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1886:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2166:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1941:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1883:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2018:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2049:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1628:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2586:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2444:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2456:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1866:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2217:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2307:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2378:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2053:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2556:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2175:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2236:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2354:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1888:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1652:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2045:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2279:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2068:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1682:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1694:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2105:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2193:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1858:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2040:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2266:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2419:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2922:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2069:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1903:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2083:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2380:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2187:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2017:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1834:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1634:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2115:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2019:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2081:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1696:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2026:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2399:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2460:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2588:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2877:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2096:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2105:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1599:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1945:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2761:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2742:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2647:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2419:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2240:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2513:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2244:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2328:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2139:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2381:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1847:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1459:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1924:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.2330:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1445:  59%|█████▉    | 238/401 [02:19<01:01,  2.66it/s]training loss: 0.1445:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2244:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2200:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2181:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1912:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1975:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2712:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2135:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2190:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2985:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1939:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2136:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2263:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2180:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1874:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2154:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2699:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2413:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1484:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1764:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2696:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2002:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2180:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1796:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2127:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2305:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2485:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2128:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1986:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1870:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2476:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2488:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1734:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1872:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1924:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2577:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2454:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2409:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2523:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2235:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2058:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2015:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2049:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1988:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1993:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2066:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2176:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2232:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2174:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1596:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2026:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1903:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2087:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1791:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2290:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2046:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2488:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2193:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1551:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2307:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2014:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2279:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1733:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2172:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2010:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2600:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2084:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1805:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1975:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2639:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1734:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2280:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2047:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1886:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2968:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1728:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2083:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2290:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.2085:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1979:  60%|█████▉    | 239/401 [02:19<00:57,  2.81it/s]training loss: 0.1979:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.1497:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2075:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2160:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2024:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2144:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2498:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2850:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.1813:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2465:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2800:  60%|█████▉    | 240/401 [02:19<00:55,  2.90it/s]training loss: 0.2248:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2608:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1675:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1950:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2784:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2562:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2074:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1915:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2458:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2043:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1879:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2342:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2785:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1804:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2180:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1984:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1989:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2138:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1950:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2276:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1896:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1910:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2032:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2256:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1956:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2628:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2251:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2297:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2035:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1743:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2307:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1465:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2187:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2646:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2477:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2547:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2168:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2368:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2284:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2043:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1816:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2541:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1982:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1889:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2473:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2228:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2027:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2151:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2582:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2520:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2021:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1992:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2458:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1864:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2050:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1786:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1912:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2261:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2063:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2428:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2148:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2014:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1563:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2342:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2310:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.1638:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2322:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.2125:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.4195:  60%|█████▉    | 240/401 [02:20<00:55,  2.90it/s]training loss: 0.4195:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2010:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1864:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2337:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2197:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.3003:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2394:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2953:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2456:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2253:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2103:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1645:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1624:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2118:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2402:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2352:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1739:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2615:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1979:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2324:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2083:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2456:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2427:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.3290:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2199:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2059:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2223:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1936:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2045:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1510:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2283:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2365:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2329:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1884:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1551:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1865:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2201:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2057:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2407:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2775:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2142:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2315:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2858:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2025:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2046:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.2603:  60%|██████    | 241/401 [02:22<02:50,  1.06s/it]training loss: 0.1427:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1945:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2079:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1893:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2144:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1847:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2576:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1801:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2396:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1852:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1914:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1949:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1882:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1639:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2186:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1936:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2461:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1899:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1810:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2070:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2468:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2501:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2114:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2234:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2865:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2796:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2387:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2413:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1811:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1962:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2460:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2092:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.2010:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1929:  60%|██████    | 241/401 [02:23<02:50,  1.06s/it]training loss: 0.1929:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2351:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2382:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1797:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2282:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2048:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1880:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1989:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1931:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2134:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2504:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2713:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2185:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2314:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2222:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2152:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2317:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2215:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1977:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2509:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2197:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2434:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1767:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1975:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2715:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1970:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2169:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2356:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2036:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2091:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2339:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1728:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2066:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2212:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2344:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2158:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2357:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1600:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2218:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1538:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1913:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2261:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1866:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2288:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2190:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1913:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2617:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2592:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2476:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2090:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1898:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2311:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2312:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2602:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2148:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2260:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2579:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2740:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2325:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2175:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1892:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1978:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2399:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1614:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1770:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1796:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1801:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2295:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1915:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1991:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2582:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2489:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2723:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2290:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2549:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2120:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2261:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.1969:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2280:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2013:  60%|██████    | 242/401 [02:23<02:18,  1.15it/s]training loss: 0.2013:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2772:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2434:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2209:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2428:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2499:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2237:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1861:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2313:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1383:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2572:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2977:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1907:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2067:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1728:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1965:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2265:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2384:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2384:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1746:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2438:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2048:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2041:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2035:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1919:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2798:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1799:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2467:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2047:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1824:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1981:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2157:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2505:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1913:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1804:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2272:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1587:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1960:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2733:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1533:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1809:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2412:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2443:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1761:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1828:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1803:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2155:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1752:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2402:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2390:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2354:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1477:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2615:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1489:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2292:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1954:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1622:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2361:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2058:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2189:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2579:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1944:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2288:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1628:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2250:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1682:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1708:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2706:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1976:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2322:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2704:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2032:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2411:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2762:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2017:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2249:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.2409:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1987:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1974:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1921:  61%|██████    | 243/401 [02:23<01:51,  1.42it/s]training loss: 0.1921:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2490:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2307:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2284:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2791:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2399:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2799:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2574:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2050:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2433:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2038:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2470:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2138:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.2326:  61%|██████    | 244/401 [02:23<01:41,  1.55it/s]training loss: 0.1623:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1873:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1948:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2097:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2270:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1681:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1983:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2694:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2814:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2237:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2210:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1498:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2811:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2026:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1326:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2245:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1369:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1719:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1208:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1875:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1883:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2035:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2410:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1978:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2149:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2504:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2385:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2229:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2180:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1897:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1835:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2287:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1969:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1861:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2141:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2280:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2398:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2128:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2025:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1379:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1817:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2306:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1915:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2107:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2391:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2097:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2306:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2148:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1937:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.3105:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2091:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2015:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2488:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1665:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2421:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1884:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2317:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1955:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2127:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2238:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1661:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.1831:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2867:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2289:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2091:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2589:  61%|██████    | 244/401 [02:24<01:41,  1.55it/s]training loss: 0.2589:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2464:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2345:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2123:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2137:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1863:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1810:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1883:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2001:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2422:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2139:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1799:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2517:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1673:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2724:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1394:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2241:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1756:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2159:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1889:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2037:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2254:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2665:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2581:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1778:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2161:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2029:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2268:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1923:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2035:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2198:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1991:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2335:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1822:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1799:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1480:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2389:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2555:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1928:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2129:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1663:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2375:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2324:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1960:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1884:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1710:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2207:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2181:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1874:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2211:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2200:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2125:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1682:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2564:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2100:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1683:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2005:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1452:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2134:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2590:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2093:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1685:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2133:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1369:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2517:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1837:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1663:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2051:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1793:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1969:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1965:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2863:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2548:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1822:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2112:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2204:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2311:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2635:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.2269:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1789:  61%|██████    | 245/401 [02:24<01:25,  1.82it/s]training loss: 0.1789:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2097:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2198:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1750:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1401:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2455:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1991:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1934:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2380:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2569:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2094:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1854:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2807:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2060:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2194:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2159:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2502:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2568:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2437:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2008:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2367:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2241:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1928:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2179:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1962:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1626:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2149:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2270:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2405:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1970:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1577:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2097:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2300:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2530:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2062:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2399:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2433:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2585:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2249:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1995:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2836:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1672:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1759:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2344:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2168:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1779:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1801:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1821:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2306:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1371:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2036:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2742:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1864:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1489:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2177:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2091:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2722:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1743:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1964:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2219:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2222:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2226:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2268:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2825:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1878:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1837:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1734:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2344:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2232:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2113:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2124:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2342:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2271:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2586:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2199:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1454:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2071:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.1907:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.2097:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.3410:  61%|██████▏   | 246/401 [02:24<01:14,  2.08it/s]training loss: 0.3410:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2408:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2077:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2325:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1701:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2428:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1909:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2356:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2749:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1463:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2077:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2131:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2114:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2232:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1710:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2156:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2044:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1777:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2246:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2058:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1946:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.2233:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1810:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1980:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1941:  62%|██████▏   | 247/401 [02:24<01:06,  2.33it/s]training loss: 0.1924:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2409:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2765:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2337:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2083:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2389:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2265:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1939:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2948:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1734:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1630:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1943:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1897:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2280:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2106:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2273:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2081:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1964:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1806:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1688:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2030:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2395:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2292:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1973:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2007:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2013:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2504:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2533:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2079:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2546:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1856:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2094:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2012:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1623:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2559:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2276:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2296:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1670:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2244:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2170:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1919:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1766:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1998:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2704:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1990:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2363:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2062:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1888:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2329:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2330:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2637:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2059:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.1471:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.2036:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.5231:  62%|██████▏   | 247/401 [02:25<01:06,  2.33it/s]training loss: 0.5231:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1972:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2718:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1961:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2391:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2302:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2310:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2826:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2629:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1789:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1926:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1763:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2307:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1980:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2302:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2553:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2279:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1815:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1941:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2386:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1962:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2005:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.3011:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1517:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2649:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1828:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1722:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2449:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1503:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2082:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2078:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2467:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1714:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2904:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2461:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2005:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2569:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2009:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2098:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1805:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2763:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2645:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1665:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1496:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2393:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2203:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2453:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1991:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2134:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2223:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2747:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2220:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2268:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2220:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2143:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1883:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2208:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2487:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2107:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2091:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2528:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2307:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.3047:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2459:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2379:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2505:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1534:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2366:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2203:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2314:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2533:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2290:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1904:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2274:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2655:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.3046:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.1651:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2191:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.2428:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.0926:  62%|██████▏   | 248/401 [02:25<01:07,  2.26it/s]training loss: 0.0926:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2024:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1718:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1975:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1970:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2009:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1847:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.3047:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2294:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2222:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2775:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2179:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2505:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2188:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2483:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1841:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2454:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1463:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1803:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1890:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2070:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2176:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2287:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2182:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2072:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2078:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2165:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1656:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1824:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1998:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2872:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2761:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1952:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2124:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2427:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2153:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2200:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1736:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2557:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2323:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1515:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1920:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1665:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1600:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1849:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2229:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2294:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.2224:  62%|██████▏   | 249/401 [02:25<01:01,  2.48it/s]training loss: 0.1660:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1682:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1768:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2003:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2219:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2885:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1466:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2218:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2221:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1573:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2127:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2388:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2172:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2583:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2312:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2212:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1757:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1997:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2880:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1603:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1748:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2028:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2499:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2214:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2209:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2356:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2017:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1824:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.1685:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2245:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2173:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2899:  62%|██████▏   | 249/401 [02:26<01:01,  2.48it/s]training loss: 0.2899:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1818:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2389:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1923:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1775:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1779:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2227:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1572:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2072:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2619:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2298:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2333:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1730:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2207:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2858:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1821:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2845:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2134:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2651:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1501:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1671:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1736:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2252:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1799:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2637:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2033:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1700:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2079:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1602:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2014:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2843:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2084:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2165:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2536:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2330:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1745:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1831:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.3131:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2352:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1770:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1886:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2798:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2907:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2177:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2120:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2636:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2184:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1642:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1829:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2130:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2159:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1727:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2348:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1862:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2417:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2169:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2085:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2361:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1848:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1889:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2674:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1794:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2111:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2224:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1956:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2197:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2060:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1791:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2725:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2731:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1743:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1833:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1716:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2172:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2098:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2107:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2239:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.2428:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.1867:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.0692:  62%|██████▏   | 250/401 [02:26<01:13,  2.06it/s]training loss: 0.0692:  63%|██████▎   | 251/401 [02:28<02:49,  1.13s/it]training loss: 0.1771:  63%|██████▎   | 251/401 [02:28<02:49,  1.13s/it]training loss: 0.2398:  63%|██████▎   | 251/401 [02:28<02:49,  1.13s/it]training loss: 0.2206:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2779:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2544:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1539:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.3608:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2117:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1943:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2110:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1897:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1923:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1969:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1646:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2106:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1793:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2442:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2241:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1924:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1986:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2120:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2393:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1790:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2372:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2668:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2148:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1874:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2496:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2179:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1904:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1928:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2266:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2077:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1944:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1985:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2424:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2414:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2403:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1988:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1816:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2326:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2274:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1365:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1860:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1717:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2620:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2414:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2484:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2521:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2075:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1755:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2491:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1962:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2441:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1913:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2127:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2441:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2302:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1769:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2288:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2569:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1863:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2466:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2071:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2049:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2044:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1508:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1832:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2311:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1575:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2532:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2894:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1896:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1679:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2510:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2328:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.1726:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.3302:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2560:  63%|██████▎   | 251/401 [02:29<02:49,  1.13s/it]training loss: 0.2560:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2225:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1722:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2617:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2252:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2273:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1607:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2418:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1902:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2190:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2520:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1907:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2270:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2510:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2073:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2276:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2281:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2176:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2391:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2018:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1858:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2148:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1659:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2066:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1628:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2650:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1918:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2113:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2227:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2034:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1906:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2546:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1926:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2648:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2142:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2478:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1865:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2421:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1945:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1627:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1589:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2600:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2148:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1594:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2915:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2401:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2522:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.3007:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1715:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.3058:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1818:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2040:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2144:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1801:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1986:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2645:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1917:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2039:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2404:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1949:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2496:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2840:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2313:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2120:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2436:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1656:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2562:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1933:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2146:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2370:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2062:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1898:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2262:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1558:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1991:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2409:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2244:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.2551:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.1877:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.3418:  63%|██████▎   | 252/401 [02:29<02:11,  1.13it/s]training loss: 0.3418:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2666:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1986:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2224:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1833:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1531:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2633:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2111:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2721:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2251:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1612:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2377:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2777:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2427:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1911:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2194:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2716:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1760:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2407:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1907:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1954:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2061:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2146:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2060:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1896:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1713:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2086:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2075:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2554:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1796:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2111:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1540:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2418:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2536:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2621:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2425:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2853:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2356:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2350:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1802:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2470:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2383:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2933:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1671:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1913:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2115:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2054:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2665:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1939:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1971:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2397:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2119:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2023:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1923:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2689:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2229:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2563:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1406:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2273:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2443:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1767:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2651:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2062:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2227:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2029:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2517:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2566:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1518:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2369:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1895:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2316:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1998:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2569:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2631:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1654:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2525:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2600:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.2045:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1946:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1020:  63%|██████▎   | 253/401 [02:29<01:45,  1.40it/s]training loss: 0.1020:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2830:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.1674:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.1794:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.1859:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2028:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2354:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2086:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2291:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2347:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.1829:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.1916:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2194:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.1460:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.1821:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2116:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2693:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.2321:  63%|██████▎   | 254/401 [02:29<01:27,  1.69it/s]training loss: 0.1972:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2441:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2208:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2504:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1945:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2740:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1821:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1668:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2513:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2592:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1957:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1534:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2012:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1816:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1819:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1899:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2391:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2462:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1834:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2343:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1651:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1888:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2344:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1880:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1844:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1995:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1420:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1847:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1864:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2296:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2509:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1797:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2042:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2227:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1860:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1724:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2447:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2066:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2059:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1670:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2743:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1683:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2271:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2535:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1984:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1957:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2362:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2014:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2759:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1850:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1730:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2255:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2375:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2476:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2512:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.1702:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2628:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2183:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2761:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2090:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2733:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2291:  63%|██████▎   | 254/401 [02:30<01:27,  1.69it/s]training loss: 0.2291:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1594:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2609:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2537:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1856:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1948:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2552:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2177:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2363:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2625:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2459:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2011:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1946:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1737:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2153:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2114:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2395:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1668:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1985:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2168:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2187:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2131:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2108:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2857:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2349:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2063:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.3101:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1837:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2227:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2638:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1878:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2225:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2357:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2232:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1956:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2276:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2122:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2114:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2334:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2725:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2254:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2516:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2340:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2548:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2362:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2081:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2560:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2206:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2400:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1766:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1850:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2204:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2428:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2068:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2142:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1882:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1828:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2055:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2152:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1546:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2025:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2235:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1857:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2077:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2340:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1759:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2193:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2628:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2346:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2303:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1815:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2227:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2005:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2305:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2023:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2029:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2631:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2382:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.2218:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1950:  64%|██████▎   | 255/401 [02:30<01:14,  1.96it/s]training loss: 0.1950:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2485:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2609:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2465:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1799:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.3303:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1488:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2278:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2679:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2434:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1988:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2142:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1984:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2355:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2055:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2240:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2476:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2064:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1923:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1853:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2975:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1886:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1539:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2295:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2580:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2669:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2120:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2043:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2069:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1889:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2111:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1622:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2058:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2571:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2359:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2208:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2333:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2039:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2297:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1801:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2435:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2252:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2535:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2816:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2161:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2103:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1759:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2123:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2761:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2009:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2361:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1705:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2541:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2238:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2516:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1605:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1511:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1884:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1997:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2036:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1932:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1770:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1716:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2294:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2665:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2534:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1846:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1678:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2093:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2612:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2071:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2314:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2258:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1611:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2096:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2132:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.2165:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1570:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.1887:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.0861:  64%|██████▍   | 256/401 [02:30<01:05,  2.22it/s]training loss: 0.0861:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.1931:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2246:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2297:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.1568:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.1852:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2590:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2212:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2358:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2436:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.1898:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2210:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2357:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2126:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2295:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2137:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2440:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2157:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.1574:  64%|██████▍   | 257/401 [02:30<01:01,  2.35it/s]training loss: 0.2351:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2330:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2572:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2335:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.3173:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2292:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2215:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2330:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1708:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2069:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1719:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1665:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1995:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2519:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2248:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2117:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2343:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1862:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1539:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1680:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2332:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1900:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2205:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2874:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1930:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2149:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1641:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2887:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2145:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2103:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1871:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2484:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2442:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1998:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2715:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2148:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2758:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2237:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2186:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2151:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2155:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2953:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2616:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2676:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2079:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1881:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1981:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2480:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2141:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1787:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2955:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1638:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1808:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2240:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1550:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1612:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2105:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2942:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2374:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.1706:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2526:  64%|██████▍   | 257/401 [02:31<01:01,  2.35it/s]training loss: 0.2526:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2265:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1649:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2033:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2442:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1995:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2084:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1904:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1966:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1919:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2556:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2252:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2392:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2189:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1798:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1400:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1511:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2083:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2409:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1504:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2789:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1580:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1808:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2999:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.3045:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2240:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1861:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2007:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1868:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1624:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2662:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2169:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2761:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2069:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2106:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2159:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1663:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2059:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1958:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1987:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1931:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2424:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1630:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2415:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2098:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2695:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2314:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2303:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2395:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1829:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2436:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1942:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2379:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2250:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2487:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1813:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2041:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1735:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2115:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2510:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2585:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2498:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1973:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1810:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1809:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1925:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2084:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2576:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2812:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2083:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2639:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2870:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2706:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2113:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2034:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1979:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.1747:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2570:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2358:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2680:  64%|██████▍   | 258/401 [02:31<00:56,  2.55it/s]training loss: 0.2680:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2231:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2720:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1833:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2183:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2138:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2039:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.3019:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2263:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2131:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2691:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2122:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2053:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1585:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2372:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1928:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2233:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2717:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2157:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1393:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2443:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1514:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1289:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2465:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2168:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1701:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2090:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1931:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2732:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2295:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1618:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2335:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2179:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1416:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2412:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2125:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2351:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1894:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2697:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2092:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1302:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2269:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1814:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2303:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2394:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2240:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1932:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1986:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2411:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2308:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1933:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1734:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2562:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2025:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1825:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1610:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2564:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2265:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2090:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2540:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2502:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2073:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2470:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1708:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2818:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1813:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2296:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1915:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2957:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2444:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2265:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2328:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2325:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2836:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2141:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2034:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2109:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.1890:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2108:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2329:  65%|██████▍   | 259/401 [02:31<00:52,  2.71it/s]training loss: 0.2329:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1989:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2009:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2083:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1617:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2446:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2323:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2695:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2294:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2295:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2363:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2357:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1890:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2008:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2492:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.3026:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2317:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1803:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2242:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2044:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2027:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2342:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.3090:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1716:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2116:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2255:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2053:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2168:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1740:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1491:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2023:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2222:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1979:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.2040:  65%|██████▍   | 260/401 [02:31<00:49,  2.84it/s]training loss: 0.1949:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1648:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2528:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2600:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2211:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2129:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2253:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2306:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1620:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1922:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1892:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1712:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2090:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1775:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1765:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1801:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1681:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2385:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1949:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2297:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2152:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2219:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2721:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2222:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2376:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1840:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2230:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2247:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.3104:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2544:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2816:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1951:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2205:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2509:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1874:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2266:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2550:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2353:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2695:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2332:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2401:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2067:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2546:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2299:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.2536:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1053:  65%|██████▍   | 260/401 [02:32<00:49,  2.84it/s]training loss: 0.1053:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2616:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2177:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1919:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2253:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2110:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2516:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2523:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2673:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2480:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2250:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2314:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2128:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2508:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2814:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2178:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2030:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2029:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2270:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2167:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1931:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1684:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2515:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1626:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2104:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2700:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.3033:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1894:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2077:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1997:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2635:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2672:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2011:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1846:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2074:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1733:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2274:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2121:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1928:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1873:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1793:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2014:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2470:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2286:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2455:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1962:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2170:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1738:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2404:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2126:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1951:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2675:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1893:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1964:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2573:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1784:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2060:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2268:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1955:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2026:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1784:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1981:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2221:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2662:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1865:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2042:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1669:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2562:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2100:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2433:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1771:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2375:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2918:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2394:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2035:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2020:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2290:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.2275:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1829:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1615:  65%|██████▌   | 261/401 [02:34<02:29,  1.07s/it]training loss: 0.1615:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.1899:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2022:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2150:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2695:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2296:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2623:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2488:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2843:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2416:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2289:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.1985:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2167:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2126:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2551:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2764:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.1844:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2065:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2519:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2212:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.1663:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.3032:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2490:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.1699:  65%|██████▌   | 262/401 [02:34<01:56,  1.19it/s]training loss: 0.2632:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2580:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1743:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2517:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2005:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2131:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2172:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1819:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2173:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2330:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2353:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1978:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2410:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1652:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.3154:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1734:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1821:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2846:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1934:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2428:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2041:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1746:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2430:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1878:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2591:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2058:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2909:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2678:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1860:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1974:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1596:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2631:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1910:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2277:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1969:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2462:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2325:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1766:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2316:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2097:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2188:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1565:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1770:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1685:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1294:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2371:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2196:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2401:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1668:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2167:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.3049:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2251:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1897:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2424:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.1951:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2054:  65%|██████▌   | 262/401 [02:35<01:56,  1.19it/s]training loss: 0.2054:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1989:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2357:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2522:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1791:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1938:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2306:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2769:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1509:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2024:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2494:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1659:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2196:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2337:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1874:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2034:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2706:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2510:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1252:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2097:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1915:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2698:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2290:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1984:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.3070:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2049:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2308:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1761:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2160:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1955:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2270:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2570:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2049:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2139:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2327:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2182:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1961:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2404:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1974:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2114:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2746:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1639:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1376:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1987:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2826:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2038:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2153:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2189:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1991:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1973:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2251:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1449:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2234:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2121:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2454:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1916:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2076:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.3031:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1952:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2471:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2311:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2691:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2298:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2398:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2066:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2039:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2040:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2062:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1813:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.3091:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1916:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2249:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2009:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2869:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2186:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2034:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.2061:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1307:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1999:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1562:  66%|██████▌   | 263/401 [02:35<01:33,  1.47it/s]training loss: 0.1562:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1946:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2831:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2253:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2108:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1430:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2043:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1981:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2719:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2127:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2087:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2409:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.3046:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2295:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2169:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2293:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2421:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2267:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2913:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2009:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2292:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2187:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2240:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2176:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1516:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2335:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1858:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1543:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1950:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1617:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2355:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2330:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1952:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2360:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2296:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2101:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2579:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2507:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2327:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1637:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1487:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2496:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2364:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2149:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2573:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2593:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2380:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1974:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2430:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2477:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1825:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2860:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1884:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1671:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2325:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2762:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1714:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1990:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2040:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2289:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2189:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2677:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1854:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2249:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2395:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2034:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2167:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2011:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.1851:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2006:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2054:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2307:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2417:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2364:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2177:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2828:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2246:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2050:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2480:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2444:  66%|██████▌   | 264/401 [02:35<01:20,  1.71it/s]training loss: 0.2444:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.1824:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2326:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.1983:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2336:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.1915:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2420:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2191:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2177:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2313:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2181:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2212:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2341:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.1952:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.1895:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2026:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2265:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2299:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2981:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2080:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2513:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2065:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.1875:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2225:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2645:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2414:  66%|██████▌   | 265/401 [02:35<01:08,  1.98it/s]training loss: 0.2216:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2218:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2442:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2007:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2499:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1902:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2356:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1803:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2346:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1996:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2190:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1935:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1928:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2299:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2062:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2370:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2022:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1219:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2901:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2043:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2042:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1787:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2227:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2434:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1922:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2336:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2509:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1906:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2242:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2431:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1956:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1996:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2135:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1938:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2052:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1693:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2130:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2436:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2750:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1742:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2413:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2118:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2437:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1978:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2190:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2132:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2016:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1804:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2148:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1953:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2192:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2145:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.1727:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2769:  66%|██████▌   | 265/401 [02:36<01:08,  1.98it/s]training loss: 0.2769:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2449:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1912:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1995:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2188:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2735:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2168:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2394:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2118:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2349:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1783:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2140:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2534:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2658:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.3057:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.3000:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.3063:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1620:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2200:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2140:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2069:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2526:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2929:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1789:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2454:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2319:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2720:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2130:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1412:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1876:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2140:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1669:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2207:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2229:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1834:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1705:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2197:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2412:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2251:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2186:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2451:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2385:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1755:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2481:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2113:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2293:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1645:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1732:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1539:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2223:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2288:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2061:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2019:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2055:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2922:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2653:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1942:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1806:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1747:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1797:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1818:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2095:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2475:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1626:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1553:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2113:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2147:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2166:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1689:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2015:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1881:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2360:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2442:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1859:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2256:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1681:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.3209:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.1849:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2443:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2669:  66%|██████▋   | 266/401 [02:36<01:00,  2.24it/s]training loss: 0.2669:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1457:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1648:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1502:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1956:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2547:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2223:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1917:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2429:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1614:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2116:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1897:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1527:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1806:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1765:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2017:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2175:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2395:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2218:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2035:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2576:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2889:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2037:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1926:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2218:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2156:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1929:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2761:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1755:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2866:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2205:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2439:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2157:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1625:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2521:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2415:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2696:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2011:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2020:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2222:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1930:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2155:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2009:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1753:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2838:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2292:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2798:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2452:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2015:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2462:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1805:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2600:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2651:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1773:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2238:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2008:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1552:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2226:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2286:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1943:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2118:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2260:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2557:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2326:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1916:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2253:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2061:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1964:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2139:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2128:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2086:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1556:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1958:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1945:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2391:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2708:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1985:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.1742:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.2140:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.3088:  67%|██████▋   | 267/401 [02:36<00:54,  2.46it/s]training loss: 0.3088:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2154:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2610:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2601:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2130:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2533:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2174:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2837:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2112:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2548:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2751:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2391:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2009:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.1760:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2200:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2506:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2607:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2359:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2385:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2241:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2372:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2453:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2172:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2627:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.1775:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2259:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2489:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.1573:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.1884:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2103:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.1859:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2187:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.2046:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.1972:  67%|██████▋   | 268/401 [02:36<00:50,  2.65it/s]training loss: 0.1903:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2387:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2747:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1782:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2390:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2074:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2202:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1937:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1999:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1925:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2067:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1599:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2289:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2320:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1859:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2211:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1761:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2044:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1955:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2025:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2418:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2462:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1753:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1416:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1841:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2211:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2530:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2082:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1790:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2055:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2461:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1658:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1396:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1921:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2713:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1841:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2731:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2047:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1772:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2367:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1783:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2154:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.1941:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2438:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.2338:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.0931:  67%|██████▋   | 268/401 [02:37<00:50,  2.65it/s]training loss: 0.0931:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2248:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2110:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2359:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2148:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1656:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.3011:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2752:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2240:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2288:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1817:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2029:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2721:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2686:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1904:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2101:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1742:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1923:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2102:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2043:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2907:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2197:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2265:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1656:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1802:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2638:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2128:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2493:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2264:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1942:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2343:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2266:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1995:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2162:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1810:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2351:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2746:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2608:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2490:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2282:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.3043:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1583:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2521:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1883:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1773:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1838:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2056:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2169:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2568:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2133:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2591:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2355:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2010:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1509:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1967:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2416:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2581:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2395:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2551:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2046:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2253:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1920:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1903:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2067:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2123:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1800:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1702:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2101:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2624:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2257:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2044:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1913:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1575:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2529:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1569:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1905:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1755:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.1874:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2584:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2839:  67%|██████▋   | 269/401 [02:37<00:48,  2.71it/s]training loss: 0.2839:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1237:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1871:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1921:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2134:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2227:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2268:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2259:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2788:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2581:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2386:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2174:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2222:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2272:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1974:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2507:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2169:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2110:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.3094:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2118:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1864:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2176:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1469:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2200:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1889:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2031:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1581:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2706:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2658:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2102:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2059:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1617:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2154:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.3170:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1905:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1460:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2249:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2484:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2638:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2397:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2181:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1729:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2558:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2025:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1904:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1912:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2117:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2629:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1970:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2946:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1443:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2453:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2833:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1593:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1933:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2672:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2487:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2826:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2357:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2004:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1897:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2300:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2003:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1949:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2052:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1663:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2470:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2639:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2078:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2250:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1925:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1214:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2086:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2461:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2210:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2597:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1761:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.1745:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.2119:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.0957:  67%|██████▋   | 270/401 [02:37<00:47,  2.74it/s]training loss: 0.0957:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1738:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2100:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2340:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2538:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1947:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2387:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2406:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2684:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1958:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1638:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2091:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1656:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2122:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2006:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1912:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2673:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2317:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2651:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2006:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2162:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1779:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2331:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2398:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2083:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.3254:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2457:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2978:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2127:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2236:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2080:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2516:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1985:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1730:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1923:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2353:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1937:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1662:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2153:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2025:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1665:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1790:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2194:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2821:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2340:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2365:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2227:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2398:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2071:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2397:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2354:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2219:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1892:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2272:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2324:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2666:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2014:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2044:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2546:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1906:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1531:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1907:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1940:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2461:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1993:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2636:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2318:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2220:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1953:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2229:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2334:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2221:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1753:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1547:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2107:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1993:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1819:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.1632:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2285:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2756:  68%|██████▊   | 271/401 [02:40<02:11,  1.02s/it]training loss: 0.2756:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2196:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1905:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2400:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2051:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2712:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2290:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2026:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.3255:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1678:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2290:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1507:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2306:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2023:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2034:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1499:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2118:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2309:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2093:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1883:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2730:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2609:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2065:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2268:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1581:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1862:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1605:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2582:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2238:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2470:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1907:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2465:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2462:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1849:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2491:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2188:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1523:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2381:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1951:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2721:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2143:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1905:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2559:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2513:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2045:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1752:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2024:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2064:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2019:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1307:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2174:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2347:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1556:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2185:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1925:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2406:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2106:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2669:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2076:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1977:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2089:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2738:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2201:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1813:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2171:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1673:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2259:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2480:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2123:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1993:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2149:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2228:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2548:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2122:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2157:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2259:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2578:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2985:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.1837:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2176:  68%|██████▊   | 272/401 [02:40<01:43,  1.24it/s]training loss: 0.2176:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2387:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2119:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2450:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2210:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2140:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2432:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1985:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1800:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1902:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1561:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2042:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2323:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2554:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1938:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2650:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2906:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2022:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1953:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2630:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2152:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1909:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2373:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1899:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2308:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2500:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1807:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1757:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1991:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1730:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2404:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2517:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2132:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2585:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2520:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2063:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1937:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.3000:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2652:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2105:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2247:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2149:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2029:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1844:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2235:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2212:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2229:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2153:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1957:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1804:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1680:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2161:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2509:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2238:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2904:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2928:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2379:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2210:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2886:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2382:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1804:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1922:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2017:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2408:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2521:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1982:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1843:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2229:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2149:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1788:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2237:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2124:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2387:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.1697:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2387:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2117:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2442:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2415:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.2091:  68%|██████▊   | 273/401 [02:40<01:24,  1.52it/s]training loss: 0.0938:  68%|██████▊   | 273/401 [02:41<01:24,  1.52it/s]training loss: 0.0938:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2287:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2438:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1790:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1865:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2739:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1487:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1968:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2243:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2490:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2154:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2521:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2131:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2370:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2274:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2158:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1596:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2021:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2357:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1979:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1918:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2082:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2197:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2589:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1911:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1990:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2117:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2528:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1567:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2522:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2334:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1952:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2386:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1314:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2540:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1783:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1711:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2557:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2051:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1732:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1944:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2366:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1947:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.3523:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1341:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1934:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2067:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2016:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2124:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2270:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.3097:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1979:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2433:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1493:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2512:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2560:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2587:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2047:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1858:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1540:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1996:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1829:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2274:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2314:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1977:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2207:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2077:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2279:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2212:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1558:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2197:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1761:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2459:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2394:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2374:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2355:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2323:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1874:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.2574:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1937:  68%|██████▊   | 274/401 [02:41<01:10,  1.81it/s]training loss: 0.1937:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1792:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2371:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1876:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2138:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2167:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2194:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2713:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2460:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2628:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2792:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2131:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2153:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2689:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2039:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1872:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2357:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2234:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2064:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2058:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1776:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2035:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1666:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2439:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2035:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2103:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1954:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1920:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1806:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2064:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1830:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2318:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1855:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1894:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2173:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1938:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2142:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2207:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1677:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1857:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2639:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1462:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2560:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2127:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2116:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1712:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2578:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1753:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2128:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2506:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2258:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2295:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2367:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2571:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1821:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1750:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1665:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2304:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2089:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2755:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2783:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2612:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1866:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2306:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2526:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2507:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2269:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2026:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2383:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2431:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1933:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1719:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1786:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1896:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2014:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1665:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1682:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2058:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.2236:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1176:  69%|██████▊   | 275/401 [02:41<01:00,  2.09it/s]training loss: 0.1176:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2358:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2375:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2102:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2019:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2187:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2380:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.3055:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1975:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1927:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2132:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1967:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1631:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2148:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1954:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1838:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2138:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2101:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1613:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2578:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2460:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2237:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1861:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2425:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1892:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2191:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1765:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2190:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2323:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2188:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1604:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2490:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2186:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1836:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1987:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1818:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2036:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2227:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1963:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2000:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2025:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1604:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1854:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2312:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2015:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2011:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1816:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2308:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2025:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2234:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2245:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2421:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1824:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2451:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2937:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2143:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2069:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1544:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2112:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2567:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.3011:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1796:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2083:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1771:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2696:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1998:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2792:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1803:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2568:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1699:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2091:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2163:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2197:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1798:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1740:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2217:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1873:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.1770:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2028:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2387:  69%|██████▉   | 276/401 [02:41<00:53,  2.34it/s]training loss: 0.2387:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2672:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2862:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2459:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2221:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2349:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2068:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2077:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.1752:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2185:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2422:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.1804:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2055:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2375:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2282:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.1487:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.1626:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.1563:  69%|██████▉   | 277/401 [02:41<00:48,  2.54it/s]training loss: 0.2004:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2287:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2093:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2530:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2511:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1794:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2311:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2191:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2376:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2270:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2090:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2428:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.3009:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2375:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1959:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.3072:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2283:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2060:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2202:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2042:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2817:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2310:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1895:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2523:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2575:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2727:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1792:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2168:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2133:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1908:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1928:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2006:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2283:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2683:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2131:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2003:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2018:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2391:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1851:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1518:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2769:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1935:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2122:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2062:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2072:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2079:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2444:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1909:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2033:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1904:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2160:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1453:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2049:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2215:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2116:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2806:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1835:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2067:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2434:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1595:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.1478:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2339:  69%|██████▉   | 277/401 [02:42<00:48,  2.54it/s]training loss: 0.2339:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2080:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2094:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2243:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1733:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1964:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2132:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2085:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2587:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1638:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2595:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2419:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1365:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1528:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1917:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2131:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2581:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2215:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2107:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2557:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2285:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1848:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2029:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1843:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2925:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2418:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1858:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1478:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1766:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2630:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2096:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2164:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2369:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2933:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1832:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1807:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2323:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2157:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1902:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2453:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2369:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2337:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1877:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1954:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2524:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2507:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2306:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2392:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2726:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2748:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1991:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2042:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2162:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2158:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2786:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1789:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2222:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1868:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1910:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2025:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2229:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1691:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1752:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2596:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2694:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2679:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2300:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1853:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2299:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2352:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2481:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1558:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2739:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1809:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1919:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1986:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1703:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.1920:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.2095:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.3105:  69%|██████▉   | 278/401 [02:42<00:45,  2.71it/s]training loss: 0.3105:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1566:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1904:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2272:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2858:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2172:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2225:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2378:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2865:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2156:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1773:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2588:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1999:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1625:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2685:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1419:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2556:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1752:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1945:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2714:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2543:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2993:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2416:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2477:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2315:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2234:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1656:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2521:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1476:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2782:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2571:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2343:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1924:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1867:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1996:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2252:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2166:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2239:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2113:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2175:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2139:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2323:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2281:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2215:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2049:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2378:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2325:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1643:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2067:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2022:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1779:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2138:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2272:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2220:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2050:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2482:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1794:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1912:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1788:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2237:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1920:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2384:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2379:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2384:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2077:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2123:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2225:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2136:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2073:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2239:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1944:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1710:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1885:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2076:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2246:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1853:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1960:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2214:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.2057:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1891:  70%|██████▉   | 279/401 [02:42<00:43,  2.81it/s]training loss: 0.1891:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1725:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1980:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2343:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1613:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1655:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1722:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1669:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1642:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2701:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2434:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2700:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2682:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1950:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2380:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2034:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2585:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2074:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2398:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1804:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2421:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1785:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1660:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1905:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2736:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2027:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.1909:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2125:  70%|██████▉   | 280/401 [02:42<00:41,  2.90it/s]training loss: 0.2200:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2283:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.3155:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1818:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2086:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1801:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1911:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2280:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2194:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2565:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1595:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1918:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1973:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2546:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2386:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2265:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2000:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2261:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2631:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2858:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2490:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2573:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2863:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2165:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2752:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1360:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2551:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1843:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2046:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2547:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2673:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1927:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1652:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2352:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2225:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1935:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1835:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2363:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2264:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2555:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1915:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2367:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2177:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1882:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2408:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2956:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2426:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2334:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1812:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1666:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.2577:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1790:  70%|██████▉   | 280/401 [02:43<00:41,  2.90it/s]training loss: 0.1790:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1842:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2045:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2527:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2396:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2053:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1870:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1842:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2292:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1986:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2290:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2479:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2477:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1774:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2094:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1989:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1826:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1984:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2558:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1680:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2315:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2039:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2431:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2740:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2422:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2544:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1668:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1860:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1968:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2058:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1692:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1866:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2386:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1860:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2739:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2410:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2233:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2600:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2068:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2263:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2014:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2602:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1948:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2267:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2063:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1597:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2207:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1884:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1969:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1727:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.2053:  70%|███████   | 281/401 [02:45<02:11,  1.10s/it]training loss: 0.1740:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1848:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2054:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2396:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1837:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2407:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2297:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2162:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1833:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2346:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2258:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1704:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1728:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1904:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2190:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2018:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1879:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1983:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2107:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2309:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1732:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2410:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1828:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1875:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.3345:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2453:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.1971:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.2568:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.4491:  70%|███████   | 281/401 [02:46<02:11,  1.10s/it]training loss: 0.4491:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1914:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2069:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1526:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2669:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1690:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2830:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2583:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2336:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2345:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1559:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1934:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1809:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2112:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2532:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1833:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1938:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2332:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2095:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2135:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2194:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1664:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1735:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2337:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2792:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2221:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2525:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1674:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1828:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2583:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1223:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1713:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2066:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1678:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2648:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2168:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1683:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2518:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2436:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2003:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2446:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1334:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2166:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2136:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1642:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2560:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2097:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2201:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2529:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1714:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2255:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2573:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.3006:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1995:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1950:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2356:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2416:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2082:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1956:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2449:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1703:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1900:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2021:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1959:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1704:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1572:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1621:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2165:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2154:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1369:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1959:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2512:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2363:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2005:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1644:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2447:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2710:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2880:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.1897:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2598:  70%|███████   | 282/401 [02:46<01:52,  1.06it/s]training loss: 0.2598:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2721:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2052:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1977:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2399:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1643:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.3267:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2211:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2573:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2425:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1919:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2083:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1604:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1676:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1912:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1981:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2106:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2611:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2380:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1954:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2091:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2599:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2091:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2112:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2135:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2190:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2052:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2477:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1990:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1847:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2747:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2363:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2098:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1544:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2195:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2040:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2107:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1935:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2715:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2107:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2007:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1968:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2143:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2163:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1754:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2282:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2805:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2157:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.3100:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2199:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2439:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2026:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2051:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2433:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2621:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1642:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2348:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2801:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1982:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1940:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2263:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2272:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1682:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2252:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1966:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2500:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1727:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2300:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2051:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2683:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1846:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2358:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2108:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2090:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1877:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2527:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1855:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2541:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.1598:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2045:  71%|███████   | 283/401 [02:46<01:28,  1.33it/s]training loss: 0.2045:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.1978:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.1909:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.2007:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.2022:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.1551:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.2261:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.2063:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.3094:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.2211:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.2447:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.1463:  71%|███████   | 284/401 [02:46<01:12,  1.61it/s]training loss: 0.2030:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2022:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1728:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2880:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2471:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2147:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1795:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2246:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2170:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2356:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1390:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2067:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2818:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1798:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2374:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2168:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2063:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2273:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2569:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2012:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1773:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2385:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2011:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1877:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1775:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2237:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2133:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2015:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1874:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2346:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1535:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2105:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1932:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2352:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2426:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2476:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1931:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1710:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1741:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1996:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2139:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2339:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1897:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1578:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1778:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1612:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2119:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2835:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2196:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2422:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2216:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1684:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2367:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.3366:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2354:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2487:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1781:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2361:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2907:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2517:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2461:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1747:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1953:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1905:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1870:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2090:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.1898:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2940:  71%|███████   | 284/401 [02:47<01:12,  1.61it/s]training loss: 0.2940:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2240:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2262:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2569:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2116:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2452:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2135:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2759:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2534:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2821:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1719:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2641:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2172:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1756:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1813:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2244:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1557:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1935:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1732:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1929:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1549:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1976:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1881:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1870:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1725:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2291:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1747:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1885:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1804:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1577:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1937:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1853:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1453:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2588:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2330:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2070:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1982:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.3069:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2294:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2198:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1675:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2449:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2334:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2446:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1753:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1813:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2655:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1883:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2465:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2210:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2299:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2539:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1917:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2034:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2522:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1504:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2190:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1557:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2181:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1857:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2351:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2009:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1591:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2579:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2023:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2302:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1556:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2624:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1772:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1768:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2149:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2458:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2755:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1681:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2192:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2048:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.2214:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1683:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.1830:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.3037:  71%|███████   | 285/401 [02:47<01:01,  1.88it/s]training loss: 0.3037:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1642:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1605:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1819:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2533:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2492:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1808:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2032:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2238:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2143:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1628:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2234:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1571:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2629:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1769:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1901:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1968:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2001:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2189:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1860:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2034:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1961:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2141:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1993:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1801:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2526:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2528:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1921:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2624:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2234:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1813:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2267:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1779:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2162:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2305:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1850:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1750:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1689:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.3059:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2274:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2291:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2251:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2045:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2012:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2072:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1981:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2295:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1821:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2061:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1455:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2359:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1802:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2406:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2046:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1823:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1923:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1930:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2355:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2616:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1563:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2470:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1875:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1800:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1802:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1718:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2082:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2549:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2362:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2580:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2079:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1985:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1515:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2620:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2149:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2555:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1952:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.2040:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1492:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1929:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1888:  71%|███████▏  | 286/401 [02:47<00:53,  2.14it/s]training loss: 0.1888:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2459:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1917:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1820:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1906:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2647:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2467:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1903:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2497:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1574:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2450:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2822:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1794:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2538:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2621:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2303:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2703:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1998:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2492:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1862:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.1882:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2124:  72%|███████▏  | 287/401 [02:47<00:48,  2.36it/s]training loss: 0.2637:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2109:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1847:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1877:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1849:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2054:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2947:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2185:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1940:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1994:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2523:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2539:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1910:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1849:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1470:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2140:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2060:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2131:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2195:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2085:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2004:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2214:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1438:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1606:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2219:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1668:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2095:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2193:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.3686:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2543:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2202:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2262:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2020:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2607:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1739:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2035:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2520:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2251:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1543:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2219:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2580:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1833:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1602:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2165:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2026:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1709:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2227:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2118:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2555:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1705:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1939:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2553:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2001:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2563:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2060:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2123:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.1550:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2010:  72%|███████▏  | 287/401 [02:48<00:48,  2.36it/s]training loss: 0.2010:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1560:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1892:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2060:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2213:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1734:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1668:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1750:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2083:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1856:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1839:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1910:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1902:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1876:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2444:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2047:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2252:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2174:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1934:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2086:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2347:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2022:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2840:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2282:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2300:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1814:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1881:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2539:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2531:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2171:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1617:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2391:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2706:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2531:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1576:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1641:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2017:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2870:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2250:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2147:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2556:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1951:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2258:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1771:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2276:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2255:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1818:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1865:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1777:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1709:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2059:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2205:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1789:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2531:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2127:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2130:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1620:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2208:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2443:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1776:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1938:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1702:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2475:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2522:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1989:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2595:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2118:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2223:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2496:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2229:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2100:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1671:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2143:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2534:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2177:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.1944:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2924:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.3011:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2080:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2854:  72%|███████▏  | 288/401 [02:48<00:44,  2.55it/s]training loss: 0.2854:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2704:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2315:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.3003:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1348:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2353:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2503:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1891:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2106:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2473:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2442:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1973:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1902:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1818:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2092:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2601:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2266:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2583:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2521:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2649:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2251:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2345:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2163:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1687:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2351:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2164:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1962:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1630:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2562:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2394:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2401:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1531:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2605:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2996:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2216:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2352:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2397:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2121:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1743:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2190:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1972:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1761:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2408:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1705:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1673:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1662:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2402:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2770:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2543:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2060:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2166:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1897:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2109:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2256:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1810:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2537:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1746:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1742:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2304:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2612:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2329:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2019:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2201:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2141:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2172:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1362:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2263:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2193:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1719:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1910:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1757:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1811:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1919:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1868:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2341:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1928:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2646:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.1594:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2129:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2572:  72%|███████▏  | 289/401 [02:48<00:41,  2.70it/s]training loss: 0.2572:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2371:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1565:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2164:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1964:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2164:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2276:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2514:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2449:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2353:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1947:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2388:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1668:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2046:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2343:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2439:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2188:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2069:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1965:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2288:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2010:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1419:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1664:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2389:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1796:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2155:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2074:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2196:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2572:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1983:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2278:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2351:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.1919:  72%|███████▏  | 290/401 [02:48<00:39,  2.82it/s]training loss: 0.2041:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1912:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1904:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2438:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2029:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2841:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2084:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1704:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1961:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2222:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2802:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2188:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2758:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1879:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2942:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2221:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2329:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2123:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1997:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1967:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2277:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2079:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1736:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2191:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2957:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1793:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2588:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2246:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1922:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1819:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2006:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1939:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2141:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1880:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2292:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1483:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2537:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2608:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2647:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1964:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1783:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1987:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1646:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.1773:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2254:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2192:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2154:  72%|███████▏  | 290/401 [02:49<00:39,  2.82it/s]training loss: 0.2154:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1618:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2552:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1757:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1948:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2314:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2357:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2153:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1706:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1873:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2452:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2103:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1562:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2090:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2401:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2252:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2232:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2487:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1742:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2356:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2778:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2749:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2353:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2573:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1495:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2325:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2838:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2218:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2145:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2968:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2250:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2691:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1835:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2214:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1847:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2213:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2242:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2096:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2105:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1903:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1866:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2122:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1738:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2609:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2116:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2038:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2049:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1601:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2014:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2108:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2126:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2270:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2357:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2478:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1949:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1792:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2080:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2664:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1816:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2418:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1984:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1947:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2629:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1866:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1955:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2091:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2354:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2208:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2159:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2653:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2585:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1932:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1931:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1893:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2498:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2602:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2418:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.1891:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2065:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2295:  73%|███████▎  | 291/401 [02:51<01:50,  1.01s/it]training loss: 0.2295:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1877:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2136:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1811:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1973:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1942:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1622:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1829:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2626:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2248:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2048:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1766:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1786:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2372:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2553:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2258:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1992:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2139:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2425:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2856:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2648:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2445:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2113:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2298:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2518:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2264:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1852:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2068:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2209:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2119:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1731:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1993:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1655:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2535:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1630:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2271:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2062:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1498:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2728:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1898:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2037:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1862:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2025:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2706:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2152:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2243:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2592:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2310:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2380:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1507:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1795:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1645:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2576:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1784:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1541:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1711:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2062:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2302:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1544:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2009:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2266:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2462:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2028:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2135:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2273:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2850:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1792:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2523:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2105:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2842:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1998:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.1756:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2193:  73%|███████▎  | 292/401 [02:51<01:27,  1.25it/s]training loss: 0.2313:  73%|███████▎  | 292/401 [02:52<01:27,  1.25it/s]training loss: 0.2531:  73%|███████▎  | 292/401 [02:52<01:27,  1.25it/s]training loss: 0.2140:  73%|███████▎  | 292/401 [02:52<01:27,  1.25it/s]training loss: 0.2165:  73%|███████▎  | 292/401 [02:52<01:27,  1.25it/s]training loss: 0.2434:  73%|███████▎  | 292/401 [02:52<01:27,  1.25it/s]training loss: 0.1790:  73%|███████▎  | 292/401 [02:52<01:27,  1.25it/s]training loss: 0.1740:  73%|███████▎  | 292/401 [02:52<01:27,  1.25it/s]training loss: 0.1740:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2199:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2032:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1826:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2031:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1898:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1916:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1450:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2065:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1647:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1936:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2048:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1919:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2469:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2165:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2222:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1819:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2309:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2294:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2151:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1755:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2245:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1979:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2562:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2095:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1968:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2134:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2084:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2013:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1848:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1825:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2042:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2300:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1602:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2126:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2546:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2260:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1764:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2670:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2920:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2289:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1539:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2080:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2282:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2300:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2230:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1696:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1997:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1854:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2295:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2093:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1882:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1621:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2540:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1930:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2146:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2491:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1977:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1915:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2580:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2170:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1810:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2515:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2041:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2235:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.3073:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1824:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2428:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1659:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1816:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2044:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1855:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1682:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1715:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2587:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2693:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.1431:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2027:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2349:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2812:  73%|███████▎  | 293/401 [02:52<01:10,  1.53it/s]training loss: 0.2812:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1563:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2561:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2362:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2130:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1981:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2223:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1890:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2250:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2004:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2254:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2332:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.3054:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2667:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2416:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1760:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2409:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2358:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1920:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1889:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2393:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2156:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2807:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1489:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2108:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2535:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2885:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2125:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1781:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1797:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1717:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2347:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1934:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1824:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2152:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1773:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1756:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2661:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2918:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2225:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2406:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2271:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2071:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2018:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2030:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2082:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2180:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2552:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1504:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1808:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2166:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2639:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.3531:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2126:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2031:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1797:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2305:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2471:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2100:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1965:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2234:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2518:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2147:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1930:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2728:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2224:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2323:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2512:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2008:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2630:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1722:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2204:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1941:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1939:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2130:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1885:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1899:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.2524:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1646:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1972:  73%|███████▎  | 294/401 [02:52<00:58,  1.82it/s]training loss: 0.1972:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2511:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.1669:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.1749:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2473:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2132:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2133:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.1894:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2463:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2114:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2129:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2433:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.1919:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.1746:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2222:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2539:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.1865:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.1508:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2249:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2527:  74%|███████▎  | 295/401 [02:52<00:51,  2.07it/s]training loss: 0.2134:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1971:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2553:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2281:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2213:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2072:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1327:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1607:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2003:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2346:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2308:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2405:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2397:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2258:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1903:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2112:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1762:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2470:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1595:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1971:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2087:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2953:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2060:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1791:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2036:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2075:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1739:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1903:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2233:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.3005:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2149:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1994:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1921:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2024:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2550:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1859:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2526:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2519:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2635:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1823:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2221:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2107:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1976:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1992:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2337:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2210:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2356:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1910:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1999:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2202:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1887:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2199:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2329:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2180:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.1817:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2125:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2213:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2257:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2932:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2145:  74%|███████▎  | 295/401 [02:53<00:51,  2.07it/s]training loss: 0.2145:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1854:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1981:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2013:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1938:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2466:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1970:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1719:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2136:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1846:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2701:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2381:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2276:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1831:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2221:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2168:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1952:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1931:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2327:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2438:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2263:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2028:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2001:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2075:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1709:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1472:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2372:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2606:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2628:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2038:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2142:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2320:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2516:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2212:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2030:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2029:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2035:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2836:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2008:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2285:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2624:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1712:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2222:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2159:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2547:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2226:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2216:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2184:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2061:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1526:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1819:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1902:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2873:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1813:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2039:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1679:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1638:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2491:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2401:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1948:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2303:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2040:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2383:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2279:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1903:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1903:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2566:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1936:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2330:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1925:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1842:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2172:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2069:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2239:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1972:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2193:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2576:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.2226:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.1739:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.0614:  74%|███████▍  | 296/401 [02:53<00:53,  1.95it/s]training loss: 0.0614:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2062:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2413:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2095:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1762:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1962:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2634:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2126:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1853:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2575:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2555:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1829:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1740:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2007:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1695:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2248:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2153:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1546:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2252:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2667:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2402:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2372:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2163:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1796:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1926:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2247:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1653:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2264:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2373:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1926:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2514:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2136:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2423:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1986:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2343:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2389:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2643:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2312:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1841:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1607:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1992:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1772:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1850:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2472:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2567:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2500:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1983:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2069:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2688:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2260:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2048:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1932:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2341:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2195:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1558:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.3024:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2182:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2478:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2273:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1993:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2387:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2271:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2580:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2198:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2672:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2268:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1648:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2172:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2228:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2153:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1923:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2718:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2283:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1534:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1786:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1589:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1663:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.1821:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2010:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2725:  74%|███████▍  | 297/401 [02:53<00:46,  2.22it/s]training loss: 0.2725:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2304:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2559:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1607:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2132:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1781:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2414:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1738:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1810:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1958:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2358:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2126:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2199:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2723:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1833:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1803:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2853:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2443:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2123:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2514:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1918:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2163:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2055:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2199:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2721:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2088:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2150:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2096:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1848:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2055:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1584:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1805:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2227:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2666:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1847:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2006:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.2466:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1964:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1989:  74%|███████▍  | 298/401 [02:53<00:41,  2.46it/s]training loss: 0.1970:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2417:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2295:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2778:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2316:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.1878:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2797:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2162:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2369:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2005:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2487:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2722:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.1530:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2179:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2042:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.1795:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2491:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2645:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2551:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2446:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.1917:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.1640:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2380:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2388:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2312:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2155:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2508:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2092:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.1923:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2201:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.1718:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2201:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2471:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2372:  74%|███████▍  | 298/401 [02:54<00:41,  2.46it/s]training loss: 0.2167:  74%|███████▍  | 298/401 [02:55<00:41,  2.46it/s]training loss: 0.2666:  74%|███████▍  | 298/401 [02:55<00:41,  2.46it/s]training loss: 0.1519:  74%|███████▍  | 298/401 [02:55<00:41,  2.46it/s]training loss: 0.2423:  74%|███████▍  | 298/401 [02:55<00:41,  2.46it/s]training loss: 0.1876:  74%|███████▍  | 298/401 [02:55<00:41,  2.46it/s]training loss: 0.2802:  74%|███████▍  | 298/401 [02:55<00:41,  2.46it/s]training loss: 0.5455:  74%|███████▍  | 298/401 [02:55<00:41,  2.46it/s]training loss: 0.5455:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2155:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1977:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1980:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1644:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2958:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1985:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1623:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2096:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1949:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2027:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2378:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2509:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1987:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2137:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2277:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2125:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2162:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1928:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2171:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2146:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1703:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2015:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2110:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2013:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2022:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2589:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2532:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2108:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2536:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2564:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2038:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1781:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2290:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1796:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2643:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2191:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2414:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1975:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2759:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2179:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2053:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2648:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1711:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2110:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2622:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1798:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1752:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2458:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1925:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.3079:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1463:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2538:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2825:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2282:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2138:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1781:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2578:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2079:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2616:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2602:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2072:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2427:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1832:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2058:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1979:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2274:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1398:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1364:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2100:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1583:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2082:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1610:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1753:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1714:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.3084:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.1986:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2141:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2051:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2069:  75%|███████▍  | 299/401 [02:55<01:10,  1.45it/s]training loss: 0.2069:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2270:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1957:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2040:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1752:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1766:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2017:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2517:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1694:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2257:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2669:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2515:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2364:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2256:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1739:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1593:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1964:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1912:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2755:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2788:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2444:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1851:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2107:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2267:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2349:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2912:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2051:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1966:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1804:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2095:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2313:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2673:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2212:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1770:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2127:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2103:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2960:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1833:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2087:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2011:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2093:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2222:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2506:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2302:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1861:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1862:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1883:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2207:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2523:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2302:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2837:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2026:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2195:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2613:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2679:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2797:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1767:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2220:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2242:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2153:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2151:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2756:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2674:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2514:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2399:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1893:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2270:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1952:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1816:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2245:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2205:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2051:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1870:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1753:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1929:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2427:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2254:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2790:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.2584:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1292:  75%|███████▍  | 300/401 [02:55<00:59,  1.71it/s]training loss: 0.1292:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1848:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2030:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1679:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1729:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1998:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2111:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1902:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2254:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1841:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1827:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2078:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2581:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2121:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1817:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2123:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1420:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2764:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2279:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1942:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1873:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1864:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.3165:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1832:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2141:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1859:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2267:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2020:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2551:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1842:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1878:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2101:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2153:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1791:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2477:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2545:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2261:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2038:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1932:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2143:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2050:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2057:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1916:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2134:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2521:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2375:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2558:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2183:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2633:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1628:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2672:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1974:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2016:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1863:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2274:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2040:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2141:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2571:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2554:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.3039:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2748:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2409:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2880:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1682:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2451:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2505:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2702:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2253:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2314:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1471:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2290:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1934:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2126:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2602:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2518:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2137:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2068:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.2177:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1668:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1054:  75%|███████▌  | 301/401 [02:58<02:02,  1.23s/it]training loss: 0.1054:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1819:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1869:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1917:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2911:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2396:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1559:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2007:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1876:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2144:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1746:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1973:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1985:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2168:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1975:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2295:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1919:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2045:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1872:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2844:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2430:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2242:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2169:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2202:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1898:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2623:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1441:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1939:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1967:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2279:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1942:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2346:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1782:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2931:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1649:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2197:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2713:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1851:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2216:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1935:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2078:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2491:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2126:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2637:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1993:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2375:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1720:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2080:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2241:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2363:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2026:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1575:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2416:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2607:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2248:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.3023:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1992:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1981:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1990:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2302:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2473:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2502:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2374:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2350:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1841:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2154:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1799:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2265:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1778:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1935:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2088:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2574:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2560:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2551:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1849:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1763:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1843:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.2423:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1891:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1595:  75%|███████▌  | 302/401 [02:58<01:33,  1.05it/s]training loss: 0.1595:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2177:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2398:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2851:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2439:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2614:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2038:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2431:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2043:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2052:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2459:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2169:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2327:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1781:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2292:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2502:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2664:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2202:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2594:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1771:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1523:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1639:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2250:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1971:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2060:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2136:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1818:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1844:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1705:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1842:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2188:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2612:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.2226:  76%|███████▌  | 303/401 [02:58<01:14,  1.32it/s]training loss: 0.1940:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2302:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1992:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2250:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1756:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1924:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2607:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1938:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2029:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1843:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1774:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2088:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1945:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2431:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1984:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1765:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2548:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2104:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2262:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1886:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2313:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1806:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2187:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1752:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2438:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2253:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1394:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2020:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1933:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2397:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1773:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1973:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2467:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1662:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1997:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1945:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1758:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2316:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2684:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2159:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2436:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2359:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2143:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1834:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1750:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.1997:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2894:  76%|███████▌  | 303/401 [02:59<01:14,  1.32it/s]training loss: 0.2894:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1791:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2543:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2283:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1964:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1590:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1765:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2254:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2560:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2965:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1929:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2121:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1941:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2445:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1858:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.3208:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2277:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1975:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1743:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2540:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1947:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2349:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2193:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1955:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1949:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.3141:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2003:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2108:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1601:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2367:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2606:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2573:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1816:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2057:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2041:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1639:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2065:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2153:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1716:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2182:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2361:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1823:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1927:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2246:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2099:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1818:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2069:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1819:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1857:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2156:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1906:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2209:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1517:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2985:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2118:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2136:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2122:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2320:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2202:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1764:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2018:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2391:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2871:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1938:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2125:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2820:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1760:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2059:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1570:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1754:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2728:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2040:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2076:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2038:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2133:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1894:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2380:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.2382:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1929:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1063:  76%|███████▌  | 304/401 [02:59<01:00,  1.61it/s]training loss: 0.1063:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2347:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1388:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1832:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2281:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2371:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2049:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2367:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2469:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1826:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2649:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1767:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1866:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2052:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2599:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1605:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1538:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1819:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2026:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2205:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2142:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1734:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1990:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2300:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1762:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1870:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1685:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2917:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2179:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1912:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2300:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2212:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1847:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2345:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2279:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2052:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2049:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1522:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2511:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2015:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2203:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2256:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2396:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2035:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2929:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2292:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2221:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2341:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2116:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2072:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1827:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2273:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1916:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2115:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2076:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2158:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2135:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2499:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2766:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1605:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2728:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1812:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1824:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2373:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2845:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2183:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2286:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2484:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1967:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1881:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1931:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2151:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2183:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1916:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2600:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2505:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.2075:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1819:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1995:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1233:  76%|███████▌  | 305/401 [02:59<00:50,  1.90it/s]training loss: 0.1233:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1881:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2081:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2264:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2382:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2115:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1767:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2183:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2168:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2331:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2344:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1640:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2180:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2181:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2199:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2323:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2021:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2697:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2136:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2384:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2714:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1861:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2470:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2025:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1683:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2570:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1570:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2178:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2157:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2010:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2544:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2181:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1961:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2420:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1738:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2511:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2228:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2416:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1769:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2386:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2387:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2153:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2109:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2201:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1808:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1801:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2516:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2397:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1548:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2012:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2124:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2116:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1899:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2103:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2434:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.2225:  76%|███████▋  | 306/401 [02:59<00:43,  2.18it/s]training loss: 0.1837:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2281:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2761:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2180:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1980:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2341:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2649:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2797:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1932:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2026:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1925:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1780:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1572:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1819:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1800:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2151:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2137:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2244:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2573:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1962:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1944:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.2226:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.1949:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.3116:  76%|███████▋  | 306/401 [03:00<00:43,  2.18it/s]training loss: 0.3116:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1411:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.3213:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2158:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2146:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2379:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2199:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1941:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2834:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1929:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1543:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2289:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1618:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1481:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1594:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2545:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2225:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1997:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2062:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1845:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2329:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2138:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1570:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1813:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1921:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1814:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2292:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2876:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2347:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2527:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2409:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1784:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2085:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2044:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2039:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2421:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2304:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2012:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2175:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2022:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2081:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2081:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2573:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2537:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2550:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1902:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1800:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2045:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1811:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2901:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1708:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2381:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1763:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2051:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2248:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1908:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1776:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1866:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2838:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2235:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1424:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2112:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1895:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2493:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2462:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1769:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1945:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2399:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2130:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1818:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2369:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1705:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2007:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2109:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2224:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1995:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.2231:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1818:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.1801:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.4836:  77%|███████▋  | 307/401 [03:00<00:38,  2.43it/s]training loss: 0.4836:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2422:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2119:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2234:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2271:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2155:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2566:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1702:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2137:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1879:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2260:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1639:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2361:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1701:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2270:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2065:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2329:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2098:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2489:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2506:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2297:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1903:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2199:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1867:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2267:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2389:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2269:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2978:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2057:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2179:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2014:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1994:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2316:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2771:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2043:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1847:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.3306:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2718:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2129:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2240:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1856:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2261:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2767:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2370:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1851:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1786:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1943:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2373:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2063:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1588:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2590:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2611:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2444:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2019:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1865:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2228:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2721:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1924:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1765:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2595:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1997:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1825:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2210:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2098:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2105:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2407:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2119:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1932:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1705:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1967:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2685:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1824:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1949:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2101:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1466:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1584:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1961:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2213:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.2119:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1825:  77%|███████▋  | 308/401 [03:00<00:35,  2.63it/s]training loss: 0.1825:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1905:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2680:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2228:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2169:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2683:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2041:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1803:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1931:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2486:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2539:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1923:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2326:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2322:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2487:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2042:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2261:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2128:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1682:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2142:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1833:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2221:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1641:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2536:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2584:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1572:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2673:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1867:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1758:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2156:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.3310:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2605:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1959:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1990:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1835:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2225:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2262:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2369:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2090:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2191:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1863:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2841:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2945:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.1963:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2502:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2122:  77%|███████▋  | 309/401 [03:00<00:35,  2.62it/s]training loss: 0.2029:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2062:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.3022:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2017:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2408:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2448:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2250:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2164:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2915:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1814:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1841:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2563:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2268:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1978:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1954:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2526:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2151:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1900:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2508:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1974:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1737:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1524:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2147:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1665:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1951:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2305:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2077:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2155:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2464:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2954:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2005:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2241:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.2164:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1536:  77%|███████▋  | 309/401 [03:01<00:35,  2.62it/s]training loss: 0.1536:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2372:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1999:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1636:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2269:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1927:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2359:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1504:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2077:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1866:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2213:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1934:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1988:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2280:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1863:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1790:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2650:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1898:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2181:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1811:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2180:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1911:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2170:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1947:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1961:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2153:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1676:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2114:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2885:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2142:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2937:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2065:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2095:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1671:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2257:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2577:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2070:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2689:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2223:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1850:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1694:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2163:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1738:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2360:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1791:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2612:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1528:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1812:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1345:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2295:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2092:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2496:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1704:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2090:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1964:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1984:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2541:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2177:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1886:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2137:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2105:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1578:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1957:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1531:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1718:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1992:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2042:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1934:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2236:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.3310:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2189:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2484:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1921:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2070:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.3090:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2235:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2170:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.1829:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.2095:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.3592:  77%|███████▋  | 310/401 [03:01<00:35,  2.57it/s]training loss: 0.3592:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1596:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2202:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1920:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2113:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1704:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2190:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2094:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2105:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2999:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1541:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2061:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2153:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2536:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2087:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1908:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2465:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2383:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2674:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2442:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2687:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2180:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2211:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1962:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2020:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1773:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2092:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2174:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2064:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2351:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2006:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2176:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2336:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1877:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1740:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2114:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2138:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1541:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2445:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2249:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1702:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2581:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2316:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1682:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2152:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1523:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.1882:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2023:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2173:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2814:  78%|███████▊  | 311/401 [03:03<01:35,  1.06s/it]training loss: 0.2378:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2141:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2400:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2051:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2058:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.1783:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2068:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2634:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.1902:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2235:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2072:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2249:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.1918:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2481:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2124:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2356:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.1858:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2212:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.1922:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2766:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2400:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2094:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2045:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2542:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2220:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.1997:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2016:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2382:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.2469:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.1003:  78%|███████▊  | 311/401 [03:04<01:35,  1.06s/it]training loss: 0.1003:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1867:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1889:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1494:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2644:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1552:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2546:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2722:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2225:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1788:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1757:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1814:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1935:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2503:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1967:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1967:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1966:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2212:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2462:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1868:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1944:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1668:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2616:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2246:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2207:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2419:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2272:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1828:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1696:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2182:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2275:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1970:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2169:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2196:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.3066:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1823:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2670:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1785:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2064:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2483:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2102:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2425:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2147:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2767:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1911:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1767:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2299:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2348:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1841:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2484:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2356:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2812:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1830:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2051:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2061:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2051:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1674:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2238:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2316:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1858:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1766:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2212:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2106:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2114:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2171:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2520:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2218:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2121:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2240:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2406:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2248:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1973:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1947:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1492:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1724:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2985:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2066:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2039:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.2003:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1662:  78%|███████▊  | 312/401 [03:04<01:14,  1.20it/s]training loss: 0.1662:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2399:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2154:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1723:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1715:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1644:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1738:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1959:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2244:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2893:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2183:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2020:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1652:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1702:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1958:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2026:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2113:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1825:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2998:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1666:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2186:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1865:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2233:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2269:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2261:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2133:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2567:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1978:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1836:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1664:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2370:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1555:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1593:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1986:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2513:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2224:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2448:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2345:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2214:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.3762:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1784:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2549:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1963:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2364:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1753:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1979:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1564:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2186:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2532:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2716:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2173:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2105:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2144:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1620:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2360:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2135:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2251:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2218:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2263:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2244:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2273:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2065:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2389:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2333:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2612:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1949:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2264:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2209:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.1999:  78%|███████▊  | 313/401 [03:04<01:07,  1.30it/s]training loss: 0.2956:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.1952:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.2251:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.1869:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.2632:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.1959:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.1697:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.2845:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.2263:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.1812:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.1725:  78%|███████▊  | 313/401 [03:05<01:07,  1.30it/s]training loss: 0.1725:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2379:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2620:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2390:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2011:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1508:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2091:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2229:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2434:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2506:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1868:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2341:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2113:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2464:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2349:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2607:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.3565:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2329:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1951:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1880:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1823:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1665:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2775:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2341:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2540:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2138:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2741:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2138:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2196:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1949:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2189:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2434:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2310:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2502:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2371:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1864:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2119:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2257:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2727:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2760:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2244:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2608:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1808:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2083:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2034:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2108:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2250:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2741:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1734:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2650:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1798:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2333:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2336:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2085:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1121:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2207:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1631:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2227:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2518:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2772:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2230:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2447:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2084:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2623:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1964:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1917:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1749:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1937:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1751:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2260:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1848:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2259:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2179:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2432:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2687:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2240:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1957:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2817:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.2735:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1604:  78%|███████▊  | 314/401 [03:05<00:54,  1.58it/s]training loss: 0.1604:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2086:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2160:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2228:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2616:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2234:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2879:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1842:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2704:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1585:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1887:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1895:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1622:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1850:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2361:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2363:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2287:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2251:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2096:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2264:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2654:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2463:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2026:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2189:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2149:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2091:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1857:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.3239:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2085:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1671:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2277:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2316:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1735:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2548:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2694:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1697:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1773:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1878:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2016:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1884:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1919:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1608:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2456:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2063:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2099:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2389:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1877:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2244:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1332:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2506:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2211:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1861:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2137:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1948:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2341:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1635:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2540:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1534:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2310:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2257:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1814:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1624:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2307:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2350:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2095:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1716:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2710:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2999:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2119:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.3616:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1904:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1608:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.1676:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2194:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2114:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2199:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2044:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2306:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2766:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2239:  79%|███████▊  | 315/401 [03:05<00:46,  1.87it/s]training loss: 0.2239:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2198:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.3015:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2436:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1981:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2284:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2192:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1867:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2009:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2087:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2654:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1782:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1697:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1939:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2166:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.3113:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2231:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1678:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2835:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1948:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2684:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1949:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2376:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2482:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2298:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1764:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1959:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2422:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1804:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1694:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2275:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2100:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1876:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2122:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2301:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2062:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2646:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2004:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1628:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2491:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1766:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2097:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2060:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2413:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1739:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2552:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2146:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1662:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2019:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1807:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2056:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1708:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1936:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2560:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2137:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2606:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1710:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2726:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1887:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2040:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2521:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1940:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1858:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2408:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2066:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1715:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2128:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2294:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2248:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2042:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1827:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2125:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1868:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2215:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2828:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2320:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.1966:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2248:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.2432:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.3098:  79%|███████▉  | 316/401 [03:05<00:39,  2.13it/s]training loss: 0.3098:  79%|███████▉  | 317/401 [03:05<00:35,  2.36it/s]training loss: 0.2094:  79%|███████▉  | 317/401 [03:05<00:35,  2.36it/s]training loss: 0.2918:  79%|███████▉  | 317/401 [03:05<00:35,  2.36it/s]training loss: 0.1703:  79%|███████▉  | 317/401 [03:05<00:35,  2.36it/s]training loss: 0.1892:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2172:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2352:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2257:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2380:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1860:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.3023:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2156:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1800:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2015:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2002:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2173:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2024:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1698:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2126:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1549:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2146:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1861:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1783:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2718:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2602:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2565:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2278:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2064:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2322:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1846:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1450:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2875:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1812:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2169:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1941:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2970:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1763:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1560:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2191:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2143:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2415:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2358:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1820:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1884:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2150:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2403:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2248:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1612:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1446:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2036:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1716:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2665:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1713:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2469:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2381:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1974:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2073:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2096:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2195:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2395:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2715:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2871:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2267:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2798:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2593:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1835:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2454:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2038:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1680:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1883:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2052:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2675:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2039:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2604:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2072:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2207:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2447:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2404:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.2159:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1970:  79%|███████▉  | 317/401 [03:06<00:35,  2.36it/s]training loss: 0.1970:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2074:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2164:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2400:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1554:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1967:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2421:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1826:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2064:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2176:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1936:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1743:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2007:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2277:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1676:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1787:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2101:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2344:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1786:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2403:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1571:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2512:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2362:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2921:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2616:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2056:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2190:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2874:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2619:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2136:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1750:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2516:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2180:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1793:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2098:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2037:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2018:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2189:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1808:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2232:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2387:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1553:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2595:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1828:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2003:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2414:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2286:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2395:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2172:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2088:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1925:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2127:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2267:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2118:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2209:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1482:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2472:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2034:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2500:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1996:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1926:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1732:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1705:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1815:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1928:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2011:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2213:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1858:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1660:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2322:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2325:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1975:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2898:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2505:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.1544:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2196:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2147:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2851:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2288:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2323:  79%|███████▉  | 318/401 [03:06<00:35,  2.33it/s]training loss: 0.2323:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2254:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1872:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2212:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1768:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2367:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2078:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2137:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2350:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2386:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1628:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1895:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2444:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2126:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2416:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2339:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2026:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2829:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1730:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2192:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1829:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1658:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2082:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2182:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2085:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1914:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2107:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2662:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2066:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2075:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2721:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2739:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2731:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2097:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1472:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2038:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2589:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2314:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2480:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1775:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1944:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2448:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2472:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1512:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2296:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2075:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1679:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2141:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2227:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2363:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2707:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2447:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1918:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2345:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1731:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1971:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2857:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2322:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1784:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2148:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2278:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2178:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.1848:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2010:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2011:  80%|███████▉  | 319/401 [03:06<00:32,  2.53it/s]training loss: 0.2242:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2331:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2395:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.1752:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.1753:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.1588:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.1841:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2307:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2111:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2343:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2199:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2230:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2139:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.1583:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2079:  80%|███████▉  | 319/401 [03:07<00:32,  2.53it/s]training loss: 0.2079:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2159:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1963:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1887:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2100:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2434:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1874:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1774:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1835:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2646:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2572:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2226:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2552:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1774:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2511:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1844:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1972:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2216:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1755:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1364:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1936:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2251:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2139:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2368:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2347:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2013:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1730:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1903:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1903:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1831:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1926:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2467:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1816:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2304:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2176:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2226:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2101:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2370:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1951:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2496:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1826:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2066:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2104:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2046:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2427:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2834:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2750:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1578:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2115:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1917:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2440:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2175:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2375:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1979:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2594:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2571:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1709:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2145:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2048:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2244:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2667:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2315:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1910:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1697:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1968:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1963:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2278:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2129:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2189:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2414:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2119:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2360:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.1909:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2184:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2429:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2367:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2816:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2686:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.2210:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.3037:  80%|███████▉  | 320/401 [03:07<00:30,  2.70it/s]training loss: 0.3037:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1977:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2290:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1928:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2640:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2174:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2543:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2240:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2538:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2137:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2092:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2701:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2146:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2146:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1979:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2197:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2061:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2098:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1991:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2054:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2118:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1538:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2995:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2192:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2056:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1854:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1923:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2438:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2069:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2006:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2738:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2111:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2242:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1510:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2192:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2027:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2356:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2032:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2105:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2697:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2286:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2175:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2134:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2696:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1725:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1696:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1955:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1889:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1943:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1931:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2226:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1898:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2117:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2508:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2018:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1935:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1510:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1877:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1771:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2275:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1880:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1656:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2430:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2088:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1666:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2080:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2037:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1742:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1779:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1868:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1812:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1414:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2300:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2081:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2295:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2156:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2058:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.1757:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2243:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2649:  80%|████████  | 321/401 [03:09<01:20,  1.01s/it]training loss: 0.2649:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2056:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1828:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2511:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1973:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1793:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2742:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1928:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2501:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2080:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2488:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2453:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2207:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2046:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2200:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2113:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2204:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2974:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2155:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2597:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1765:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1920:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1923:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2315:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2280:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2303:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2050:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1689:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2298:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2359:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2039:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2477:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1974:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1940:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2020:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2110:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2337:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2217:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.2040:  80%|████████  | 322/401 [03:09<01:02,  1.26it/s]training loss: 0.1835:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1926:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1761:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1491:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2531:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2277:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2484:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1774:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1984:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1824:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2107:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1989:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2280:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1945:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2223:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1926:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1988:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2596:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2094:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2258:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2157:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2347:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2059:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1955:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2438:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1627:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1566:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1984:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1804:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2563:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1838:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2015:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1770:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.3106:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1647:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2145:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1928:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1895:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.1880:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.2157:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.0993:  80%|████████  | 322/401 [03:10<01:02,  1.26it/s]training loss: 0.0993:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1251:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1897:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2422:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2084:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2646:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2353:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1789:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2060:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1865:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2602:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2102:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1982:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1976:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2135:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2012:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1970:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2161:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1740:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1728:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2487:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2337:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1838:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2269:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1883:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1714:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2136:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2313:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2079:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1979:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1968:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2900:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1921:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2127:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2714:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2282:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2004:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2488:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2807:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2364:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1999:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2396:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1975:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2051:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1713:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1870:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2109:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1829:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1896:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2004:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2697:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2194:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1575:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1520:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1531:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1982:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2022:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2560:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2191:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1791:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2603:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1730:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2221:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2276:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2483:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2195:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2147:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1931:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1756:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.3049:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2007:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2022:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2558:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2115:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2612:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2613:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1236:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2463:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.2071:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1351:  81%|████████  | 323/401 [03:10<00:50,  1.54it/s]training loss: 0.1351:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2163:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2867:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1707:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2064:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2884:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2468:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1859:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2687:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2710:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2775:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2539:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1694:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2176:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2321:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1739:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1722:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2020:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.3033:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1755:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2005:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2232:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2182:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2078:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2018:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2002:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1819:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2005:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1578:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2380:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1923:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2327:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2381:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1764:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2336:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2076:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2322:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2728:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2279:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1499:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2041:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2096:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2035:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2461:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2264:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2237:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1951:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2382:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1804:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1858:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2120:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1833:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1837:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1617:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1856:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2112:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2189:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1591:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1878:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1683:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2143:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1991:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2135:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2270:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1715:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1872:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2048:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1750:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2134:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2027:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2193:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2179:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1887:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2244:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2483:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2175:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2238:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.1583:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.2109:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.4247:  81%|████████  | 324/401 [03:10<00:42,  1.83it/s]training loss: 0.4247:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1552:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2175:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2100:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2081:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2219:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2678:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1869:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1847:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1721:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2533:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1831:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2174:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2379:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2389:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1989:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.3051:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2115:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2500:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1861:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2063:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2153:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2172:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2107:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2346:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2762:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2717:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.3097:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2135:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1685:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1888:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2588:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1522:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2265:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1852:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2085:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1859:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2176:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2028:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2710:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1812:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2243:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1952:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1842:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2078:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2767:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1983:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2147:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.3041:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1693:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1958:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2669:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2231:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1846:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2060:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1710:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2236:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2381:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2689:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.1956:  81%|████████  | 325/401 [03:10<00:36,  2.11it/s]training loss: 0.2169:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2824:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2721:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2127:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2219:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.1907:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2534:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2381:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2103:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.1822:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2236:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2086:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2218:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2012:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.1736:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.1531:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.1710:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2143:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2806:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2548:  81%|████████  | 325/401 [03:11<00:36,  2.11it/s]training loss: 0.2548:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2202:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1990:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1846:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2255:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2269:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2978:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2515:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2507:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1986:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2938:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2046:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2388:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2109:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1846:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2415:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2317:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2232:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2733:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1910:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1785:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2229:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2314:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1984:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2298:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2010:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1910:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2074:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2329:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2236:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2465:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1770:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2206:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2229:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2100:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2068:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2405:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1919:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1530:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1943:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1847:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1889:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2401:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2095:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2111:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1915:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2215:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2512:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2549:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2345:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.3128:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1755:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2284:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2196:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2291:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1716:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2381:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2099:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2132:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1877:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2244:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2421:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2661:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1817:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2468:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1847:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2607:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2371:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2237:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2512:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2490:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2116:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1756:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1783:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2329:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1912:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1726:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.2080:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1955:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1932:  81%|████████▏ | 326/401 [03:11<00:31,  2.36it/s]training loss: 0.1932:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2042:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2494:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1656:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2284:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2888:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2890:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2633:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1666:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2114:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2535:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1867:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1657:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2327:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2038:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2518:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1919:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2420:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2685:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2138:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2046:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1934:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2103:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2490:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2272:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1813:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2465:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2399:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1793:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2185:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.3028:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2758:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2248:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1963:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1821:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2519:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2243:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1677:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1712:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1792:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2280:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2471:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2206:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2122:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2068:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2290:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2805:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2168:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2032:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1789:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2041:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2372:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1764:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2508:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1761:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2780:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1879:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2070:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2527:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1966:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1620:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.3009:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1897:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2791:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2084:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2353:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1963:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1688:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1776:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2136:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2520:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2110:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2374:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1904:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2117:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2226:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1923:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1884:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.2568:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1398:  82%|████████▏ | 327/401 [03:11<00:28,  2.57it/s]training loss: 0.1398:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2144:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2728:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2122:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2128:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1831:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1812:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2284:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1853:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1997:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2201:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2279:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1854:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2241:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2682:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2585:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2137:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2707:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1814:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2645:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2550:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2243:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1946:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1936:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2101:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1673:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2225:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2343:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2188:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2184:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1448:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1902:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2282:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2079:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2534:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2345:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2171:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2414:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2206:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1835:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2286:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1896:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1597:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2361:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1274:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2455:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2247:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1612:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2206:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1936:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1630:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2149:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2225:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1606:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1563:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2603:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1822:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2209:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2250:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2403:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1930:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1512:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1851:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2176:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2134:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2239:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1989:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1603:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2270:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2126:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2000:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1554:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2323:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2506:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2539:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.3207:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1700:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2048:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.2387:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1072:  82%|████████▏ | 328/401 [03:11<00:26,  2.75it/s]training loss: 0.1072:  82%|████████▏ | 329/401 [03:11<00:24,  2.88it/s]training loss: 0.2283:  82%|████████▏ | 329/401 [03:11<00:24,  2.88it/s]training loss: 0.2642:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2394:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2249:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2078:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2531:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2033:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2298:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1957:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1602:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1628:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2533:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2016:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2910:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2024:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2190:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2610:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2447:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2758:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1881:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1776:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1907:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2407:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1789:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2892:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2426:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1640:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1903:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2395:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2599:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1627:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2227:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1940:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2039:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2210:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1791:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1990:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1165:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1877:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2082:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1803:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2471:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2154:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1879:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1747:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2362:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1851:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2009:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1706:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2788:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2002:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2309:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1997:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2680:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1397:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2134:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1983:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2618:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2173:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2193:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2703:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2193:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2327:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2374:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2239:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2165:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1716:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1987:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1941:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2322:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2311:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2065:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1610:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2231:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2541:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1903:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2275:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.2170:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1106:  82%|████████▏ | 329/401 [03:12<00:24,  2.88it/s]training loss: 0.1106:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2265:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2264:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2044:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1522:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1960:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1778:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1788:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1766:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2284:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2285:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2368:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1944:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2388:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1734:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2222:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2150:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1752:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2699:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2221:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2178:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1980:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2113:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2022:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1893:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2260:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1804:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2293:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1716:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2109:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2202:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1678:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2106:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1926:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1624:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2232:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2087:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1493:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2133:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2272:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1761:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2586:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1995:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2454:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2131:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2202:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1421:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1663:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2345:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2326:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2371:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2258:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2165:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2122:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2216:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1682:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2159:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2123:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2046:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1872:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2007:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1708:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2413:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1952:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2038:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2392:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2509:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2240:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2286:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1853:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1800:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2001:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2812:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1776:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2251:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2088:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2049:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1994:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.2126:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1109:  82%|████████▏ | 330/401 [03:12<00:23,  2.99it/s]training loss: 0.1109:  83%|████████▎ | 331/401 [03:14<01:10,  1.00s/it]training loss: 0.1990:  83%|████████▎ | 331/401 [03:14<01:10,  1.00s/it]training loss: 0.2126:  83%|████████▎ | 331/401 [03:14<01:10,  1.00s/it]training loss: 0.2984:  83%|████████▎ | 331/401 [03:14<01:10,  1.00s/it]training loss: 0.2352:  83%|████████▎ | 331/401 [03:14<01:10,  1.00s/it]training loss: 0.2712:  83%|████████▎ | 331/401 [03:14<01:10,  1.00s/it]training loss: 0.2288:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2000:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1934:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2046:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2105:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2060:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2375:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1915:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1977:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2590:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1609:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2116:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2222:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2966:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2881:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1956:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2311:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1437:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1571:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2117:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2063:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2354:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2379:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1667:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2387:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1973:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1777:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2134:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2219:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1947:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2205:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1806:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2588:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2773:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.3157:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1700:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2118:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2336:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2286:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2124:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1798:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1625:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1979:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2237:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2194:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2280:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2254:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2283:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2222:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2057:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2115:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1699:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2317:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2183:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2195:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2272:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.3226:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2154:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1861:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2139:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2144:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2115:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2126:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1752:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2429:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1867:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2856:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2232:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1921:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2100:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1815:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.1802:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2589:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2691:  83%|████████▎ | 331/401 [03:15<01:10,  1.00s/it]training loss: 0.2691:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1975:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2545:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2248:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2364:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2265:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2259:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1705:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2289:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1579:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1959:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1909:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.3100:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2718:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2120:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2025:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1934:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1127:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1799:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2164:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1720:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.3022:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1915:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2182:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2175:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2488:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1965:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2451:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1927:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2036:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1681:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1766:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2456:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2036:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2956:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1957:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1898:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1491:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2067:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1803:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1837:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1884:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2448:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2396:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1718:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1988:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1927:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2581:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1832:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2011:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2095:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1802:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2351:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2052:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2253:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2252:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1438:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2068:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1992:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1867:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2579:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2466:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2294:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1869:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2194:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2903:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2207:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2068:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1826:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1884:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.3078:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1904:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2032:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2468:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2305:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1808:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1968:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.2364:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.1956:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.4507:  83%|████████▎ | 332/401 [03:15<01:00,  1.13it/s]training loss: 0.4507:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1940:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2483:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1889:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2183:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1954:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1602:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1892:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2087:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2146:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1904:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2267:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1714:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1856:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2014:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2134:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2262:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2227:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1970:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2175:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2259:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2269:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2569:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2127:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1610:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.3032:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2985:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1930:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1713:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2114:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2033:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1844:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2409:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2294:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2395:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1941:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1833:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1769:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2726:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1832:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2366:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2210:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2022:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2531:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1911:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2088:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1663:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1838:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2866:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2185:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2263:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1628:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.2043:  83%|████████▎ | 333/401 [03:15<00:48,  1.40it/s]training loss: 0.1781:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1665:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2750:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2022:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1920:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1681:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1831:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2147:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2048:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2205:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2587:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1869:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2348:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2108:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1489:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1856:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2409:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2773:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2530:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2038:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2175:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1972:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2619:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2232:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1981:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.2743:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1356:  83%|████████▎ | 333/401 [03:16<00:48,  1.40it/s]training loss: 0.1356:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2136:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2022:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1957:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1539:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2399:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2084:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1611:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1670:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2266:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2138:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2267:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2469:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1843:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2593:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2020:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2181:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2625:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2236:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1982:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2279:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1913:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2486:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2301:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1834:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2402:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2614:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2444:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2269:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1585:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1985:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1769:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1925:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1670:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1913:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2121:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1420:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1754:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1761:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2059:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1896:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1886:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1846:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1644:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2041:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1748:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2131:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2107:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2317:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2479:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2253:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1954:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2203:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2468:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1952:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2019:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2129:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2356:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2078:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2027:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1878:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2300:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2912:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.3033:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1911:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2079:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2006:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2095:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2495:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1753:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2337:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2001:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1639:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1822:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1857:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1641:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.1813:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2400:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.2192:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.4509:  83%|████████▎ | 334/401 [03:16<00:39,  1.68it/s]training loss: 0.4509:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1897:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2312:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1959:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2330:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2259:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1749:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1906:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2321:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2121:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2371:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1270:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2155:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2174:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2559:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2181:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2391:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1712:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2136:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1646:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2671:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2576:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2326:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1878:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2130:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1978:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2005:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2327:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1749:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2226:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1923:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1868:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2000:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2416:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1907:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2025:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1815:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1679:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2262:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2163:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2300:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2134:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1954:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2580:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2384:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2923:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2297:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2334:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2460:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1861:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1334:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1822:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2153:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2250:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2056:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2095:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2078:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2066:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2006:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2409:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2078:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2036:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2115:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2067:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1747:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1861:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2470:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1691:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2101:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1808:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2200:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2016:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1965:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2222:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2979:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2556:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1799:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2313:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.2056:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1042:  84%|████████▎ | 335/401 [03:16<00:33,  1.95it/s]training loss: 0.1042:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2178:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2229:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1991:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2487:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2118:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2204:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1950:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2707:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2557:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2707:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2603:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2111:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2740:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1900:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2262:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2240:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1832:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2839:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2280:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2114:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2515:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2694:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2061:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1736:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1996:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1772:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2118:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1883:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2484:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1888:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1645:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2257:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1765:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2023:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1968:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1731:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2828:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.3060:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2572:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1665:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2463:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2307:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1940:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2547:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1538:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1998:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2311:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2150:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1989:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1583:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1891:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1955:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1817:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2325:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2150:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2059:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2323:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2178:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2809:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1891:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1942:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2502:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2162:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.2395:  84%|████████▍ | 336/401 [03:16<00:29,  2.20it/s]training loss: 0.1518:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2092:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2857:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2330:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2324:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2117:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2758:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.1649:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.1972:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.1939:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.1836:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2316:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2136:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2030:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2406:  84%|████████▍ | 336/401 [03:17<00:29,  2.20it/s]training loss: 0.2406:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2059:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1516:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1640:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2190:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2554:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1796:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2411:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2283:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2210:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2676:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1612:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2298:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1972:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2106:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2018:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.3163:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2540:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1970:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2055:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1965:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2417:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2092:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1984:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2542:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2323:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2218:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2002:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2789:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2073:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1875:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1994:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2465:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1637:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1692:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1964:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2559:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2051:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2206:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2211:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2258:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1771:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1777:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2399:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1839:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1590:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2536:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2347:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2952:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1635:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2815:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2788:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2610:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.3123:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2466:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2377:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1487:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2627:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1915:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1991:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2003:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2448:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2159:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2120:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1887:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2462:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1861:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2292:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2012:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2308:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2598:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1512:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2665:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2251:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1929:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2329:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.1743:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2259:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2126:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2353:  84%|████████▍ | 337/401 [03:17<00:26,  2.42it/s]training loss: 0.2353:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2287:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2108:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1708:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1825:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2319:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2915:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1788:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2309:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2427:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2818:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2372:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2447:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2009:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2549:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2390:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2088:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1429:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2244:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1831:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2107:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1525:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1893:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1976:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2077:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1987:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1882:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2033:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1806:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2271:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2301:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2444:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2440:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1889:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2476:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1957:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2261:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1705:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2593:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1878:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2181:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1729:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1369:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1833:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2217:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2125:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1754:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2013:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1444:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2205:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2911:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1713:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2092:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1718:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2351:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1581:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2859:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1663:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1890:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1972:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2015:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1816:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1575:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1769:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2525:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2324:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2432:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2088:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1654:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2123:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2798:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2042:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2089:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2243:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2055:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2284:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1711:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2426:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.2259:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1612:  84%|████████▍ | 338/401 [03:17<00:24,  2.61it/s]training loss: 0.1612:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1979:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2351:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1936:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2534:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1585:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2192:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2250:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2287:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1875:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2257:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2293:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1741:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2332:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1649:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2016:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1843:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1680:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2704:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2288:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2025:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2237:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2300:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1829:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2769:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2280:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2360:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2453:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2180:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2038:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2170:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2271:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1651:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2694:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1904:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2224:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2251:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1702:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2312:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2109:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2312:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1980:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2124:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2435:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1677:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1708:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2992:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1999:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2639:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1447:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1856:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2185:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1926:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2444:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2297:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1601:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1859:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2021:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2128:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2289:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1922:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2058:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1979:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2103:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1994:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2123:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2170:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1890:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1776:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1859:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2341:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2568:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2587:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2412:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2213:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1861:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2180:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2887:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.2378:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1375:  85%|████████▍ | 339/401 [03:17<00:22,  2.77it/s]training loss: 0.1375:  85%|████████▍ | 340/401 [03:17<00:21,  2.88it/s]training loss: 0.1513:  85%|████████▍ | 340/401 [03:17<00:21,  2.88it/s]training loss: 0.2149:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1960:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1985:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2353:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1843:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2059:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1515:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1474:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1995:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2368:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1536:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2668:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2890:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1847:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2387:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1915:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2479:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1769:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2049:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1896:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2543:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1603:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1960:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1957:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2440:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2370:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1907:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1859:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2540:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1706:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2143:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2136:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1687:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2700:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2368:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1900:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1914:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1960:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1275:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2475:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2301:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2275:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2330:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1783:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2664:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1700:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2541:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2647:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1672:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1743:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1752:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2143:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1896:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2249:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2421:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2354:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2352:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1484:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1734:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2308:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2110:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2349:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1956:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1779:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2268:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2499:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2253:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2260:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2023:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1687:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2066:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2134:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2167:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.1975:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2323:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2669:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2259:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2409:  85%|████████▍ | 340/401 [03:18<00:21,  2.88it/s]training loss: 0.2409:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1987:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1818:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2164:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2056:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2470:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2504:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1916:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2063:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2297:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1734:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2428:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2037:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1620:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1679:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2550:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1628:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1447:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2126:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2054:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2103:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2066:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1850:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1993:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2493:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2095:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2394:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1966:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2139:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2207:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1406:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1945:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2362:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2548:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2349:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1602:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2921:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2189:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1688:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1551:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1714:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2422:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2124:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2204:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2127:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2140:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.3012:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2119:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2555:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2766:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2162:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2380:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2062:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1619:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.3122:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2346:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2841:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1900:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2248:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1399:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2003:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2132:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2675:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1868:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.2487:  85%|████████▌ | 341/401 [03:20<01:04,  1.07s/it]training loss: 0.1926:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2639:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.1930:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2286:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2303:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.1773:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2256:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2554:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2344:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.1954:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2073:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.1767:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2145:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2290:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2229:  85%|████████▌ | 341/401 [03:21<01:04,  1.07s/it]training loss: 0.2229:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2602:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2242:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2187:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1758:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2057:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.3061:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1804:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1643:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2371:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2349:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2257:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2238:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2687:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1987:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1854:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.3040:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2427:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1925:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1584:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2009:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1810:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2163:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1558:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2057:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1769:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2135:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1605:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2538:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1718:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2401:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1675:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2050:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1991:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2093:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2507:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1809:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2072:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1733:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2377:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2152:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2068:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2118:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2134:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1705:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2389:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1665:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2547:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2442:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2762:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1807:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2218:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2512:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1852:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2362:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2312:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2300:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1878:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2743:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2379:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2693:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1945:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2050:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2048:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2346:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2249:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2088:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2419:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1841:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.3038:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2335:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1470:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1795:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1731:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2289:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1749:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2101:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1732:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.2735:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1991:  85%|████████▌ | 342/401 [03:21<00:49,  1.19it/s]training loss: 0.1991:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2096:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2136:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1928:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1997:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2225:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1680:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2045:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2018:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2244:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2342:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2108:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2070:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.3353:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2590:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2316:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2147:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2263:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1956:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2413:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.3098:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.3125:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2318:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1865:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2345:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2442:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2260:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1900:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1586:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2088:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1847:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1690:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2223:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1884:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1697:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2301:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2025:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1691:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1756:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1982:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1800:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2502:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2243:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1800:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2006:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1963:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2828:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1776:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2326:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2505:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2193:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1789:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1794:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1765:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2428:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2023:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1562:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2474:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2021:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2707:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1936:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1965:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2489:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2210:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2184:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2316:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1968:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2031:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2152:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1801:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2806:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1880:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2370:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2454:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2258:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1516:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2020:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.1472:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.2735:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.3563:  86%|████████▌ | 343/401 [03:21<00:39,  1.47it/s]training loss: 0.3563:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1998:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2158:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2130:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2187:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2278:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2426:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2041:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2047:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2372:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1648:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2106:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2199:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2048:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2442:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1933:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1912:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2877:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1364:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2030:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1826:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2437:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1841:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2004:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1820:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2041:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1606:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1812:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2333:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2307:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2347:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2515:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1947:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2001:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1767:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2282:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1956:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1865:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2457:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1772:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2167:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2164:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1986:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1696:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2233:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2285:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1882:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2305:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2522:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1861:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1957:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1859:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1710:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2086:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2401:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2418:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2166:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1659:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1718:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2320:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1949:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2037:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1909:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2140:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2175:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1943:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2499:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2093:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2502:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2859:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1946:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1861:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2523:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2351:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.1953:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2145:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2160:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2287:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.2166:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.3676:  86%|████████▌ | 344/401 [03:21<00:32,  1.75it/s]training loss: 0.3676:  86%|████████▌ | 345/401 [03:21<00:27,  2.03it/s]training loss: 0.2365:  86%|████████▌ | 345/401 [03:21<00:27,  2.03it/s]training loss: 0.2226:  86%|████████▌ | 345/401 [03:21<00:27,  2.03it/s]training loss: 0.1951:  86%|████████▌ | 345/401 [03:21<00:27,  2.03it/s]training loss: 0.2292:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2297:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1502:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1879:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1762:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2122:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2424:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2161:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2147:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1697:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2266:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2098:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1785:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2306:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2297:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2498:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2200:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2152:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2177:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1770:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2683:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2497:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2331:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2168:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1604:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1492:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1684:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1915:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1261:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2492:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2638:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2084:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1864:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2219:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2418:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2669:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2006:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2051:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2517:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1732:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2054:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1903:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1975:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2358:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2675:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1969:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2319:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2472:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2174:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2238:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2065:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2299:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2671:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2073:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1796:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1833:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1945:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2415:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2043:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2504:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1446:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1809:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1696:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1862:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2102:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1486:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1852:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1916:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2120:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2233:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2431:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2177:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2345:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.2085:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1943:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1583:  86%|████████▌ | 345/401 [03:22<00:27,  2.03it/s]training loss: 0.1583:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2944:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2794:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1879:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2190:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2234:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2552:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2112:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1702:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2168:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1597:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2495:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1537:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2200:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2459:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2125:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1858:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2325:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1416:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2383:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2153:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1922:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1935:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1970:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2475:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1802:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1793:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2022:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2124:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1914:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2077:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2491:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2163:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2536:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2417:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2414:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1686:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2649:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2504:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2052:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2621:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2806:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2109:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2293:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2360:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2030:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2116:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2216:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1558:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1633:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2996:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1832:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2300:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1960:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2327:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1608:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2107:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2460:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1927:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1827:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2137:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2230:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2575:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1966:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1847:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1886:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2285:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1836:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2399:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2114:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1940:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1522:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1440:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2143:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1733:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2767:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2017:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1806:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.2357:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1862:  86%|████████▋ | 346/401 [03:22<00:24,  2.28it/s]training loss: 0.1862:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1965:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2179:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1984:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2060:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1769:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2360:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2090:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2271:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2531:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2199:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1841:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2638:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2071:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2297:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2262:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2281:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1820:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1887:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1778:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2053:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1884:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1975:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2729:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1930:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1988:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1785:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2272:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.3211:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2171:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2300:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2816:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2231:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2120:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1950:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2268:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2629:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2256:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2195:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2114:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1940:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2139:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1761:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1673:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2627:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2017:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2251:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2319:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1570:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2243:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1798:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2143:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1883:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2245:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1877:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2005:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2493:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2327:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2783:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2347:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1557:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2478:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2122:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2556:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2015:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1914:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2119:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1971:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2064:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2601:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2086:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1485:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2230:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1855:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2237:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2277:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2091:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2463:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.2348:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1048:  87%|████████▋ | 347/401 [03:22<00:21,  2.47it/s]training loss: 0.1048:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.1949:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.2605:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.2007:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.1789:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.1812:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.1540:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.2037:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.1394:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.2497:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.2750:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.1869:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.1642:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.2243:  87%|████████▋ | 348/401 [03:22<00:20,  2.64it/s]training loss: 0.2233:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.3035:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2343:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1968:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1745:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1687:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2068:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2109:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1987:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1877:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1787:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1870:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2178:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2740:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2136:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2322:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1936:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2256:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1931:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1835:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2352:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1930:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1764:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2194:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2274:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1795:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1764:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2251:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1953:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2080:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1962:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2619:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1889:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2052:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2223:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1521:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2197:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2461:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2294:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2425:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2033:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2107:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2089:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1916:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1928:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2286:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2639:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2356:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1801:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2126:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1550:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2551:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2577:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1696:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1710:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1907:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.3080:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2150:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2425:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2432:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1782:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2434:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2201:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2209:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.1918:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2399:  87%|████████▋ | 348/401 [03:23<00:20,  2.64it/s]training loss: 0.2399:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2627:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1758:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2089:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2463:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2687:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1875:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2258:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2205:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1772:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2398:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2576:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2600:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1961:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1508:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2335:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2285:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1832:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1972:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2279:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2352:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2025:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2230:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.3047:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1806:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2532:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1912:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1793:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2095:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2598:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2337:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1903:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2072:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2221:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2265:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2161:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1684:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1734:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2477:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2594:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2042:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1747:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2473:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2240:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1859:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1673:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2478:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2200:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1941:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1987:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1663:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2059:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1789:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2325:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2032:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2465:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1551:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1580:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2085:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1797:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1793:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2486:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2293:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1869:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2010:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1870:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1546:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2515:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2120:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2139:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2528:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1856:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1735:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2010:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1808:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.2028:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1584:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1734:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.1376:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.0580:  87%|████████▋ | 349/401 [03:23<00:18,  2.79it/s]training loss: 0.0580:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1976:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2440:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1888:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1499:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1851:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2469:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1984:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2266:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2727:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2545:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1856:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1710:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2739:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2085:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2253:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2662:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1842:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1873:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2171:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1624:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2028:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2049:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2031:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2504:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1698:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2050:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.3165:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2123:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2418:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1692:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1799:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1962:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2363:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2269:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2471:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1711:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.3365:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2508:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1889:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1817:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2275:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1508:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1909:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2123:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1816:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2018:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2096:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1588:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1444:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2050:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1910:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2247:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1985:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2181:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1700:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2269:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1852:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2080:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2156:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2608:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2997:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1760:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1961:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1875:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1723:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1820:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2424:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2028:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2062:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2007:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2028:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2181:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2178:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1755:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1876:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1662:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2103:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.2055:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1759:  87%|████████▋ | 350/401 [03:23<00:17,  2.91it/s]training loss: 0.1759:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2473:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2307:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2226:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2311:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2094:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2180:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2409:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2307:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1836:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1817:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1997:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2421:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2136:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1910:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2819:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1624:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2100:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1995:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1959:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2376:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1638:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1829:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2184:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2305:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2269:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2201:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2378:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1442:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2387:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2182:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2187:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1637:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2585:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1974:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2046:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1975:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1900:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2262:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2015:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2351:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1899:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1811:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2217:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1772:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2495:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2000:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2337:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2317:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2499:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2726:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2140:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2249:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1655:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2256:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2150:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2709:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1951:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2126:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2423:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2275:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1774:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2335:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1543:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2289:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1608:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2314:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2700:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1731:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1940:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2602:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2406:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2081:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1792:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2062:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2487:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1445:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2160:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.1819:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2377:  88%|████████▊ | 351/401 [03:26<00:51,  1.02s/it]training loss: 0.2377:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2562:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2349:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2647:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2074:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2027:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2069:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2206:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1406:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1494:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2689:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1792:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2096:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2073:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1745:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2058:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1776:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1517:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2462:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2083:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2131:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2100:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2086:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2340:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2401:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2569:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1680:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2747:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2453:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2173:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2661:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2332:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1884:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2509:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1545:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2113:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1794:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1788:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2058:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2646:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2669:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2050:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2567:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2339:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2220:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1760:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2540:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1922:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1844:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2245:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.2415:  88%|████████▊ | 352/401 [03:26<00:44,  1.11it/s]training loss: 0.1686:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1988:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2204:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1701:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2028:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1847:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2199:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1951:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1823:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2163:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1456:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2135:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2472:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1975:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2356:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1979:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1684:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1540:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2003:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1890:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2135:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1894:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2115:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2259:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2270:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2045:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.2370:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1648:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1307:  88%|████████▊ | 352/401 [03:27<00:44,  1.11it/s]training loss: 0.1307:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2206:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1479:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1985:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2490:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1630:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1714:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1911:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2557:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2643:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2396:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1768:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1840:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1547:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2185:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2385:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2244:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2858:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1673:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1630:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1896:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1767:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2704:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2321:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2285:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2158:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2088:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1986:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2562:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1923:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2343:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2756:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1919:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2615:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2223:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1695:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2096:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2135:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2120:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2203:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1858:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1643:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1953:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1938:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2066:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1781:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2217:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2304:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1819:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2173:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1489:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1664:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1782:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2548:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2159:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1933:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2716:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2054:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1733:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1705:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2229:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2659:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1858:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2070:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1855:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1748:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2342:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1892:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2359:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2793:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1914:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2520:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2121:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1650:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1918:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2440:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2072:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1731:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.2488:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1213:  88%|████████▊ | 353/401 [03:27<00:35,  1.35it/s]training loss: 0.1213:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2003:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.3086:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2700:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2328:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2268:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2062:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1857:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1920:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2174:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2311:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1789:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2023:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2153:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2217:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2334:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2466:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2231:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2305:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2434:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1916:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2337:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.3268:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2103:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2069:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1950:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2381:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2215:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1956:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2440:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2504:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2697:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2298:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1793:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2272:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1786:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1796:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2160:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1847:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1785:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2116:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1994:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2023:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1993:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1642:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2133:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2078:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1875:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2341:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2220:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2314:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2047:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2001:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2251:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2223:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1538:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2444:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1935:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1853:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2267:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2133:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1889:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1508:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2379:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1978:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2185:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2746:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2107:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2670:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2497:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2370:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1842:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1928:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2659:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2597:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2299:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1608:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2664:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.2320:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1504:  88%|████████▊ | 354/401 [03:27<00:29,  1.59it/s]training loss: 0.1504:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2166:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1801:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1817:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2170:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1988:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2483:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2326:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1794:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1352:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1756:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1987:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2354:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2410:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1963:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2016:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2124:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1715:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1771:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1824:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2110:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2179:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1498:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1988:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1836:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2240:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2192:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2144:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1551:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2028:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2133:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2596:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1872:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2038:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2103:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2107:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2276:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1840:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2513:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2467:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1797:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1938:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.2364:  89%|████████▊ | 355/401 [03:27<00:24,  1.88it/s]training loss: 0.1855:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2359:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1798:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2067:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1930:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1959:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2373:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1805:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2125:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2246:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1713:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2373:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1946:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2175:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1518:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1986:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2567:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2494:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1819:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2200:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2066:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2028:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1677:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2285:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2204:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.3018:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2262:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1663:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1872:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2129:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2510:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2532:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.1994:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2149:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2341:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2206:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2978:  89%|████████▊ | 355/401 [03:28<00:24,  1.88it/s]training loss: 0.2978:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2235:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2622:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2065:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2469:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1739:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2467:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2431:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2020:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2763:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2079:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1748:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2258:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2702:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2026:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1809:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2548:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2094:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2598:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2182:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2366:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2000:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2445:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2151:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2778:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2041:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1714:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1666:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2188:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1676:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2228:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2196:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2177:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2135:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1281:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2463:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2716:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2573:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1738:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1850:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2270:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2415:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2200:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2101:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1797:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.3054:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2102:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2286:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2189:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2415:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2089:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1738:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1965:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1870:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1371:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1915:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1475:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2548:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1979:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2072:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2372:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2293:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1923:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1729:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1428:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2389:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1874:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.1668:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2120:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.3400:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2062:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2469:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2572:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2585:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2361:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2110:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2370:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2230:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2128:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2476:  89%|████████▉ | 356/401 [03:28<00:20,  2.14it/s]training loss: 0.2476:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2340:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2891:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2147:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2146:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1981:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1937:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2398:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1594:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2026:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2345:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1857:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2264:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2246:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2327:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2544:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2337:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2009:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1703:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2364:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1896:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2407:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1902:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2541:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1777:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2258:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2499:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2155:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1548:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1838:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1664:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2391:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1520:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2082:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2536:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1973:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2764:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2175:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2029:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2015:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2878:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2833:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2166:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2156:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1985:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2303:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2843:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2431:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2336:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2017:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1724:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1789:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1774:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2916:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2114:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2463:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2434:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2891:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1995:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1697:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1846:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2470:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1878:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1946:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2213:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2172:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2384:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1987:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2962:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2703:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2121:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2572:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2199:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1979:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2243:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1884:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2627:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1875:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.2311:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1492:  89%|████████▉ | 357/401 [03:28<00:18,  2.35it/s]training loss: 0.1492:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2140:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1748:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1727:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1674:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2539:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2520:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2039:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2164:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2368:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2152:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1807:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2296:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2434:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2305:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2340:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1918:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1958:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2230:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2810:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1690:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2111:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2349:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1881:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2296:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2396:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1759:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2003:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2019:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.2234:  89%|████████▉ | 358/401 [03:28<00:16,  2.54it/s]training loss: 0.1953:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2203:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2489:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1822:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1472:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2267:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1524:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1802:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1909:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2096:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1948:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1935:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2216:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1851:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2953:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2535:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1928:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2233:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.3113:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1835:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1865:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2219:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2102:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1775:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2221:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1828:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2285:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.3043:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2713:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2086:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2086:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1990:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1883:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1781:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2012:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2315:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2199:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2253:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2433:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2939:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2078:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1328:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1677:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1709:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2523:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2418:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1714:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.1962:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2405:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2169:  89%|████████▉ | 358/401 [03:29<00:16,  2.54it/s]training loss: 0.2169:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2090:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2514:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1664:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1928:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.3065:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2709:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2024:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2451:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1979:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2039:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2159:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2563:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1965:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1990:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1784:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1847:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1427:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2111:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2273:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2336:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1482:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2244:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2490:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2077:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1659:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2152:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1952:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1822:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2318:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2327:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2171:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2015:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2103:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2350:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2178:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2303:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2761:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2740:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2267:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2051:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1574:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2385:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1724:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2361:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1505:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2816:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2624:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1876:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1729:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2028:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1762:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2004:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1638:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1970:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2505:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2201:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1969:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2110:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2693:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2334:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2150:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2429:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2307:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2088:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1759:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2677:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2732:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2598:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2757:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2445:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1945:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2224:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.3028:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2534:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2484:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2219:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.2629:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1730:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1776:  90%|████████▉ | 359/401 [03:29<00:16,  2.48it/s]training loss: 0.1776:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2509:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2941:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2436:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2549:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2524:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2323:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1612:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1708:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1898:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2126:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1722:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1699:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2095:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1670:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2554:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1731:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2041:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1658:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1811:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2678:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2542:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1762:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2130:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1926:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1928:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2055:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2316:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2734:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1690:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1608:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2456:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2005:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2085:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1839:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2360:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1894:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1680:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2022:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2080:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2927:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2513:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1980:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1847:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2431:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2337:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.3010:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2057:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2391:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2105:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2261:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2209:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2405:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2299:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2416:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1686:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2099:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1827:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1539:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1767:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2050:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1845:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2026:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2088:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2521:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2072:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2156:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2376:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1975:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2359:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2176:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2331:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2324:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2470:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2512:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2261:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1906:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2148:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.2169:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1026:  90%|████████▉ | 360/401 [03:29<00:15,  2.67it/s]training loss: 0.1026:  90%|█████████ | 361/401 [03:31<00:39,  1.00it/s]training loss: 0.1989:  90%|█████████ | 361/401 [03:31<00:39,  1.00it/s]training loss: 0.2193:  90%|█████████ | 361/401 [03:31<00:39,  1.00it/s]training loss: 0.1971:  90%|█████████ | 361/401 [03:31<00:39,  1.00it/s]training loss: 0.1573:  90%|█████████ | 361/401 [03:31<00:39,  1.00it/s]training loss: 0.1833:  90%|█████████ | 361/401 [03:31<00:39,  1.00it/s]training loss: 0.1734:  90%|█████████ | 361/401 [03:31<00:39,  1.00it/s]training loss: 0.2027:  90%|█████████ | 361/401 [03:31<00:39,  1.00it/s]training loss: 0.1916:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1997:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2092:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2523:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1761:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1799:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1976:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1975:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2060:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1992:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2479:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1733:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2061:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2136:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1849:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2157:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2300:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2013:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1343:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2408:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2184:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2079:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2190:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2066:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2163:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1956:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2265:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2501:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2368:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1982:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2297:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1975:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2113:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2963:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2011:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2357:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2018:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2197:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1861:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2100:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2609:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2172:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1734:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2761:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2981:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2397:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2626:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2016:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2323:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1996:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1872:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1500:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2251:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2038:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1524:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2463:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2353:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2200:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2014:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2182:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2025:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2142:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2134:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1824:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2959:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2597:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2234:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1555:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1665:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.1912:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2318:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2437:  90%|█████████ | 361/401 [03:32<00:39,  1.00it/s]training loss: 0.2437:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2684:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2726:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2374:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2319:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2190:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1691:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2359:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1875:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2113:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2287:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2028:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1592:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1869:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1877:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2531:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2416:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2507:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2349:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2094:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2560:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1845:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2266:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2420:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1776:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1755:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2279:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2041:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1935:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2611:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2422:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2194:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2223:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2373:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2204:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1778:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2305:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1611:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2792:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2290:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2488:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2174:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2241:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2009:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2169:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2121:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2182:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2373:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1753:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2974:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2240:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2056:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1465:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2526:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2137:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2091:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2005:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1821:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1699:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1888:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2349:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1865:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2251:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2347:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2295:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1811:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2404:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2301:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2103:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2153:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1618:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2065:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2053:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2905:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2082:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1679:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1941:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.2004:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.1735:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.3110:  90%|█████████ | 362/401 [03:32<00:30,  1.27it/s]training loss: 0.3110:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2299:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2313:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2144:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2076:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1848:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2264:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2302:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2254:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2138:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1757:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2455:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2457:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2670:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2039:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1886:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1787:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2638:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2382:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1765:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1826:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2077:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2500:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2135:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2327:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1583:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1884:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2397:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1565:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1843:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2340:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2219:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2102:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2075:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2511:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2370:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2255:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1836:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2681:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1732:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2521:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2368:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1886:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2665:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1983:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1662:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2490:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2641:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2556:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1962:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1868:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1998:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2311:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2110:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2237:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2131:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1998:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1899:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2128:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2476:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1717:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1953:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2502:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1724:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2237:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2740:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1884:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2236:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2549:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2230:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2260:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2412:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1743:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2103:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1352:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2252:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1779:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.2920:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.1750:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.3027:  91%|█████████ | 363/401 [03:32<00:24,  1.54it/s]training loss: 0.3027:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2080:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2543:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2181:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.1953:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.1921:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2681:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2410:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2180:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2428:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2048:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.1902:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.1855:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2333:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2819:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.1931:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2110:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2124:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2273:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2335:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2195:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.2193:  91%|█████████ | 364/401 [03:32<00:20,  1.83it/s]training loss: 0.1729:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1480:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1341:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.3135:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2677:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2651:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2549:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2432:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1787:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2474:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2179:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2246:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2225:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1798:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1698:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2027:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2037:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2477:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2174:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2371:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2630:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2464:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1662:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2004:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2599:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1503:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1975:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2354:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1771:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2122:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2529:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2031:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2166:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1856:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2362:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1654:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1714:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2612:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2214:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2432:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1931:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1722:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2288:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1599:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2383:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2030:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1838:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2145:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1800:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2473:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2177:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2565:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1859:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2140:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1721:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2575:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.2159:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1010:  91%|█████████ | 364/401 [03:33<00:20,  1.83it/s]training loss: 0.1010:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2621:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2138:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1873:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2726:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2109:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1645:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2368:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1629:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1531:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2623:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2259:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2551:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1770:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2294:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2305:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1881:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2285:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2755:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1960:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.3154:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.3251:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2263:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1586:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1969:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2351:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1677:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2123:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2093:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2228:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2237:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2226:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2088:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1694:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2302:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1981:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2087:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1712:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1910:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2304:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1786:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2450:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2236:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2320:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1926:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2502:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1618:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1992:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2335:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2141:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2501:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2764:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2168:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.3166:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2282:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1594:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1770:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1804:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2147:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.3204:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1714:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2383:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1747:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1874:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2078:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2760:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2264:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2268:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1998:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2050:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1490:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2001:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1982:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1633:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2369:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2358:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1940:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.2052:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1860:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1771:  91%|█████████ | 365/401 [03:33<00:17,  2.10it/s]training loss: 0.1771:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2280:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2544:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1666:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1895:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2108:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2658:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1762:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2159:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1629:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1695:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1216:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2848:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1745:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2088:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2058:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2273:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2139:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2270:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2362:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1935:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2269:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2171:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2540:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1993:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1909:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2108:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2060:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2129:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1778:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2021:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2753:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2137:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2057:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2417:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2213:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2633:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1846:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2164:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1926:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1457:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2279:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1964:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2119:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2371:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2216:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2249:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.3121:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2031:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1614:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1836:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2028:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2270:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1994:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1823:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1904:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2093:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1847:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1869:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2096:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1858:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2917:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1720:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2093:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2222:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1969:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2041:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1871:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2606:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1572:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1976:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1902:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2145:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1844:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1912:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2180:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1920:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1946:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.2193:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1055:  91%|█████████▏| 366/401 [03:33<00:14,  2.35it/s]training loss: 0.1055:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2038:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2482:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2227:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2410:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2463:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1791:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2053:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1751:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2618:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1894:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1842:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2195:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2238:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2301:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1731:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2104:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1807:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2286:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1759:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2236:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1888:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1621:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2037:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2021:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2001:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2297:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2208:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1799:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2031:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1737:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1887:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2098:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1871:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2252:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2332:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1852:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2652:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2113:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1826:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.2242:  92%|█████████▏| 367/401 [03:33<00:13,  2.55it/s]training loss: 0.1948:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2224:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2462:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2247:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1959:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2413:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2041:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1986:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1665:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1928:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2222:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1854:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2099:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2317:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2209:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1978:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2566:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2782:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1795:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2025:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2141:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1838:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2502:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2101:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2302:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1690:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2115:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2144:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2279:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2051:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2629:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2179:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2011:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1769:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2220:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1768:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1423:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.2801:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1557:  92%|█████████▏| 367/401 [03:34<00:13,  2.55it/s]training loss: 0.1557:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2439:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1625:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2145:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1533:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2088:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1427:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2798:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1785:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1819:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2089:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2367:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2180:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2664:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1872:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2230:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2183:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1485:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2270:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2385:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2366:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2322:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2243:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2325:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2278:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1710:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1692:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1989:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2290:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1908:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1995:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1616:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1957:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1924:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2363:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2109:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1637:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2360:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2361:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2105:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2556:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1947:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2474:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2487:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2481:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2338:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1952:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2545:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2337:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1834:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1640:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1697:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1813:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2479:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2033:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1680:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2446:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2638:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1956:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2097:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2096:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1884:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1673:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2348:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2037:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2302:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1936:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1974:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1950:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2225:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2226:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1753:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2146:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1979:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2222:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2460:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.1662:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2059:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.2578:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.3616:  92%|█████████▏| 368/401 [03:34<00:12,  2.71it/s]training loss: 0.3616:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1767:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2095:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2187:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2010:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2125:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2189:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2926:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.3251:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1775:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1978:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2288:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2009:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1900:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2195:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2078:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2344:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2584:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1722:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1852:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2049:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2588:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1588:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2137:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2028:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2412:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2220:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2429:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2425:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1659:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1896:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2405:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2239:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2203:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2202:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2032:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2204:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2021:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2580:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2214:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2192:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1952:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2456:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2005:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1627:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.3605:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2120:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2117:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1480:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2378:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2834:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2054:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1905:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2045:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2094:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1930:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2452:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2171:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1935:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2585:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2345:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2078:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1881:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1885:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1857:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1730:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2310:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2133:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1633:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2296:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2231:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2175:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1934:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2132:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2027:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1806:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2425:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.2082:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1957:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1565:  92%|█████████▏| 369/401 [03:34<00:11,  2.81it/s]training loss: 0.1565:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2787:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2546:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2202:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2068:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1960:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1823:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2553:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2482:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2386:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2407:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1981:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2657:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2340:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1755:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1814:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2824:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1782:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1921:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1870:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2621:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1894:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2314:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1790:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2039:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1669:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1835:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.1654:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2149:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2048:  92%|█████████▏| 370/401 [03:34<00:11,  2.70it/s]training loss: 0.2042:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2108:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2463:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2252:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1992:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1699:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1602:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2078:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1758:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1806:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1605:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2679:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2124:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2550:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2267:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2224:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1498:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1695:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1710:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2350:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1652:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2044:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2220:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2717:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2047:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2247:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2163:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2094:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1726:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2200:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2628:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2014:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2072:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1574:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1995:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1996:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1939:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.3093:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2000:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2143:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1854:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2606:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2656:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1821:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.1829:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2950:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2176:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2300:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2421:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2368:  92%|█████████▏| 370/401 [03:35<00:11,  2.70it/s]training loss: 0.2368:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.1753:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.1610:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2842:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.1824:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2068:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2219:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.1907:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2128:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2150:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2063:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.1725:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2546:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2209:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2660:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2122:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.1982:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2126:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.1780:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2064:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2203:  93%|█████████▎| 371/401 [03:37<00:33,  1.12s/it]training loss: 0.2262:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2489:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2328:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1905:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1974:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1919:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2553:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2111:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2296:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1907:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2193:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1993:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2213:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1943:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2666:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2031:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1905:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1782:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1786:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2491:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2008:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2176:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1956:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1704:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2125:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2470:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2339:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2106:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2357:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1754:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2406:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2480:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2036:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1657:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2878:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1699:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2373:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1822:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1726:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2172:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2553:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2106:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1742:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1828:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1554:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1998:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2018:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2303:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1833:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2448:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1965:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2537:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2231:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.1846:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2471:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2493:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2450:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2430:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2310:  93%|█████████▎| 371/401 [03:38<00:33,  1.12s/it]training loss: 0.2310:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1899:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1808:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2857:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2353:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1990:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2006:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1827:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2026:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1649:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2519:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2442:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2125:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1995:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1945:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2378:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2631:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1951:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2233:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2475:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1610:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2429:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2092:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2041:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2110:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1818:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1590:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2633:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2293:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1765:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1878:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2293:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2282:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2348:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1986:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2304:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2146:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1779:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2532:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1619:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2451:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2084:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2344:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2499:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2187:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2524:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2039:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1895:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2386:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2060:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1742:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2277:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2310:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2438:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1673:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2776:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2066:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2359:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1789:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1994:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2195:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1339:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2214:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1952:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2049:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1929:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2115:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2229:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2215:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2045:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2184:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1865:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2417:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2369:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2074:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1834:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1795:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.1901:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.2364:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.6529:  93%|█████████▎| 372/401 [03:38<00:30,  1.06s/it]training loss: 0.6529:  93%|█████████▎| 373/401 [03:38<00:23,  1.20it/s]training loss: 0.2480:  93%|█████████▎| 373/401 [03:38<00:23,  1.20it/s]training loss: 0.2310:  93%|█████████▎| 373/401 [03:38<00:23,  1.20it/s]training loss: 0.2170:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2348:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2137:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1538:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2208:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2029:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2202:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2340:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2088:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1673:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2467:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1769:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2118:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1628:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2980:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1884:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2643:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2282:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1738:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2593:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2402:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1584:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2355:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1671:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2526:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1685:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2000:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2244:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2440:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2074:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2053:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1843:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2701:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2776:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2032:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2662:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1761:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2606:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1677:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2620:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2348:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2099:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1980:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1942:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2058:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1866:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2392:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1867:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1843:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2305:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2581:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2317:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1665:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1721:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1849:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2268:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2071:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2130:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2302:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2411:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1705:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2169:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1978:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1812:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2095:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1931:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1830:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1933:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1670:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1859:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2637:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2472:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1655:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1776:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2445:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.2308:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1788:  93%|█████████▎| 373/401 [03:39<00:23,  1.20it/s]training loss: 0.1788:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2141:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2740:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1472:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1820:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2129:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1967:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2091:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2518:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1842:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2194:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1552:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2061:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2115:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2062:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1698:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1566:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1601:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2252:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2460:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1776:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2022:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1844:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2539:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1458:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2034:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1604:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2029:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2335:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2450:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2421:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1772:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1930:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2046:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1746:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1606:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1706:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2407:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2358:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2632:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1998:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2597:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1900:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2500:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2187:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2104:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1783:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2561:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2440:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2164:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2198:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1731:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2141:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2692:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2789:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1672:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1680:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2855:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2232:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1816:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2386:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2198:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2395:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2199:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2790:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2328:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1816:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1743:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2829:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2372:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2204:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1864:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2330:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2394:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1510:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2362:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.2617:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1586:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.1996:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.3300:  93%|█████████▎| 374/401 [03:39<00:18,  1.47it/s]training loss: 0.3300:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2945:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2134:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.1988:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2097:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2247:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2041:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.1881:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.1586:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2776:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2308:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.1773:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.1911:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.1682:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.1776:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2165:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2255:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.2367:  94%|█████████▎| 375/401 [03:39<00:17,  1.51it/s]training loss: 0.1263:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1925:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1948:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1937:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1780:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1455:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2018:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1999:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2772:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2056:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2618:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1952:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2544:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2126:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2314:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1700:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2141:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2015:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2193:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1950:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2164:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2321:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1758:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2250:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2025:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2412:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1741:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2471:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2191:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2130:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1939:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2065:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1842:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2268:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1791:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2147:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1889:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1955:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2094:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2344:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1807:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2598:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2744:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2095:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2101:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.3208:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2204:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2785:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1670:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2249:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1947:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2580:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2172:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2497:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2017:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1820:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2335:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2295:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2685:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.2703:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1911:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1110:  94%|█████████▎| 375/401 [03:40<00:17,  1.51it/s]training loss: 0.1110:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2828:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2590:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2252:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2212:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2206:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2654:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2166:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2075:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2306:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2134:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2042:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1942:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2244:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2227:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2953:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2218:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2001:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2432:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2390:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2253:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1744:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2082:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2213:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2058:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2336:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2419:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2402:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2203:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2158:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1995:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2183:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1946:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2172:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2011:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2249:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2691:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2093:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2040:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1831:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1273:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1965:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2579:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2553:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2311:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.3101:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1478:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2173:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1902:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2139:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2025:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1672:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1863:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2451:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2202:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1768:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2555:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2584:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1867:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1314:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2068:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2509:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1853:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2145:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2086:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.3609:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2915:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2131:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1971:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1899:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1906:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2186:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1801:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1662:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1850:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2698:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2111:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.2103:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.1868:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.0909:  94%|█████████▍| 376/401 [03:40<00:13,  1.80it/s]training loss: 0.0909:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1415:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2461:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1864:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1896:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2612:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1755:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2688:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1952:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1967:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1865:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2069:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1976:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2279:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1963:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2069:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2442:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2146:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1976:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2281:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1402:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2204:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2167:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1932:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2075:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2320:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1676:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1963:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.3228:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2487:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1751:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2385:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2166:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1896:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2672:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1977:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2270:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1816:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1941:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2057:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1990:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2042:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1936:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1839:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2252:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2495:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2233:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1476:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2125:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2078:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2025:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2126:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1940:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2283:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2828:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1745:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1710:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2478:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1994:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2521:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1731:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2410:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1737:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2787:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2299:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2799:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2263:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1520:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2174:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2276:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2036:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2514:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2075:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1928:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1422:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2207:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2873:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2708:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.1906:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2845:  94%|█████████▍| 377/401 [03:40<00:11,  2.05it/s]training loss: 0.2845:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2674:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2003:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2199:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2156:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1673:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2300:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2783:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2024:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2254:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2093:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2073:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2179:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2347:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2194:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1944:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1954:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2109:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2189:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2100:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1838:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1698:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2463:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2135:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2345:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1911:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2715:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1788:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1931:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.1738:  94%|█████████▍| 378/401 [03:40<00:09,  2.30it/s]training loss: 0.2025:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1883:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2034:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2060:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2355:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2073:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2798:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2575:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1985:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1549:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2102:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1840:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2962:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1729:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2244:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2196:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2349:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2431:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2116:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1882:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2540:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2152:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1891:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1491:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2330:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2126:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1895:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2662:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1522:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2473:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2237:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1698:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2640:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2092:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2654:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2311:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2164:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2276:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2071:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2168:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2095:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2238:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2585:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2001:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2085:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1954:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2424:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1996:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.1834:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2249:  94%|█████████▍| 378/401 [03:41<00:09,  2.30it/s]training loss: 0.2249:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2688:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1734:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2171:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1783:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2041:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1773:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1956:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1994:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1869:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1755:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2721:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1695:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1716:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2223:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2816:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2399:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2129:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2332:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1943:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2267:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.3022:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2251:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2734:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2098:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2306:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2787:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1910:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2542:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2502:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2638:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1936:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1811:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1881:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1897:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1751:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2345:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1798:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2058:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1656:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2241:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2094:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1751:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2246:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2163:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2144:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2064:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2126:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2293:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1799:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1931:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2365:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1420:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1842:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1622:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1691:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2369:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2343:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2188:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2237:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1545:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2167:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2418:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1877:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1956:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1702:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2213:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2664:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2140:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2063:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1693:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2565:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2473:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2426:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2432:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2314:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1737:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.1537:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.2377:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.3329:  95%|█████████▍| 379/401 [03:41<00:08,  2.50it/s]training loss: 0.3329:  95%|█████████▍| 380/401 [03:41<00:10,  1.98it/s]training loss: 0.2109:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1884:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2576:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1566:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1892:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1653:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2120:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2633:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2278:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2582:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2275:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1934:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2292:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2629:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1847:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1860:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2181:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2275:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2607:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1624:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2376:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2147:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1705:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2755:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1888:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2146:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2590:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1944:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2188:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1976:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2261:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1757:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2211:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2411:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1634:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1833:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2246:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1778:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1955:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1818:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2067:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2560:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2270:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2097:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2452:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2245:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2377:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1638:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1970:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1862:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2280:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2721:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2049:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1936:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1888:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2963:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2531:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2872:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2324:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1669:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1445:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1787:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2579:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2341:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2329:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2324:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2441:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2355:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2227:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1831:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2252:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1689:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.1602:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2137:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2335:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2480:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2287:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.2841:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.0767:  95%|█████████▍| 380/401 [03:42<00:10,  1.98it/s]training loss: 0.0767:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2093:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2194:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1871:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2529:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2079:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2070:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.3024:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1515:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2846:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1669:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2359:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2107:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2749:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2305:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1961:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2026:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1693:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2170:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1882:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2204:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2553:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2232:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1423:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2885:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2284:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2454:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2006:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2498:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2479:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2282:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1951:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.3163:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2111:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2003:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1748:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2066:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2032:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2386:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2145:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2204:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2673:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2077:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1941:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2046:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2788:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2085:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2251:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2063:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2086:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2346:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2014:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2111:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2175:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1630:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2497:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1601:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1636:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1704:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2086:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1923:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2076:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1656:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1410:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1732:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1998:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2551:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2233:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1716:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1880:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2076:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2422:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2339:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1820:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2722:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2519:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2066:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.1864:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.2098:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.0837:  95%|█████████▌| 381/401 [03:45<00:28,  1.42s/it]training loss: 0.0837:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1716:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2612:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1855:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2172:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2732:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2781:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2115:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1769:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.3009:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2531:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.3180:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1938:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1697:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1996:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1976:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2381:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2101:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1904:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2285:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2075:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2447:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1766:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2155:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2456:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2232:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1827:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1890:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2197:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2143:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2367:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1757:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2336:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2476:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2086:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2268:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1691:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2425:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2100:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1821:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.1680:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2418:  95%|█████████▌| 382/401 [03:45<00:20,  1.10s/it]training loss: 0.2444:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2345:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1510:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2398:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1981:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2869:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2379:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2253:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2320:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2348:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2304:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1880:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2026:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1614:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2032:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1485:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1785:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2880:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2126:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2146:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2230:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1774:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2214:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2122:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2381:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2880:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1941:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2425:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2141:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1717:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2503:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1839:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2074:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2414:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2103:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.1985:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2267:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2063:  95%|█████████▌| 382/401 [03:46<00:20,  1.10s/it]training loss: 0.2063:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2062:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2654:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2465:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2193:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1761:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2337:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2443:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2190:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2605:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2652:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1921:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2082:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1653:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1998:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2375:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.3267:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2086:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1821:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2684:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1998:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2301:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2722:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1525:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2641:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1646:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2400:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2474:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2399:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1682:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2259:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2361:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1931:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1790:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2104:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2173:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1869:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1800:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2153:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2341:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2756:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1843:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2227:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2390:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2064:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1899:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2341:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2428:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1675:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2442:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2239:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2393:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2440:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2215:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2202:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2218:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1911:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2166:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2292:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1899:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.3128:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2291:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1309:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2290:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2321:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2335:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2370:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2227:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2355:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2476:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1776:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2299:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1518:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2663:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1823:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2112:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.2105:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1739:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1772:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1578:  96%|█████████▌| 383/401 [03:46<00:16,  1.06it/s]training loss: 0.1578:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.2078:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.2296:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.1983:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.1748:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.2011:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.1833:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.2176:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.2369:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.1845:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.1781:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.2048:  96%|█████████▌| 384/401 [03:46<00:13,  1.27it/s]training loss: 0.2076:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2654:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2263:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2018:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1348:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2283:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2277:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2382:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2063:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1799:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1861:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2288:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1841:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1839:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1823:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.3030:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1796:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2210:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1935:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2277:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2404:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2492:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2468:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1801:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1891:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1671:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2211:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2241:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1755:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1738:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1967:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2122:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2286:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1853:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1320:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2347:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1899:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1857:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2105:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1895:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2140:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1471:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2113:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1751:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2451:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2334:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2306:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1943:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2092:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2143:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2250:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2157:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.3448:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1748:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2340:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2002:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1496:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2062:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2397:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2366:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2359:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1984:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2532:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.1538:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2185:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2864:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2307:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2084:  96%|█████████▌| 384/401 [03:47<00:13,  1.27it/s]training loss: 0.2084:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2017:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2124:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1838:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2944:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1831:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1803:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1630:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2281:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2886:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2475:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1871:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1698:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2193:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1691:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2187:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1930:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2581:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2275:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2097:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2337:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2406:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1678:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1581:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1962:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1952:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2393:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1632:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1547:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2032:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2669:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2635:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2351:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2204:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2416:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2748:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1957:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1943:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2102:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2756:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1907:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2124:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.1803:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2713:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2596:  96%|█████████▌| 385/401 [03:47<00:12,  1.25it/s]training loss: 0.2021:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1578:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2259:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1536:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2087:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1669:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1394:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1898:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2061:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2422:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1617:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1928:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2183:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2215:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1977:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2377:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2122:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2048:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2284:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1614:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1857:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2342:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1871:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1965:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1522:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2039:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2018:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2433:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2984:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1855:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2295:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1822:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.2378:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.1883:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.3686:  96%|█████████▌| 385/401 [03:48<00:12,  1.25it/s]training loss: 0.3686:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2215:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1676:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.3035:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2131:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2534:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2503:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2516:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2456:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2055:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2209:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2172:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2168:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2302:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2718:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2893:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1755:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2215:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1956:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1740:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2055:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1760:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2377:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2243:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1724:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2247:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2867:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2314:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2204:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2231:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2101:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1800:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2230:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2136:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2235:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2133:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2039:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2598:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1951:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2098:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1563:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1672:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1944:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2445:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1790:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2441:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2456:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2380:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1726:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2080:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2026:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2588:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2076:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1750:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2004:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2248:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2001:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2324:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2291:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2356:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1838:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1892:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2569:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2345:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1767:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1846:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1403:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1571:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2441:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1633:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1813:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1760:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.3233:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2802:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2119:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1826:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1552:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.2618:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1986:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1925:  96%|█████████▋| 386/401 [03:48<00:11,  1.35it/s]training loss: 0.1925:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2518:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2136:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.1900:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.1956:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2450:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2430:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2263:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2253:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2137:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2152:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2116:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2121:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.1850:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.1962:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2434:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2593:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2434:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.1884:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.3377:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2125:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2202:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2267:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2720:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2287:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.3264:  97%|█████████▋| 387/401 [03:48<00:08,  1.60it/s]training loss: 0.2514:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2562:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1688:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1979:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2389:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2275:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1788:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1785:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1639:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2708:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2300:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2345:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1965:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1746:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2442:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2436:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2858:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1969:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2715:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2333:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2305:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2524:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2586:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.3247:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2304:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2906:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2829:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2117:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2784:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2353:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2465:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2467:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2135:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1771:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1922:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1908:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2096:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2084:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2076:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1785:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1919:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2020:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1813:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2028:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2335:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2063:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1981:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2535:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2257:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1736:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2261:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1664:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.1914:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2003:  97%|█████████▋| 387/401 [03:49<00:08,  1.60it/s]training loss: 0.2003:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1999:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2478:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2581:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2040:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2508:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1966:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1908:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2060:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1383:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1719:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2279:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2089:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2124:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1973:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1949:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2104:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1923:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1616:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2129:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2323:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2340:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1585:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2027:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1606:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1871:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1913:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1961:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2499:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1812:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2222:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2329:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1684:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1960:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1688:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2389:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1566:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2226:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2212:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2145:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1769:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2162:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1923:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1619:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2304:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2044:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2182:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1799:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2247:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2113:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1652:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2340:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2240:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2408:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2447:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1767:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2175:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2447:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2532:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2402:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2047:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2114:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1847:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2354:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1973:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1939:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1493:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2191:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2266:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1985:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1977:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1910:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1605:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2898:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2224:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2182:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1835:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.1625:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.2550:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.3077:  97%|█████████▋| 388/401 [03:49<00:08,  1.54it/s]training loss: 0.3077:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2283:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2317:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1969:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1663:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1754:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1990:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1927:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1928:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1904:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1719:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2220:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2211:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2730:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1731:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2050:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2564:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2894:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2491:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1773:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2126:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1739:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2138:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.1995:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2607:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2260:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2010:  97%|█████████▋| 389/401 [03:49<00:06,  1.80it/s]training loss: 0.2054:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2782:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.3074:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2011:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1498:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1916:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2549:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1920:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2310:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2092:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1885:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2412:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2604:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2035:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1938:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2430:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2193:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1933:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2416:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2443:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1535:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2556:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2495:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2029:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1677:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2083:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2051:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2111:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2471:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2102:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2002:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2039:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2450:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1426:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1984:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1982:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2409:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2797:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1816:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1949:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2152:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2120:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2124:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1944:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2279:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2956:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2270:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.1999:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2481:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2285:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2667:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.2473:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.3141:  97%|█████████▋| 389/401 [03:50<00:06,  1.80it/s]training loss: 0.3141:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2564:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2617:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2126:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1909:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1987:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2584:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2049:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2668:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1894:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2456:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1689:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2354:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2441:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2344:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.3267:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1421:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2785:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1723:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2645:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1599:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2399:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2041:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1101:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1523:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2265:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2152:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2652:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2302:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1746:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2199:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2699:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2169:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2447:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2602:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2391:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.2858:  97%|█████████▋| 390/401 [03:50<00:07,  1.54it/s]training loss: 0.1994:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1736:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2093:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1923:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2443:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2252:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2065:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2291:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2067:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1966:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1741:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2022:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1937:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1525:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1946:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1983:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2413:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2213:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1870:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2116:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1844:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2199:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1827:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1993:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1772:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1721:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2015:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1964:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1406:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1663:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1919:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1809:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2494:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2482:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1978:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.1795:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2707:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2047:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2284:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2742:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2693:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2509:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2034:  97%|█████████▋| 390/401 [03:51<00:07,  1.54it/s]training loss: 0.2034:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1701:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2072:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2215:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1826:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2218:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2284:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1770:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2149:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2199:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1957:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2034:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.3134:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2374:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1844:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2019:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2303:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2140:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2344:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2200:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2559:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1954:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2281:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1733:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1889:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1967:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2103:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1891:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1786:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1807:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1956:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1513:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2058:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2096:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2239:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2222:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2001:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2952:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2394:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2147:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1919:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1604:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2476:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1908:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2690:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2167:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2514:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2269:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1797:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1386:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2779:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1967:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.3239:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2399:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2518:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2750:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2312:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2353:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2107:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1907:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2155:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1906:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2285:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1897:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1929:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1672:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1975:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2049:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2332:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2190:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2420:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1701:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2003:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2519:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2579:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2437:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1949:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2100:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.1448:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2069:  98%|█████████▊| 391/401 [03:55<00:18,  1.84s/it]training loss: 0.2069:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.1950:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2406:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2430:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2334:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2109:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2288:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2068:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2192:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.1626:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.1625:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2403:  98%|█████████▊| 392/401 [03:55<00:13,  1.50s/it]training loss: 0.2360:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2065:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2014:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1407:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1799:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2689:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2010:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2643:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2341:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1902:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1706:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1915:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2217:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1794:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2522:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2005:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1930:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2107:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1900:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2086:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1764:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2181:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1740:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2321:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2592:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2305:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2111:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2397:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2371:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1744:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2397:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2693:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1687:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1941:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2234:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1936:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2353:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1889:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2355:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2241:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1789:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1744:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2682:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2018:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1998:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2033:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1757:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1798:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2502:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2017:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2183:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2159:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2250:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2092:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1773:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2385:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1664:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1738:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2151:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2042:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1932:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1206:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2220:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1786:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2149:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2292:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.2675:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1689:  98%|█████████▊| 392/401 [03:56<00:13,  1.50s/it]training loss: 0.1689:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2484:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2627:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1976:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1831:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1770:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2181:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2426:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1839:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2469:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1803:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2259:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2665:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1727:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2092:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1737:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2120:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2339:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1641:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2149:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1995:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1955:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1706:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2341:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2476:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2537:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2376:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2052:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2264:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2507:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1812:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2272:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1940:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2453:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1893:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2217:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1966:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1680:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2165:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1626:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1883:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2255:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2018:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2466:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1645:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2296:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1879:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.1973:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2338:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2459:  98%|█████████▊| 393/401 [03:56<00:09,  1.24s/it]training loss: 0.2433:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2196:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.1650:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2286:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2404:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2961:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2492:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.1929:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2315:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2535:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.1640:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2266:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.1877:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2278:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2352:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2023:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2163:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2306:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2677:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2280:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2335:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2335:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2298:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2026:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2672:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2276:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2054:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2529:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.2067:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.1747:  98%|█████████▊| 393/401 [03:57<00:09,  1.24s/it]training loss: 0.1747:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2460:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2580:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1935:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2093:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2120:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2107:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2013:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2065:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2052:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2112:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2155:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2528:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1524:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2090:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2530:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2304:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1931:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2057:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2442:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2228:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1900:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1730:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1805:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2450:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2307:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2530:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1629:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2780:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1961:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1726:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1817:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2245:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2218:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2080:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1852:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2400:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2401:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1859:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2512:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2071:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2042:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1690:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2162:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2349:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2289:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1806:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2472:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1726:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1685:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1555:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2589:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1658:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2098:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1833:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2134:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2225:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1902:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1697:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2488:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2496:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2428:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1812:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2774:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2429:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1960:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2623:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2005:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1949:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2072:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2187:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2399:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1633:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1854:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2438:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1871:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2321:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.2136:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.1976:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.3319:  98%|█████████▊| 394/401 [03:57<00:07,  1.07s/it]training loss: 0.3319:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1931:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1880:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2470:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1807:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2004:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2019:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2187:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2588:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2230:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2538:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2681:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1899:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1856:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2653:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1551:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1870:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2012:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2515:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2066:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2431:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1925:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2370:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1978:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2494:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2090:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2131:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1769:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1580:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1782:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2407:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1702:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1941:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2856:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1829:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2677:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1829:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1741:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2247:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2577:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2032:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2177:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2508:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1648:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2053:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1776:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1994:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2703:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2471:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1984:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2097:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1563:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2870:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2161:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1790:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2304:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1974:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1469:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2547:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1269:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1555:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2113:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1788:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2262:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1906:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2307:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2302:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1815:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2468:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2498:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2096:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2570:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2312:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2052:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1919:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2362:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2135:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.1620:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2601:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2966:  99%|█████████▊| 395/401 [03:57<00:05,  1.18it/s]training loss: 0.2966:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2029:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1827:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2012:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1959:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2015:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2164:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2118:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2605:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1725:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2666:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1878:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2268:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1212:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1890:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2207:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2105:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2047:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1812:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2241:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1651:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.3109:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2192:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1997:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2532:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1916:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1655:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2331:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2552:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2229:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1856:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2544:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1778:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2377:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1900:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2746:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.1833:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2292:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2308:  99%|█████████▉| 396/401 [03:57<00:03,  1.46it/s]training loss: 0.2711:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1878:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2438:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2168:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2241:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2204:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2798:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2532:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1696:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1764:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2194:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2064:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1664:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2308:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2146:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2455:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2068:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2360:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2195:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1696:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1981:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2548:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2309:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2629:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2309:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1862:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2049:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1853:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2033:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2941:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1823:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2194:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1883:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2084:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1658:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2699:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2252:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1869:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.2009:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1645:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1272:  99%|█████████▉| 396/401 [03:58<00:03,  1.46it/s]training loss: 0.1272:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1989:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2680:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2260:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2223:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2186:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2213:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2004:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2304:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2249:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1592:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2920:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2055:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2352:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1836:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1737:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2079:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2452:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2396:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2169:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1870:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1830:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2400:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1989:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2226:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1574:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2368:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2687:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2079:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2083:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1801:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1655:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2428:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2788:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2161:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1808:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2375:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2833:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2471:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2292:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2164:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2796:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2524:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2231:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2193:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2338:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1804:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2272:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1850:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1775:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1671:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1499:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2282:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2109:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1964:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1773:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2355:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2305:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2015:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2738:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1976:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2012:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1917:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2142:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2251:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2054:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2164:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2500:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1926:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2272:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1745:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2115:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2389:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2414:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.1889:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2299:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2406:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2433:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.2656:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.0614:  99%|█████████▉| 397/401 [03:58<00:02,  1.71it/s]training loss: 0.0614:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2118:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1665:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2127:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2153:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2062:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1514:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2141:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2118:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2101:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1977:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2236:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1918:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2954:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1884:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1976:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1974:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2368:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2921:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1923:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2280:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2217:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2386:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1981:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1933:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1829:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2195:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1959:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2163:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2329:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2491:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2527:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2687:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2937:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2356:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1848:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2666:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2303:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2462:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2040:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2285:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2826:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1886:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1875:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2114:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1939:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2024:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2088:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2476:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2174:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2216:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1929:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1983:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2556:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2105:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2344:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1891:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1715:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2458:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2509:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2076:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1657:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1720:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2758:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2093:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1876:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1746:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2404:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2763:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2163:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1788:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1878:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2223:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2697:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2052:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.1722:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2058:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2234:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2206:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2298:  99%|█████████▉| 398/401 [03:58<00:01,  2.00it/s]training loss: 0.2298: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1470: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1673: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2192: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2042: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1762: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1737: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1804: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2069: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2104: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2512: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1819: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1834: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2224: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2131: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2719: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2263: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2149: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2009: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1881: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2065: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2010: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1911: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2634: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1855: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2200: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1816: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2214: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1953: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2509: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2186: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2645: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1984: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2374: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2026: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2344: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1702: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2166: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1759: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1882: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2814: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1647: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2825: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2312: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1942: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1709: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1805: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2541: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1775: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1950: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2275: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2331: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.2671: 100%|█████████▉| 399/401 [03:58<00:00,  2.26it/s]training loss: 0.1828: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2488: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1713: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2175: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2109: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2118: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1979: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2892: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2406: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2952: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2294: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2090: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2502: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1846: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2085: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1696: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2260: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1919: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2221: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2586: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2284: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1986: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2601: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1878: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1960: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.2322: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1356: 100%|█████████▉| 399/401 [03:59<00:00,  2.26it/s]training loss: 0.1356: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2095: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1638: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1742: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2044: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2190: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1747: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2404: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2188: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1969: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2756: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1187: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2413: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.3020: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2223: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1972: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2564: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2431: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2471: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2112: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2138: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2586: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1965: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1982: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2131: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1841: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2181: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2011: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2139: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1904: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2142: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1660: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2539: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2794: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2712: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2614: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2730: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2670: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1714: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1650: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2008: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1745: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1771: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1632: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2168: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2475: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2330: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2448: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2362: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2467: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1844: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1889: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.3061: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2083: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1881: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2860: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2216: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2440: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2159: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.3059: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2198: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2706: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2353: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1797: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1747: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2461: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1926: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2079: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2413: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2002: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2155: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2517: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2013: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1939: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1983: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.1971: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2074: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2348: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2414: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2317: 100%|█████████▉| 400/401 [03:59<00:00,  2.44it/s]training loss: 0.2317: 100%|██████████| 401/401 [04:01<00:00,  1.06s/it]training loss: 0.2317: 100%|██████████| 401/401 [04:01<00:00,  1.66it/s]
diff --git a/slurm/logs/pidm_toy_9912070.out b/slurm/logs/pidm_toy_9912070.out
deleted file mode 100644
index 47e61cf..0000000
--- a/slurm/logs/pidm_toy_9912070.out
+++ /dev/null
@@ -1 +0,0 @@
-checkpoint saved to ./trained_models/toy/toy_9912070/model
diff --git a/slurm/logs/pidm_toy_9912868.err b/slurm/logs/pidm_toy_9912868.err
deleted file mode 100644
index a1eb07b..0000000
--- a/slurm/logs/pidm_toy_9912868.err
+++ /dev/null
@@ -1 +0,0 @@
-  0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.2058:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1982:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0949:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1346:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0314:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9701:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0410:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0620:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0337:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1986:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.1010:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0316:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0776:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0617:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0909:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9676:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9663:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9796:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9878:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9521:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0103:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9968:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9858:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 1.0548:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9408:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9245:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9670:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8810:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9462:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9350:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9005:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9148:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8771:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8890:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8924:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8764:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8986:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9557:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.9422:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8499:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8616:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8220:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8637:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8173:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8403:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8041:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8023:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7869:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8560:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7341:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7978:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7849:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8068:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.8580:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7902:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7880:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7553:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6713:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7542:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7313:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6840:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.7217:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6834:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6893:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6888:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6602:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6741:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6553:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6278:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6584:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6945:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6876:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6415:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6640:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.5898:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.5838:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6260:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6535:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6066:   0%|          | 0/401 [00:00<?, ?it/s]training loss: 0.6066:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.6010:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5982:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5991:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5915:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5446:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5361:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5602:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5140:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5296:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5399:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5337:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4943:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4923:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5144:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4841:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4302:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5372:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4286:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.5130:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4739:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4746:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4532:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3928:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4751:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4745:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4230:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4592:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4365:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3625:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4101:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4328:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3846:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4140:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4070:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4289:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4107:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3955:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3531:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3984:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3722:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3582:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3530:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4647:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3561:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3761:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3386:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3735:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3549:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3964:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.4156:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3807:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3535:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3786:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3511:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3604:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3520:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3678:   0%|          | 1/401 [00:03<25:06,  3.77s/it]training loss: 0.3509:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3451:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.2772:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3459:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3318:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3958:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3337:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3833:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3339:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3127:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3131:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3228:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3573:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3143:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3365:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3485:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.2986:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3544:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.2889:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3381:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.3546:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.4217:   0%|          | 1/401 [00:04<25:06,  3.77s/it]training loss: 0.4217:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3157:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.4043:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3795:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2985:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3418:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3049:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3064:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3535:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3088:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3517:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3253:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3763:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2849:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3725:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3152:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3095:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3142:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3551:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3480:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3176:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3070:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3140:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3200:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3293:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3468:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2611:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.4087:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3448:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3127:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3386:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.4052:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3582:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2791:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2552:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3147:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3946:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3129:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3317:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3146:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3199:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2642:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3700:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3184:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2861:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3015:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3223:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2895:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3054:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3631:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3950:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3036:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3497:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3155:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3220:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3388:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2732:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3010:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3155:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2877:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2951:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3159:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3063:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2699:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3168:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3275:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2897:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2519:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2603:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2848:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3115:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3421:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3025:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3766:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.2997:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3415:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3430:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3195:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3886:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3801:   0%|          | 2/401 [00:04<11:33,  1.74s/it]training loss: 0.3801:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2995:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3489:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3158:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3159:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3234:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3658:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2946:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3349:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2657:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3535:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2733:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3374:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2958:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3491:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3419:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2759:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3857:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3116:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3062:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3471:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3386:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2709:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3068:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3184:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2987:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3690:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3516:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2809:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2722:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2899:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3764:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3132:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2876:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2990:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3029:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2357:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3656:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3373:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2538:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3361:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2955:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3210:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3323:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3531:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2840:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3392:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2641:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2882:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2843:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2827:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3006:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3145:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3319:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3123:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2810:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3326:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3127:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3500:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3077:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2821:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3084:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2767:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2823:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3048:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2702:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3431:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3086:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2778:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2701:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3132:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2789:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3380:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2566:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2486:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2890:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3077:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.3637:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2922:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2376:   1%|          | 3/401 [00:04<07:13,  1.09s/it]training loss: 0.2376:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2649:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2719:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3005:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2318:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3042:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3250:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2298:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3716:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3385:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3552:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3523:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3275:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2215:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3098:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3308:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2820:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3419:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2928:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2965:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3018:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3366:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3257:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2595:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3395:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3209:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2711:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3567:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2931:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2201:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2970:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3503:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2502:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3184:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2839:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2688:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2969:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2561:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3028:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2514:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2913:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3270:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3043:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3208:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2757:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3047:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3011:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3101:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2989:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3735:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3051:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2509:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2825:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3097:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2968:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2987:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3214:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3104:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3386:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3441:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3267:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3069:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3473:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2645:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2843:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2738:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.2733:   1%|          | 4/401 [00:04<05:09,  1.28it/s]training loss: 0.3393:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.2669:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.2695:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.3285:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.2904:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.3085:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.3331:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.2772:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.3514:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.2792:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.2576:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.3067:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.3508:   1%|          | 4/401 [00:05<05:09,  1.28it/s]training loss: 0.3508:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2744:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2847:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3297:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2528:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2197:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3150:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2847:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3645:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3277:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2572:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2832:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3406:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3120:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2631:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2652:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3439:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2829:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3267:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3924:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3266:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3118:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2727:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3026:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2636:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3240:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3140:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2548:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3355:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3169:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2885:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3363:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2812:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3346:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2649:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2932:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3384:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2861:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2487:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2733:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2719:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3044:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3205:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2783:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2632:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2541:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3381:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2978:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2987:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3200:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2895:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2777:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2495:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2913:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2674:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3103:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3129:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2974:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2985:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2648:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2352:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2854:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2902:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2843:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3207:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3110:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2349:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2738:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3415:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2502:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3473:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2840:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3024:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.3228:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2657:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2830:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2592:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2738:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2732:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2512:   1%|          | 5/401 [00:05<04:06,  1.61it/s]training loss: 0.2512:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3243:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2847:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.1928:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3185:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3071:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3098:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3133:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3011:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3408:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2789:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3515:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2803:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2425:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3017:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3454:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3000:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2914:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2814:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2304:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2815:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2912:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3012:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2426:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2742:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2958:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3277:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3158:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3147:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2314:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2741:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2538:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2447:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2571:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2748:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3112:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2707:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2313:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2886:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2563:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3373:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3290:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2947:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2904:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2947:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3264:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2591:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2922:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2955:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2572:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3181:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2551:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2381:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2866:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3331:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2345:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2359:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2656:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3358:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3640:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3503:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2683:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2664:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3813:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3217:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3334:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3326:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2686:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3222:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3412:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2496:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.3270:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2770:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2926:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2314:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2932:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2801:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2792:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.2411:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.1884:   1%|▏         | 6/401 [00:05<03:56,  1.67it/s]training loss: 0.1884:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3649:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2753:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3488:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3473:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2642:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2812:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2653:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2374:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3391:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2779:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3322:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2430:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2957:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3245:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2759:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3103:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3109:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.3008:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2587:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2879:   2%|▏         | 7/401 [00:05<03:19,  1.98it/s]training loss: 0.2753:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3231:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3050:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3186:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3208:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3108:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3189:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2336:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2963:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3360:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3469:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2767:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2099:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2790:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2887:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2707:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2430:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2837:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3021:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3407:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3003:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2700:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2595:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2731:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2532:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3108:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2845:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3891:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3443:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3002:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3045:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2800:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3120:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2416:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2318:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2756:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2989:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2663:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2960:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2658:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2466:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2747:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3388:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2816:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3090:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3070:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2526:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3110:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2785:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3127:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2973:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2905:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2456:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3156:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2663:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3121:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2266:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.2451:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3717:   2%|▏         | 7/401 [00:06<03:19,  1.98it/s]training loss: 0.3717:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3181:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3535:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3034:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2612:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2665:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3022:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2543:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2802:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2792:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3246:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3221:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3406:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2436:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2860:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3169:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3148:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3154:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2957:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2532:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2968:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2509:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2606:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3768:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2704:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2719:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2738:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2696:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3056:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3274:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2769:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2920:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3346:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3320:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2638:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3234:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3124:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2918:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2802:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3015:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2574:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2595:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3056:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2836:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2814:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2757:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3020:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2924:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2545:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3083:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3441:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3598:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2640:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2811:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2925:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2263:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2637:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2686:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2604:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2649:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2789:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2617:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2745:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2504:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2696:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2546:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3293:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3120:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2694:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3025:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2976:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2737:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2401:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3404:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2859:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3245:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2527:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2123:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.3204:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2806:   2%|▏         | 8/401 [00:06<02:54,  2.25it/s]training loss: 0.2806:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3052:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3127:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2745:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2735:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2894:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2690:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3309:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2482:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3440:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2515:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2537:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2700:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3275:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2996:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3538:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2900:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2742:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2811:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3461:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3088:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2443:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2998:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2826:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2703:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2817:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3120:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2801:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2604:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2687:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2270:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3155:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2598:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2696:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2866:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2226:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3341:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2571:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2741:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2613:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2633:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3534:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2597:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2254:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2946:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3054:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2534:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3408:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2139:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2741:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3136:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2686:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2222:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3262:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2745:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3073:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2850:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2266:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3056:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3084:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2219:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2933:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2547:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2874:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3157:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2749:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2769:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2736:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3039:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3116:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2650:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2358:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2857:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3599:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2794:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.2983:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3397:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3592:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3324:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3211:   2%|▏         | 9/401 [00:06<02:39,  2.46it/s]training loss: 0.3211:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2746:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.3140:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.3207:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.3644:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.3405:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2641:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2797:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.3191:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.3017:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2964:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2747:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2355:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2767:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2593:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2796:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2911:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2933:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.3584:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.3190:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2693:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2752:   2%|▏         | 10/401 [00:06<02:31,  2.58it/s]training loss: 0.2521:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2526:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2716:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2527:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3124:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2659:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2534:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2865:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2942:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3014:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2265:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2718:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2771:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2279:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3013:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2358:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3106:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2851:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3192:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2932:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3210:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3060:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2607:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2951:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2714:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3224:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2644:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2775:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2936:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2889:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3297:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3004:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2185:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2975:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3315:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3027:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2784:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2966:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2785:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2717:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3122:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2498:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3252:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2632:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3111:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3294:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3239:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2845:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3124:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2589:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2455:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3663:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2488:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.3584:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2916:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2786:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2994:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2096:   2%|▏         | 10/401 [00:07<02:31,  2.58it/s]training loss: 0.2096:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2966:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3248:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2472:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2998:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3073:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2572:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2768:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3049:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2752:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2931:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2955:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2165:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2269:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2881:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2795:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2631:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2611:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2537:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2733:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2776:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3254:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2304:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3145:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2903:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3438:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3216:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3089:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2800:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2406:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2817:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3029:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2986:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3247:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3146:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2893:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3124:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2882:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3208:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2828:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2741:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3259:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2858:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3040:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2443:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3138:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3217:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2859:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3115:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2965:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3052:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2896:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2518:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3659:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3188:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2476:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2517:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2480:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2546:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2854:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2565:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3130:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2262:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.2946:   3%|▎         | 11/401 [00:09<07:14,  1.11s/it]training loss: 0.3139:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2910:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2310:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2810:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2808:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.3258:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.3143:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2428:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.3078:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2871:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2775:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.3605:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2873:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2624:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.3083:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2301:   3%|▎         | 11/401 [00:10<07:14,  1.11s/it]training loss: 0.2301:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3111:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3560:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2729:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2831:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2325:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2816:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2791:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3006:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3629:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3359:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2914:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3561:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2685:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2819:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3340:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3254:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2688:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2648:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3069:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3341:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3421:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2593:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2651:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2717:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2559:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3287:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2832:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2564:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3173:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2351:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2502:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3084:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3297:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3398:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3158:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3347:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2764:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3343:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3146:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2826:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2827:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3118:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2740:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3180:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3250:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2934:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3462:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3181:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3095:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2870:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2887:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3016:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2787:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2656:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3095:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2745:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3012:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3201:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2967:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2723:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3425:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3043:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2801:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2482:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3624:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2286:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2824:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2688:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2681:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3239:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2932:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2617:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3140:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2969:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2435:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.2783:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3226:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3115:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3566:   3%|▎         | 12/401 [00:10<05:49,  1.11it/s]training loss: 0.3566:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2719:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2975:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2323:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2430:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2849:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3149:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2452:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2907:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3131:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3207:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2897:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2937:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3671:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2998:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3264:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3262:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2925:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3007:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3025:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3310:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3125:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2400:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2716:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2912:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3197:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2529:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3246:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3242:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.1802:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2954:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3532:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2714:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2402:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2346:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3038:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3047:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3036:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3342:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2891:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3400:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2889:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2278:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2797:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2825:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2727:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3205:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2603:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2912:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3693:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2841:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3110:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2811:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3382:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2888:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3402:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2806:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3214:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2974:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3008:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2539:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2662:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3087:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3240:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3209:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2667:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3129:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2385:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2826:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2463:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2535:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3006:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2744:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3044:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2737:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2587:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3063:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.2242:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3468:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3641:   3%|▎         | 13/401 [00:10<04:39,  1.39it/s]training loss: 0.3641:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3053:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3036:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2474:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3156:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2703:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3571:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2886:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2451:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3163:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2737:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2965:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2475:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3138:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3653:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2784:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2765:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3189:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2474:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2833:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2499:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2273:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3453:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2876:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3082:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2992:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2771:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2931:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2676:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2686:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2730:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3029:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2800:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3052:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2826:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2515:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2425:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3119:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2157:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3236:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2861:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2694:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2955:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3088:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2708:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2982:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2702:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2648:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2652:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2524:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2881:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2801:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2808:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2635:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3376:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2678:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2666:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3104:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2447:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2865:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2993:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2895:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2830:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2611:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2587:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2784:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3035:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3164:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2525:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2268:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3490:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2813:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2929:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2720:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.2717:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3227:   3%|▎         | 14/401 [00:10<03:51,  1.68it/s]training loss: 0.3580:   3%|▎         | 14/401 [00:11<03:51,  1.68it/s]training loss: 0.2602:   3%|▎         | 14/401 [00:11<03:51,  1.68it/s]training loss: 0.3117:   3%|▎         | 14/401 [00:11<03:51,  1.68it/s]training loss: 0.2874:   3%|▎         | 14/401 [00:11<03:51,  1.68it/s]training loss: 0.2874:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3003:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2869:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2852:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2617:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2863:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3401:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2816:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2713:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3130:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2718:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2644:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2479:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2560:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3454:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2866:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3090:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3191:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3438:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3382:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3062:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2402:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2770:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2796:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2590:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2595:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3186:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2746:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2795:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2908:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3313:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3142:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2836:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3404:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3557:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2356:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2628:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2609:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3311:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3329:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2786:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2696:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2806:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2692:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2625:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2688:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2896:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2592:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2098:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3168:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2785:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2703:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2218:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2721:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3349:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3228:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3154:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2932:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3007:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2719:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2999:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3659:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3095:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3117:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2651:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3116:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3226:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2937:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3127:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2290:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2897:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2605:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2929:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3317:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2951:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3307:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2929:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.3105:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2642:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2411:   4%|▎         | 15/401 [00:11<03:19,  1.94it/s]training loss: 0.2411:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3178:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3112:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3563:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2980:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3291:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2831:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2809:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3028:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2981:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2012:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2851:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3382:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2953:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2563:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2427:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2226:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2810:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2231:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2349:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2675:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2659:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2661:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3215:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2691:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2507:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2621:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3014:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2968:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2317:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2827:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3079:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2698:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2907:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3711:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2581:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2717:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3436:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2834:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3290:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3151:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3396:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3251:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2694:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2888:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2240:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2830:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2383:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3177:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2792:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3154:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3035:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2430:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3347:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2525:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3329:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2821:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2561:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2617:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3437:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2619:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3046:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2647:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2240:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2824:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2655:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2527:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2918:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2392:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2983:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2866:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2991:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2698:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2419:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2932:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2676:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.3258:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2909:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.2785:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.1982:   4%|▍         | 16/401 [00:11<02:54,  2.20it/s]training loss: 0.1982:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2875:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2337:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2899:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3328:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2828:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3194:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2771:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3381:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3117:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2838:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2889:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2659:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2814:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2183:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3518:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2616:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2719:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3393:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2885:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3715:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3436:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2958:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2863:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2667:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2690:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3082:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3430:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2672:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3138:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2650:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2472:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2813:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2604:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3338:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3072:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2897:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2756:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3330:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2673:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2842:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2661:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3293:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2629:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3136:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2857:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3729:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3187:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2507:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2512:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3462:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2880:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3464:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2717:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3666:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2896:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3073:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2923:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3186:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2962:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2086:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2530:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2976:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3222:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3191:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2566:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3333:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3263:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2991:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2899:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.2523:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3098:   4%|▍         | 17/401 [00:11<02:40,  2.39it/s]training loss: 0.3002:   4%|▍         | 17/401 [00:12<02:40,  2.39it/s]training loss: 0.3437:   4%|▍         | 17/401 [00:12<02:40,  2.39it/s]training loss: 0.3175:   4%|▍         | 17/401 [00:12<02:40,  2.39it/s]training loss: 0.2780:   4%|▍         | 17/401 [00:12<02:40,  2.39it/s]training loss: 0.2841:   4%|▍         | 17/401 [00:12<02:40,  2.39it/s]training loss: 0.3053:   4%|▍         | 17/401 [00:12<02:40,  2.39it/s]training loss: 0.3090:   4%|▍         | 17/401 [00:12<02:40,  2.39it/s]training loss: 0.2142:   4%|▍         | 17/401 [00:12<02:40,  2.39it/s]training loss: 0.2142:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2669:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2985:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3196:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2660:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3318:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2715:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2963:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2815:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2874:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3726:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2514:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3277:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3428:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3324:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2957:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2416:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2678:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2539:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3477:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2613:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2876:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2628:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2718:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2595:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2655:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2277:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2532:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2861:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2432:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2329:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2770:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2958:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2320:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2805:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2713:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2470:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2269:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3117:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2948:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3322:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2805:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2958:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3128:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2771:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2856:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3277:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2443:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3651:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2194:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3171:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2649:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2659:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2942:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3178:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2557:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2959:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2801:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3385:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2703:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3055:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2629:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3099:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3249:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2640:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3104:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2789:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3464:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2981:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2514:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2617:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2505:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3487:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2286:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2667:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3138:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2557:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2266:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.3360:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2690:   4%|▍         | 18/401 [00:12<02:34,  2.48it/s]training loss: 0.2690:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2765:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3055:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2814:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2743:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2976:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2692:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3277:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2532:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2946:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2816:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2906:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2441:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2682:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3121:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2961:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2783:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3030:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2968:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3308:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3175:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2990:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3454:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3013:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3417:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3258:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2669:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2732:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2552:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3206:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2737:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2652:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2984:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3117:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2724:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3015:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3064:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2762:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3252:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2995:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3274:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3005:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3063:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2826:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3106:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2542:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3041:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3138:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3295:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3458:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3182:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2671:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2381:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3222:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2776:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3084:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3083:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2519:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2786:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2731:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2924:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2979:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2901:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2231:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2396:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3444:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2713:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3225:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2459:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3300:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2668:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2239:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3465:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2793:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2709:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3016:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.2937:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3206:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3470:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3565:   5%|▍         | 19/401 [00:12<02:26,  2.61it/s]training loss: 0.3565:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3172:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2948:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3503:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2703:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2791:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3121:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2841:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3281:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2845:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2887:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3124:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2921:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3828:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3011:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2536:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3156:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2731:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2703:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2215:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2776:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2785:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2730:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2958:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3018:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2361:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2551:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3240:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2745:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3096:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3118:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2299:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3016:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2955:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2313:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2720:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2716:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2737:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3264:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2772:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3234:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2750:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2990:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2471:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2942:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2834:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3066:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3090:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2555:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.1987:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3801:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2893:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3159:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2950:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2761:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2280:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2548:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2285:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2844:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2743:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2784:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2673:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3221:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2985:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2623:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2850:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2857:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.3067:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2701:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2512:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2226:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2576:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2671:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2821:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2947:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2538:   5%|▍         | 20/401 [00:12<02:18,  2.75it/s]training loss: 0.2695:   5%|▍         | 20/401 [00:13<02:18,  2.75it/s]training loss: 0.2893:   5%|▍         | 20/401 [00:13<02:18,  2.75it/s]training loss: 0.2599:   5%|▍         | 20/401 [00:13<02:18,  2.75it/s]training loss: 0.3918:   5%|▍         | 20/401 [00:13<02:18,  2.75it/s]training loss: 0.3918:   5%|▌         | 21/401 [00:15<07:53,  1.25s/it]training loss: 0.2676:   5%|▌         | 21/401 [00:15<07:53,  1.25s/it]training loss: 0.2783:   5%|▌         | 21/401 [00:15<07:53,  1.25s/it]training loss: 0.3005:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2902:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3027:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2615:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2946:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2841:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3436:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2676:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3435:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2730:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3166:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2765:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2609:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2805:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3132:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3519:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2569:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2767:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2960:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2864:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2551:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2566:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2473:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2972:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2384:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2950:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2803:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2654:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3317:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2958:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3157:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3719:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2975:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2309:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2671:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2630:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2945:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2774:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2642:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2638:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3506:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2916:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2735:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2798:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2946:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2615:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2844:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2823:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2868:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2511:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2565:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2027:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3261:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3231:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2846:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2868:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2830:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3445:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3174:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2730:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2991:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3395:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2946:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2818:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2842:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2667:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2579:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2960:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2758:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2540:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2720:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2790:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3142:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3148:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2651:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.3165:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2935:   5%|▌         | 21/401 [00:16<07:53,  1.25s/it]training loss: 0.2935:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2395:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2586:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3091:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3364:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2426:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3118:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2693:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3060:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3340:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2790:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2921:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2605:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2888:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2652:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2370:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2824:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2705:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3071:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2695:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2493:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2572:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3181:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2421:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2497:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2955:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3087:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3280:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2870:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2280:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3179:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3015:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2986:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3448:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2686:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2584:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2927:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3398:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3274:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2374:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2759:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2952:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2242:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2955:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2671:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2996:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2781:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2806:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3387:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2821:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3092:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3223:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3448:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2730:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3176:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2878:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2640:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2965:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2279:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3199:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3028:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3054:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.3148:   5%|▌         | 22/401 [00:16<06:07,  1.03it/s]training loss: 0.2239:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3106:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3372:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3062:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3768:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.2750:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3015:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3215:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3108:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.2695:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3350:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.2469:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.2564:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.2780:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3056:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.3580:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.2201:   5%|▌         | 22/401 [00:17<06:07,  1.03it/s]training loss: 0.2201:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2922:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3877:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2635:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2789:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3259:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2636:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2963:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2425:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2767:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3058:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2857:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2913:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2883:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3079:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2899:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2712:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2626:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2804:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3059:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2337:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2743:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2674:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3064:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3458:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2557:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2467:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3326:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2607:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2916:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2828:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3573:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2886:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2664:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3025:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2485:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3232:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2655:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2532:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3223:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2204:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3116:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2541:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2507:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2687:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2410:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2694:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2761:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2853:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2081:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2594:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3169:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3082:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3081:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3323:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2393:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3085:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2621:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3108:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2925:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2538:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3414:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2075:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2432:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3011:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3173:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3167:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2538:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3106:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3076:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2652:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2549:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2732:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.3077:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2836:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2978:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2854:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2510:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2738:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2750:   6%|▌         | 23/401 [00:17<05:41,  1.11it/s]training loss: 0.2750:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2943:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3356:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3269:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3397:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3000:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2869:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3206:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3065:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2755:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2622:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3050:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3177:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2509:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2964:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2331:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2692:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2794:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2577:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2837:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3031:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3174:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2213:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2564:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2952:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2778:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2716:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2332:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2826:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2954:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2683:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2596:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2579:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3224:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3022:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3402:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2796:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2992:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3020:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3322:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2441:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3297:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2439:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2753:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2645:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2859:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3505:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2731:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2682:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2900:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2546:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2628:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2693:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3008:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3365:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3561:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2811:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2960:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2935:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2943:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2763:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2781:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2780:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2615:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2735:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3077:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2600:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2752:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2817:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3281:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2841:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3101:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3263:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2999:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2960:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2921:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3103:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.3096:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2431:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2733:   6%|▌         | 24/401 [00:17<05:02,  1.25it/s]training loss: 0.2733:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2896:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2520:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2581:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2728:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2908:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2851:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.3097:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.3049:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2451:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.3061:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.3008:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2513:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2842:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2266:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2862:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2818:   6%|▌         | 25/401 [00:17<04:05,  1.53it/s]training loss: 0.2718:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2814:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2825:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3118:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3075:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3210:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2906:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2694:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3033:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2510:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2927:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3020:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2608:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2437:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3251:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2827:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3243:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2268:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2805:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2953:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2609:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2450:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3072:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2459:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3070:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3116:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2558:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2777:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3117:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3283:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3171:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2667:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3604:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2652:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2491:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3201:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3053:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2344:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3400:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3309:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.1988:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2641:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2397:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3070:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2606:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2657:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3547:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2908:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2702:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2776:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3817:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2617:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2787:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2510:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3112:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2563:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3116:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3113:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2308:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3176:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3001:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.3094:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2586:   6%|▌         | 25/401 [00:18<04:05,  1.53it/s]training loss: 0.2586:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2963:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2524:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3389:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3452:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2999:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3250:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2824:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3393:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2627:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2408:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2739:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2613:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3192:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2537:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3125:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2320:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3251:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2248:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3049:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3290:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2476:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2991:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2510:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2971:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2930:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3423:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3571:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2810:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3210:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2985:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2920:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3095:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2487:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2843:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2349:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2696:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2647:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3152:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2973:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2816:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3142:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2908:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2989:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2943:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3278:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2786:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2780:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2173:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2942:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3146:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2689:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3309:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2935:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2375:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3136:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3111:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3210:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2796:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2124:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2796:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2299:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3026:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2749:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3042:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2963:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2603:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2891:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2418:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3123:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2667:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2810:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3494:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3208:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2838:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3144:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2907:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2196:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.2878:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3133:   6%|▋         | 26/401 [00:18<03:26,  1.81it/s]training loss: 0.3133:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2986:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3489:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2698:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3307:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2439:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2889:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3027:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2446:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2830:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2792:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3163:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3148:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3153:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3267:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3092:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3139:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2862:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2642:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2665:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2383:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2971:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2830:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3332:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2778:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2570:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2846:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2722:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2516:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2562:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2428:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2808:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2524:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3099:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3068:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2902:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2316:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3176:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3757:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2933:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3243:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2573:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3601:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3164:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2981:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2910:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2487:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2397:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2848:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2341:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2990:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2892:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2596:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2448:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3309:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2704:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2944:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.3197:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2818:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2707:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2781:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2926:   7%|▋         | 27/401 [00:18<03:04,  2.03it/s]training loss: 0.2590:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.3346:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2957:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2630:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.3020:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2630:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2944:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.3424:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2500:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2670:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2728:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2745:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2883:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2661:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2904:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.3747:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2671:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2601:   7%|▋         | 27/401 [00:19<03:04,  2.03it/s]training loss: 0.2601:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2792:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3070:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2713:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3054:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2851:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2648:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3487:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2603:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2591:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2712:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3616:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3223:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2756:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2417:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2410:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2883:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2725:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3050:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2679:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2505:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2840:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2446:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2655:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2696:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3341:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.4335:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2976:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2973:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2608:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3402:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2743:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2810:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2799:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3006:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2484:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2629:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2842:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3221:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2857:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3446:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2502:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2319:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2575:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3218:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3002:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2826:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3180:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3644:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2980:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2469:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2664:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2846:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2784:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2882:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3268:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2653:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2584:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2936:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2957:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3296:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3066:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2633:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3301:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2557:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2927:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3354:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2922:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2426:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2665:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3700:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3313:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2820:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2729:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2633:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2462:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.3401:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2835:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2586:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2954:   7%|▋         | 28/401 [00:19<03:35,  1.73it/s]training loss: 0.2954:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2427:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2940:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2743:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2458:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2491:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2827:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3120:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3371:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2698:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2925:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2964:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3224:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3130:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2375:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2715:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2630:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3242:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2781:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2685:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2776:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3255:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3082:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3132:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2821:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2794:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3241:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2518:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2832:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2569:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2588:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3061:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2835:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2861:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3156:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3582:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3026:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3345:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3064:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2574:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3541:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3592:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2660:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2842:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2301:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2600:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3118:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3126:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3152:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2815:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2804:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2846:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3026:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2827:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2576:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3391:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3512:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2638:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2659:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3041:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2657:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3301:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3220:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2912:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3099:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3218:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3199:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3001:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2851:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2994:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2900:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2693:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3656:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.3374:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2743:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2758:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2830:   7%|▋         | 29/401 [00:19<03:05,  2.00it/s]training loss: 0.2424:   7%|▋         | 29/401 [00:20<03:05,  2.00it/s]training loss: 0.2272:   7%|▋         | 29/401 [00:20<03:05,  2.00it/s]training loss: 0.2278:   7%|▋         | 29/401 [00:20<03:05,  2.00it/s]training loss: 0.2278:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2904:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2653:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2773:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2949:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3112:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2256:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3102:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3109:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2925:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3046:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2353:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2956:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2651:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3044:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3064:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2766:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2832:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2919:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2990:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2841:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2772:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3197:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3089:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2800:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3153:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2646:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2831:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2661:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2683:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3016:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3119:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2774:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3260:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2658:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2694:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2842:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2685:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3462:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2920:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2906:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3200:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3139:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2828:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3499:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3347:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2905:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3254:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2922:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3283:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3340:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2652:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2606:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3476:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2805:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2931:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2370:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2731:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3220:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3190:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2839:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2648:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2672:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3154:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3029:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2588:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3262:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2539:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3293:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2987:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2810:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2380:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3284:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2827:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2451:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2904:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.2822:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3479:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.3148:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.1882:   7%|▋         | 30/401 [00:20<02:44,  2.26it/s]training loss: 0.1882:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2768:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2849:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2314:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3286:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2779:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2513:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3066:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2870:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2999:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2851:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3064:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3392:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2803:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2921:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2278:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2701:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2443:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2897:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2937:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2797:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3520:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2818:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2961:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2485:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3249:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2499:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2641:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2938:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2994:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2764:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2856:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2705:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2883:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2770:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3236:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2713:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2582:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2314:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2499:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.1840:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3131:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3058:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2776:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3143:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3090:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2458:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2495:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3021:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3235:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2598:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2784:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3264:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2930:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2981:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3243:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3052:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3380:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3024:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3048:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2722:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2657:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.3268:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2423:   8%|▊         | 31/401 [00:22<06:58,  1.13s/it]training loss: 0.2942:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2467:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2309:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2774:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2430:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2881:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2997:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.3077:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2557:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2535:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2809:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2443:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2700:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2842:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.3220:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2497:   8%|▊         | 31/401 [00:23<06:58,  1.13s/it]training loss: 0.2497:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3286:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2539:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3391:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3171:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2180:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2492:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2374:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3031:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2697:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2974:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2685:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2862:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3300:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3325:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2458:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3279:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2823:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2786:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2801:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3068:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2414:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2896:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3259:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3170:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2752:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2896:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2949:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2818:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2371:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2511:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3517:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3345:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2643:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3095:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2540:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3010:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3033:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3207:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3051:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2647:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2970:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2608:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2761:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3268:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2882:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2822:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3059:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2484:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2625:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2767:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2720:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2675:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3127:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2698:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3452:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2335:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2899:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2623:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3607:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2833:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2847:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2711:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2548:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3439:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2599:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2764:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3574:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2872:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2829:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2839:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.4136:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2921:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2840:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2834:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2730:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2663:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2647:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.2641:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3842:   8%|▊         | 32/401 [00:23<05:26,  1.13it/s]training loss: 0.3842:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2472:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2541:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2897:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2472:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2450:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2703:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2556:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2584:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2871:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2836:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2474:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3103:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2766:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2764:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2427:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3075:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2521:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2642:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2558:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2831:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2517:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2438:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2528:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2625:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2955:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2564:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2575:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2594:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2820:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2252:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3317:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2693:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3147:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3325:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2581:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2984:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3093:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2756:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2880:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2474:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2479:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3091:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2996:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2563:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3033:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3238:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3123:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3087:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2361:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2820:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2454:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2968:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2335:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2724:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2892:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2703:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2886:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2962:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2915:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2868:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2399:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3107:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2940:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2632:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2430:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2709:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2615:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2867:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2926:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2876:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2852:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3058:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2479:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2378:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2603:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2607:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.2801:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.3143:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.4035:   8%|▊         | 33/401 [00:23<04:22,  1.40it/s]training loss: 0.4035:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2945:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3132:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3196:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2919:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2852:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2667:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2686:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2312:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3000:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2997:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3036:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2703:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2708:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2138:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2236:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3139:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2802:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3209:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2614:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2851:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3564:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2812:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3093:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2898:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2808:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2387:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3076:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2719:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2805:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2201:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2094:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2598:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3497:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3344:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2954:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3160:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3419:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3380:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2510:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3062:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3204:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3175:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2590:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2576:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3180:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3162:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3288:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2591:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2869:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2885:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2944:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2879:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3430:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2456:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3301:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3252:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2754:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2552:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2752:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2903:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2567:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2715:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3414:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2793:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3399:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2824:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2467:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2743:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2865:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2930:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2142:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3332:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2950:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2981:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.2636:   8%|▊         | 34/401 [00:23<03:37,  1.69it/s]training loss: 0.3262:   8%|▊         | 34/401 [00:24<03:37,  1.69it/s]training loss: 0.2967:   8%|▊         | 34/401 [00:24<03:37,  1.69it/s]training loss: 0.2376:   8%|▊         | 34/401 [00:24<03:37,  1.69it/s]training loss: 0.1993:   8%|▊         | 34/401 [00:24<03:37,  1.69it/s]training loss: 0.1993:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2974:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2846:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3040:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2686:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3177:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3034:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2652:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2817:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3326:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3026:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2886:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2726:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2998:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3012:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2645:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2712:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2801:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3033:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2531:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2350:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2563:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2653:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3267:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2890:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2832:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3375:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2507:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2893:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3234:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3477:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2876:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2886:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2648:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2818:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2475:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3473:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3028:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2645:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2649:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3147:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2757:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3025:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3028:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3107:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2885:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2471:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3027:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2764:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3200:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2890:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3730:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2701:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2854:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2794:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2778:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2849:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3101:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2719:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3075:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3106:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2550:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2804:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2487:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2868:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3020:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2308:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3053:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3252:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3468:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2786:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2784:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3442:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2747:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2806:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.3097:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2158:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2804:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.2759:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.4362:   9%|▊         | 35/401 [00:24<03:08,  1.94it/s]training loss: 0.4362:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2766:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2956:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2878:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3339:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2924:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2646:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2280:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2466:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3059:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3100:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3071:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2777:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2580:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3097:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2225:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2669:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3030:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2727:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2979:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2645:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2981:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2919:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2458:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2729:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2932:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2940:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3338:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3830:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2863:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3081:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2990:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2929:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2968:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2621:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2802:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2869:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3038:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2915:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2099:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3167:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2852:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3088:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2834:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2817:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3192:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2798:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2328:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3200:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3021:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3695:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2882:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3552:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3162:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2887:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3160:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3673:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2828:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2762:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3427:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3310:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2888:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3280:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2536:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2659:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3272:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2659:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3043:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3173:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3642:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3041:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2739:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3082:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2785:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3214:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3537:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.4212:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3425:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.2683:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3445:   9%|▉         | 36/401 [00:24<03:00,  2.02it/s]training loss: 0.3445:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2556:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3023:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2777:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2473:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2804:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3372:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2260:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3019:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2377:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2543:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2610:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2469:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2599:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2553:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2281:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2529:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2930:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3173:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2647:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2468:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3438:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3118:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2578:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3344:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3201:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2996:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2718:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2626:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2637:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2855:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3131:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3099:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3108:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3076:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2442:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3090:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2731:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3101:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2529:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2573:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2644:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2473:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3054:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2699:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2451:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.4009:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2666:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2760:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2954:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3175:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.2685:   9%|▉         | 37/401 [00:24<02:40,  2.27it/s]training loss: 0.3018:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.3367:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.3145:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2850:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2949:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.3114:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.3751:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2870:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.3063:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2566:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2764:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2896:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.3082:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.3459:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2293:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2381:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2500:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2715:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2682:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2692:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.3140:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2626:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2533:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2998:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2825:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2886:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.2595:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.1799:   9%|▉         | 37/401 [00:25<02:40,  2.27it/s]training loss: 0.1799:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2949:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2685:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3150:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3342:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2770:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2763:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2737:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2959:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2869:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2629:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2317:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3397:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2633:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2699:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2793:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3193:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2889:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2730:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2748:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2605:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2791:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2802:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2936:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3450:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2725:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2688:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2696:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2634:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2904:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3038:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2858:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2957:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3061:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2251:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2767:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2559:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2565:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2570:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3240:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2554:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2375:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2829:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3224:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2532:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2967:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2393:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2918:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2796:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2412:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3102:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2517:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2713:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3015:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2676:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2512:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2706:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2787:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2836:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2797:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2534:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2684:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3562:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2624:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2870:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2897:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2748:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2750:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2526:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2650:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2920:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2565:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2703:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3307:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2520:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2623:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2836:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.3316:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.2843:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.1699:   9%|▉         | 38/401 [00:25<02:28,  2.45it/s]training loss: 0.1699:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2916:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2565:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3367:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2223:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2757:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2947:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3008:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2780:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3260:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2502:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2792:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2219:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2901:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3258:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2750:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3435:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2784:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2798:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2835:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2579:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2723:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2684:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2326:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2896:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3138:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3047:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2452:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2767:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3049:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2910:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2515:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2628:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2401:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2368:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3058:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3128:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2860:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3693:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3322:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2276:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2279:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3052:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2823:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2570:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2596:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2579:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2759:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2553:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3209:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3507:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3277:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3038:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2592:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3104:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2479:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2491:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3647:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2744:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2866:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3727:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2396:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2980:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2768:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2754:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3544:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2229:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3586:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3055:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2830:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2753:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2672:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2670:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2805:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2649:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2444:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.3332:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2919:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2821:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2464:  10%|▉         | 39/401 [00:25<02:18,  2.62it/s]training loss: 0.2464:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2600:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2989:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3032:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2522:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2600:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2432:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3025:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2751:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3532:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2745:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2953:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2856:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3000:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2821:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3086:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3231:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2981:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2628:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2230:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2486:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3139:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2901:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2824:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3158:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3881:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2925:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3014:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2781:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2733:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2478:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3037:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3135:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3332:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2915:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2993:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2633:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2833:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3067:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2844:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3213:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2534:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3158:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3344:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2720:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3212:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2340:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2620:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2653:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2833:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2659:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2714:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.1965:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2951:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2234:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3251:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2477:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2568:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3673:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3060:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3282:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.3453:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2798:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2634:  10%|▉         | 40/401 [00:25<02:10,  2.77it/s]training loss: 0.2564:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.3222:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2321:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2900:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2801:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2889:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2515:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2901:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2388:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2996:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.3109:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.3162:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2288:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.2750:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.3066:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.3605:  10%|▉         | 40/401 [00:26<02:10,  2.77it/s]training loss: 0.3605:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2453:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2832:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.3392:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2913:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2659:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.3401:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2585:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2407:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2914:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2689:  10%|█         | 41/401 [00:28<07:17,  1.22s/it]training loss: 0.2703:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2837:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3241:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2949:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3019:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3357:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3013:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2610:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2700:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2964:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2936:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2942:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2550:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2753:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2682:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2722:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3018:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2805:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2554:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3145:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2338:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2563:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2912:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3040:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2919:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3047:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2516:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3129:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2608:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3680:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3039:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2647:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3093:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2327:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2599:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2430:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2475:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2799:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2821:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2853:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3225:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3489:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2927:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2911:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2958:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2873:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2820:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3183:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3261:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3142:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2509:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2773:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2448:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3060:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3118:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3166:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.3037:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2469:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2789:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2645:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2296:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2247:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2901:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2557:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2998:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2984:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2490:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.2733:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.1883:  10%|█         | 41/401 [00:29<07:17,  1.22s/it]training loss: 0.1883:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3285:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2519:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2883:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3028:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2582:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3596:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2952:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2621:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2693:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3628:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3250:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3058:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2473:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2994:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2447:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3007:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2925:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3043:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2172:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2297:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2866:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2669:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2758:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3523:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2642:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2084:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2670:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2842:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2743:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2538:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3386:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2862:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3538:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2495:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2790:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2987:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2420:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2574:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2916:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3071:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2720:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3268:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2467:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2995:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2980:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2934:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2626:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2770:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2966:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3451:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3011:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3197:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2134:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2454:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2839:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2801:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3101:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3431:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2563:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2898:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2519:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3103:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2534:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2706:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3326:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2697:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2307:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2592:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2888:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3001:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2195:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2364:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2577:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3063:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3084:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.3193:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2638:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2887:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2973:  10%|█         | 42/401 [00:29<05:41,  1.05it/s]training loss: 0.2973:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2401:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.3019:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2621:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.3281:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2789:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2544:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.3216:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.3529:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2730:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2880:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2426:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2665:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.3266:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2366:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.3193:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2257:  11%|█         | 43/401 [00:29<04:32,  1.31it/s]training loss: 0.2788:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2728:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3409:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2630:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3257:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2974:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2792:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2803:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3510:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2729:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2900:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2394:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2750:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2779:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2972:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2814:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2887:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3260:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3514:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2824:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2799:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3355:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2507:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2896:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3068:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2360:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2987:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3352:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2887:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2592:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2588:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3011:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2822:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2973:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2936:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3041:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2552:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3002:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2856:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2734:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2576:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2365:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3174:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2392:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2659:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3716:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3111:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2755:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2487:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2614:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2717:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2752:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2845:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2288:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2753:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2469:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3389:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2482:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.3194:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2627:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2465:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2449:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2739:  11%|█         | 43/401 [00:30<04:32,  1.31it/s]training loss: 0.2739:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2170:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2919:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2999:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2449:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2653:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2758:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2837:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3070:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2950:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2613:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2414:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3021:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3162:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3057:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2932:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2771:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3142:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3053:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3014:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2561:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2884:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2598:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2989:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2980:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2208:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2919:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2613:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2578:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3014:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2809:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2864:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2923:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2878:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2362:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2463:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2701:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2706:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2390:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2507:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2716:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.3022:  11%|█         | 44/401 [00:30<05:22,  1.11it/s]training loss: 0.2910:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2479:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2458:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2722:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2895:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3206:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2407:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2803:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2766:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2690:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2389:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2693:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2551:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3504:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3014:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2150:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2723:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2963:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3204:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2985:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2839:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2314:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3008:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3143:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2528:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2267:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3108:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2245:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3624:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2982:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2863:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.3143:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2569:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2312:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2511:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2817:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2972:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2336:  11%|█         | 44/401 [00:31<05:22,  1.11it/s]training loss: 0.2336:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2779:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3045:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3168:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2299:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2419:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2316:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2801:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3010:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2651:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3247:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3127:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2857:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2149:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2964:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2319:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2597:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2833:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2717:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2565:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3128:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3315:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2267:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2909:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2753:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2729:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2896:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3167:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2403:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2495:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2690:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2891:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2796:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3210:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2762:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2602:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2439:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2632:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3242:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2500:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2989:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2517:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2763:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2578:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2139:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3198:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3004:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2504:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2700:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3075:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2291:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3442:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2931:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3373:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2832:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2977:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2789:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2583:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2597:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2764:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2888:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3238:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2660:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2501:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2968:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3157:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2520:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2384:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3174:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2384:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2569:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2827:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2288:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2608:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2633:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2938:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2964:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2721:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.3041:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2060:  11%|█         | 45/401 [00:31<04:17,  1.38it/s]training loss: 0.2060:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2608:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2548:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3359:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2989:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2543:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2712:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2988:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2640:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3238:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2716:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2700:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3052:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3128:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2478:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2644:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2934:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3004:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3311:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2731:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2819:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3497:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3280:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2702:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3145:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2612:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2694:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2909:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2784:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2608:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2957:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2726:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3385:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2748:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2726:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2508:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3287:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2946:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3168:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3200:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3016:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2494:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2861:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2871:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2961:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2801:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2996:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2411:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2551:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2911:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3109:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3077:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3325:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2749:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2923:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2498:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2761:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2408:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2894:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3440:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2865:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2642:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2558:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2777:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2775:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2861:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2744:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3182:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2897:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2846:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2639:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2505:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3366:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2753:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2692:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2720:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2390:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.2352:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3268:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3258:  11%|█▏        | 46/401 [00:31<03:33,  1.66it/s]training loss: 0.3258:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2331:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3362:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2860:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2796:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2807:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3459:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3235:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3458:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2713:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2552:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3806:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2752:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3406:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2194:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2478:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2947:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3443:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2757:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2852:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3076:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2828:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2733:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2438:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3321:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2716:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2917:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2955:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2659:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2716:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2863:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3065:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2764:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2961:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3407:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2739:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2601:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2968:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2682:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2491:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3035:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2973:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3488:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2685:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2629:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3202:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3371:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3216:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2862:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2619:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2946:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3121:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2721:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3095:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2869:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.2718:  12%|█▏        | 47/401 [00:31<03:02,  1.94it/s]training loss: 0.3355:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2583:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2800:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.3567:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2580:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2653:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.3117:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2643:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2871:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2578:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.3434:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2578:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2893:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2722:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2822:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2841:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.3224:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2442:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2804:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2868:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2834:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2485:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2599:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2895:  12%|█▏        | 47/401 [00:32<03:02,  1.94it/s]training loss: 0.2895:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3081:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2831:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2688:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2537:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2745:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2690:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2809:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2632:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2986:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3234:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3174:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2834:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2844:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3653:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2532:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2663:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3659:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2677:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2819:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3148:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2584:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3238:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3186:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2555:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3460:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2877:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2691:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2831:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3127:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3655:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2576:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2969:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3081:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2982:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3100:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2704:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3185:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2830:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2689:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3293:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3285:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2651:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2405:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2943:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2730:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3062:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2869:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2676:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2161:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.1887:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2485:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2970:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3043:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2644:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2641:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2530:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2383:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2534:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2857:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3057:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2377:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2649:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2679:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3322:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2467:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2524:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2990:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2573:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2628:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3019:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2278:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3134:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2653:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.3056:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2873:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2259:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2505:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.2442:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.4119:  12%|█▏        | 48/401 [00:32<02:40,  2.19it/s]training loss: 0.4119:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2593:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2872:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2606:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2487:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3358:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2802:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3158:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2674:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3308:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2886:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2596:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2574:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2612:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3157:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3002:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2295:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2488:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3108:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2953:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3050:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3831:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3020:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3227:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2710:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3128:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3579:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2900:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3051:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2767:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3020:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2845:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2787:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3158:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2907:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2871:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3150:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2562:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3137:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3371:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2783:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2501:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3424:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2292:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2969:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2803:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2762:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2628:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3504:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2618:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2872:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3371:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2770:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2657:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2810:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2109:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3215:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3408:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2807:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2986:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2565:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2969:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3375:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2882:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2682:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3109:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2633:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2704:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2739:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3088:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3730:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2846:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2339:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3435:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3388:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.3410:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2979:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2984:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.2732:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.1423:  12%|█▏        | 49/401 [00:32<02:27,  2.39it/s]training loss: 0.1423:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3726:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3115:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2839:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2593:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2408:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3243:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3014:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2659:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3118:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2537:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2873:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2717:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3057:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2860:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3127:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2248:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2939:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2315:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2647:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2391:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3167:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3282:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3188:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2548:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2356:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2605:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3487:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2666:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2806:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3067:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2277:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2845:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2958:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2278:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2909:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2650:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2568:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3153:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2617:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2737:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2763:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2962:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3005:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3385:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3147:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2717:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2705:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2698:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2139:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2661:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2699:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2617:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2310:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2840:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2819:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3094:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3518:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2508:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3191:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3329:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2489:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2817:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2512:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.3122:  12%|█▏        | 50/401 [00:32<02:15,  2.58it/s]training loss: 0.2993:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.2617:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.2647:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.2638:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.2870:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.2421:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.3505:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.2474:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.2927:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.3279:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.3019:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.3338:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.3336:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.2615:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.3070:  12%|█▏        | 50/401 [00:33<02:15,  2.58it/s]training loss: 0.3070:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3363:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2601:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2779:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3264:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2560:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2406:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3439:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3007:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2680:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2992:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2890:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3263:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2833:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2765:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2950:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2898:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2969:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3355:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3209:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2640:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3102:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3129:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2649:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2890:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3089:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2888:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2395:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3082:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2634:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3362:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2961:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.1990:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3318:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3132:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2803:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3395:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3104:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3137:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3622:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3156:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2745:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2306:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2732:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2412:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2571:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2527:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2730:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3069:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2943:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2783:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3354:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2566:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2422:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3281:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3167:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2498:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2536:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2844:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2726:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2532:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3661:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3703:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2796:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2975:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3076:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3123:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3227:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2622:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2893:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2961:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2829:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2484:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3051:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2918:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3128:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2730:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2774:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.2603:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3138:  13%|█▎        | 51/401 [00:35<06:13,  1.07s/it]training loss: 0.3138:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2707:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3260:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3277:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3671:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2939:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2509:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3140:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3508:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3003:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2126:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2296:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3218:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2483:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2740:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2819:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3217:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2764:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2821:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3134:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3134:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2941:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3159:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2677:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2832:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3339:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2846:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2546:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3184:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3039:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3077:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2893:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3170:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2384:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2519:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2965:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2467:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3702:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2745:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2336:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2372:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2018:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3158:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2393:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2721:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2817:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2433:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2762:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2486:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2567:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2667:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2887:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3005:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2568:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2916:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2674:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2975:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2634:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2520:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2676:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3446:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2772:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2678:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2896:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2708:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2718:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2648:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3047:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2936:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.3201:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2861:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2461:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2683:  13%|█▎        | 52/401 [00:35<04:53,  1.19it/s]training loss: 0.2504:  13%|█▎        | 52/401 [00:36<04:53,  1.19it/s]training loss: 0.2810:  13%|█▎        | 52/401 [00:36<04:53,  1.19it/s]training loss: 0.2447:  13%|█▎        | 52/401 [00:36<04:53,  1.19it/s]training loss: 0.3155:  13%|█▎        | 52/401 [00:36<04:53,  1.19it/s]training loss: 0.3365:  13%|█▎        | 52/401 [00:36<04:53,  1.19it/s]training loss: 0.3552:  13%|█▎        | 52/401 [00:36<04:53,  1.19it/s]training loss: 0.1915:  13%|█▎        | 52/401 [00:36<04:53,  1.19it/s]training loss: 0.1915:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3022:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2462:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2594:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2723:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3145:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2634:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2788:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2694:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3244:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2852:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2524:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2598:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2729:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2896:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2948:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2586:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2779:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2587:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2851:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2809:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2791:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3250:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2924:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3254:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2812:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3350:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2734:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3078:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3121:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2985:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2741:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2481:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2737:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2549:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2158:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3803:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2837:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2232:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2000:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2351:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2369:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2672:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2711:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2674:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3394:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2579:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2626:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2657:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2913:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2674:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2641:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3194:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2886:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2568:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2611:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3110:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2768:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2801:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3428:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2208:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3458:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2447:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2728:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2528:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2709:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2809:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2586:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3125:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3140:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2180:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2307:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2549:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3003:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2379:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3250:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.3142:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2501:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.2658:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.1464:  13%|█▎        | 53/401 [00:36<03:57,  1.46it/s]training loss: 0.1464:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3126:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2450:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2248:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2373:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3183:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2517:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2477:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3232:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3133:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2776:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2727:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2670:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2817:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3283:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2910:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2462:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3239:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3143:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2736:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2550:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2871:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2415:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2994:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2573:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3564:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2593:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2855:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2783:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2955:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3358:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2784:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2337:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3325:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3319:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2332:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.4037:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2698:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2272:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3589:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2705:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2209:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2042:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2775:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2183:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2596:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2970:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2519:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2785:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2869:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3270:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2796:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2843:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3137:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2933:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3747:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2581:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2454:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3359:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2648:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2516:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2959:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3667:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2544:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2543:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2671:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2731:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2854:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3071:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2578:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3331:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2497:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2804:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2666:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2734:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3137:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2272:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2281:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.3038:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2647:  13%|█▎        | 54/401 [00:36<03:23,  1.71it/s]training loss: 0.2647:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2569:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2648:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2560:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2622:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2459:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2445:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2038:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2451:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2337:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2500:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2704:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2654:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3188:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2665:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2270:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2891:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2661:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3178:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2761:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2791:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3091:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2502:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3306:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2182:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2854:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3212:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2973:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2463:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2870:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2554:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2506:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3594:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2670:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2835:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2897:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2967:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2892:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2812:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2746:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3138:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3052:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2901:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3360:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2703:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2148:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2858:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2907:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2694:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3394:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2954:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2693:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2773:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2591:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2848:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3320:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2852:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3486:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2926:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2718:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3231:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3089:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2366:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3673:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3044:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2615:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3416:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2615:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2742:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.3208:  14%|█▎        | 55/401 [00:36<02:56,  1.96it/s]training loss: 0.2737:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.2377:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.2513:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.2372:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.2914:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.3013:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.2720:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.2666:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.2768:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.1821:  14%|█▎        | 55/401 [00:37<02:56,  1.96it/s]training loss: 0.1821:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2708:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2857:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2559:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2702:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2875:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2651:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2672:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3109:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2511:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3273:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2957:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3384:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2936:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2436:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2390:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2802:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2925:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2869:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2821:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2672:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3506:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3397:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2734:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2487:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2821:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2960:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3181:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2521:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2661:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2834:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3631:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2279:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3081:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2400:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2823:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3148:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2418:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2735:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2536:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3488:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2891:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3262:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2647:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3227:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2932:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2850:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2852:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3123:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3078:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2998:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2572:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2905:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3024:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2806:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2573:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3708:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3219:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2854:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2689:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3055:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2633:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2674:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3077:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2982:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2868:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2269:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2792:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2590:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3502:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2556:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2727:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2293:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2816:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2657:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2544:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2787:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.2927:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.3173:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.4347:  14%|█▍        | 56/401 [00:37<02:36,  2.20it/s]training loss: 0.4347:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3630:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2858:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2254:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2496:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2890:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2921:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2390:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2815:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2299:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2162:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3347:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2946:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3076:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3226:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2704:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3258:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2809:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2818:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3380:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2992:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2246:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3220:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2854:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3132:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2401:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2769:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2343:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2768:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2810:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3114:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3247:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2938:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2683:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2698:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2729:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2933:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2788:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2872:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2705:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2766:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2766:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3033:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3361:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2956:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2296:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2876:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3323:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2389:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2984:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3022:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2737:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3299:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2785:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2713:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2776:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2863:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2802:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3168:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2925:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2373:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3363:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2228:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2768:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3319:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3482:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2565:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3222:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3060:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2854:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2713:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3097:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2984:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2757:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3040:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3260:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3664:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.3230:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2829:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2829:  14%|█▍        | 57/401 [00:37<02:21,  2.43it/s]training loss: 0.2829:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3139:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2471:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2588:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2645:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2746:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3056:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2035:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3065:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3025:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2564:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2902:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2811:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3099:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2850:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2693:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2901:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3032:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2589:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3047:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2503:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2441:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3131:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3042:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2510:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2905:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2889:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2626:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2794:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2708:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3212:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2698:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2431:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2871:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2998:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2765:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2788:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2776:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2715:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2722:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2187:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2873:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2908:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3343:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3084:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2363:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2323:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2757:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2346:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2812:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2717:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2349:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2563:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3415:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3016:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3251:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2827:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3083:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3000:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3019:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2638:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2598:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2351:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3176:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2403:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3244:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3032:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2185:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2362:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2623:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2961:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3302:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2520:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.3212:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2927:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2767:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2676:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2735:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2338:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2021:  14%|█▍        | 58/401 [00:37<02:11,  2.62it/s]training loss: 0.2021:  15%|█▍        | 59/401 [00:37<02:04,  2.76it/s]training loss: 0.3152:  15%|█▍        | 59/401 [00:37<02:04,  2.76it/s]training loss: 0.3488:  15%|█▍        | 59/401 [00:37<02:04,  2.76it/s]training loss: 0.3007:  15%|█▍        | 59/401 [00:37<02:04,  2.76it/s]training loss: 0.2552:  15%|█▍        | 59/401 [00:37<02:04,  2.76it/s]training loss: 0.3325:  15%|█▍        | 59/401 [00:37<02:04,  2.76it/s]training loss: 0.3364:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2949:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2641:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2852:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2955:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2873:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2854:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3003:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2435:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2969:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2777:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2431:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2447:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3277:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2698:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3052:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2436:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3615:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2727:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2956:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3202:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2433:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3620:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2935:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2713:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3151:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3214:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2724:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2855:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2928:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2810:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3273:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2492:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2531:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3206:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2844:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2559:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2994:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2901:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2340:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3045:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3058:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3098:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3030:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3211:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2887:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2785:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3699:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3147:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2434:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3003:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3214:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3472:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2651:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2760:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2816:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2590:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2249:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3026:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2875:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2407:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2741:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2818:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2816:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2942:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2931:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2464:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2845:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2933:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2574:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2132:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2638:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.2910:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3291:  15%|█▍        | 59/401 [00:38<02:04,  2.76it/s]training loss: 0.3291:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2678:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3363:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2678:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3141:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2965:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3189:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2725:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3696:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3176:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2955:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3092:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2875:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2925:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2776:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3174:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2585:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3271:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2952:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2315:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2523:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2617:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2849:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3007:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2801:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2376:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3040:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3071:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2565:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3316:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2780:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2598:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3340:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2428:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3147:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3348:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3128:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3038:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2815:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2298:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3579:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2824:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3064:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2320:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2638:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2323:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2610:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2904:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2484:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2568:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2750:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2722:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2926:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2401:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3141:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2600:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3111:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2335:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2766:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3001:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2656:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2904:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2843:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2392:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2819:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2564:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2789:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3776:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2473:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3110:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2380:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2575:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2414:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3166:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2704:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3166:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3053:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2520:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.2303:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3204:  15%|█▍        | 60/401 [00:38<02:22,  2.39it/s]training loss: 0.3204:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3059:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2515:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2694:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2768:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2601:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2660:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2831:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2046:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2703:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2684:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2561:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3592:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2781:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3561:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2581:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2767:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2984:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3144:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3284:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3329:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2489:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2492:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2320:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2938:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3330:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2433:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2336:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2928:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2909:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2368:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2866:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2984:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2974:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3066:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2655:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2305:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2475:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3013:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2890:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2270:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2461:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2532:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3323:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3158:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2785:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3422:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2404:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2307:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3012:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2777:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2813:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2559:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2721:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3055:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2507:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2523:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3298:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2713:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3079:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2532:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2922:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2683:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2687:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2670:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2641:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3213:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2784:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2293:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2707:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2450:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2535:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3626:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2473:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2862:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2915:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2540:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2919:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.3883:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2736:  15%|█▌        | 61/401 [00:41<06:30,  1.15s/it]training loss: 0.2736:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3028:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3317:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3100:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2303:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2947:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2530:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2503:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2909:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2828:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2805:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3021:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2539:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2840:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2596:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3232:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2457:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2873:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2670:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2769:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2499:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3021:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2320:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2703:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2945:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2780:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2824:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2843:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3094:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2736:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2868:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2804:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2820:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2776:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2998:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2709:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2507:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2484:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3427:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2615:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2651:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3282:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2987:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2398:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2826:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2609:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3109:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2256:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2462:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3065:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3079:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.2993:  15%|█▌        | 62/401 [00:41<05:12,  1.08it/s]training loss: 0.3656:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2783:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2925:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2432:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2902:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2436:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2638:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.3357:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2830:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2661:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.3128:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2359:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2899:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2967:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.3001:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2649:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.3025:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2606:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2921:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.3352:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2469:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2901:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2903:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2919:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2749:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2409:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.3008:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2661:  15%|█▌        | 62/401 [00:42<05:12,  1.08it/s]training loss: 0.2661:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2829:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3083:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3252:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2817:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2700:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2368:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2866:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2879:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2953:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2963:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2545:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3280:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3333:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3172:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2596:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3426:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2985:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3155:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3151:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2365:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2295:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3101:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2362:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3458:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2545:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2676:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3274:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3088:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2622:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2761:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2472:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3051:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3172:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2720:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2844:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3184:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3427:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2831:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2644:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2471:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2459:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2408:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2944:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2390:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2914:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2954:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2285:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2935:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3178:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2529:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2857:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2371:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2754:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2815:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3339:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2647:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2581:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2767:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2770:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2664:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2996:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2504:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2781:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2590:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3114:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2175:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2759:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3010:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2747:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2977:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2898:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2900:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2989:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2178:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3020:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2944:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3185:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.3149:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2476:  16%|█▌        | 63/401 [00:42<04:14,  1.33it/s]training loss: 0.2476:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3076:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2954:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2628:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3121:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2822:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3271:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2732:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2820:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2875:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2195:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2690:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3041:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2104:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3213:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2673:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3082:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2252:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2634:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3344:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2632:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2574:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3252:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2587:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2510:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2635:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2968:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2966:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2431:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2646:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2698:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2547:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3301:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3508:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3019:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2433:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3171:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2459:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2653:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2753:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2516:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2771:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2874:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3211:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3334:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2573:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2462:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2752:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2866:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3158:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3147:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3109:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2774:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2530:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2934:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3091:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2327:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3642:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3134:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2713:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2841:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3070:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3255:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3017:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3398:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2574:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2446:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2696:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2940:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2638:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2571:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2546:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.3631:  16%|█▌        | 64/401 [00:42<03:30,  1.60it/s]training loss: 0.2587:  16%|█▌        | 64/401 [00:43<03:30,  1.60it/s]training loss: 0.3823:  16%|█▌        | 64/401 [00:43<03:30,  1.60it/s]training loss: 0.2509:  16%|█▌        | 64/401 [00:43<03:30,  1.60it/s]training loss: 0.2555:  16%|█▌        | 64/401 [00:43<03:30,  1.60it/s]training loss: 0.3108:  16%|█▌        | 64/401 [00:43<03:30,  1.60it/s]training loss: 0.2137:  16%|█▌        | 64/401 [00:43<03:30,  1.60it/s]training loss: 0.4211:  16%|█▌        | 64/401 [00:43<03:30,  1.60it/s]training loss: 0.4211:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2381:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2815:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2882:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2497:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3533:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2699:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2761:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2387:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3648:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3058:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3069:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2732:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3031:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3041:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3383:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2604:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2423:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3089:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.2523:  16%|█▌        | 65/401 [00:43<03:46,  1.48it/s]training loss: 0.3111:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3301:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3328:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2430:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2536:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3516:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3057:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2168:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3288:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2700:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2629:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3517:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2697:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2994:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3133:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2631:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2825:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2543:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3208:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2933:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2708:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3219:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2677:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3398:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2850:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3498:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2614:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3193:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2896:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2954:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2559:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2313:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3341:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2973:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2933:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2889:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2972:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2677:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3023:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2609:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2741:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3251:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2545:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2665:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2620:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2801:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3155:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2578:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2905:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2927:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2849:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2289:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2187:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2748:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2723:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2715:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.3410:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2636:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.2633:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.1294:  16%|█▌        | 65/401 [00:44<03:46,  1.48it/s]training loss: 0.1294:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2576:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3879:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2350:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2464:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3066:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2966:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2653:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3017:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2813:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2628:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2948:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3072:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2726:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2550:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3089:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2503:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2578:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3324:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3003:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2650:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2952:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3076:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3040:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3162:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2768:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2535:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2780:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2928:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2982:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3150:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2978:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2566:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2400:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2724:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2745:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2778:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2845:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3376:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3283:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2579:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3328:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2924:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2652:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2102:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2301:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2990:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2895:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3538:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3402:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3497:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2670:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2869:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2592:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3105:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2848:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3082:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3349:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2589:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3033:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2511:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2940:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2394:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2974:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2870:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2805:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.1731:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3371:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3342:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3189:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2953:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3458:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2578:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2657:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.3065:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2803:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2715:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2691:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2303:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2756:  16%|█▋        | 66/401 [00:44<04:39,  1.20it/s]training loss: 0.2756:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3017:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2886:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2947:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2852:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2085:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2535:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2598:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3025:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3361:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2942:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2368:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2426:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2265:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3135:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2835:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3228:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2946:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3143:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2981:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2874:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2744:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3402:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2833:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2593:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2692:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2374:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2791:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2725:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3067:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2679:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2353:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2618:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2426:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3050:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2265:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3046:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3247:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2768:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2879:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2790:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2609:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2771:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2628:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2891:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3086:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3115:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2515:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.3264:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2499:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2325:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2628:  17%|█▋        | 67/401 [00:44<03:47,  1.47it/s]training loss: 0.2769:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2396:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2788:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2671:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2362:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2637:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.3027:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2928:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2659:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2721:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.3297:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2680:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2841:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2690:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.3003:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.3075:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2438:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2634:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2088:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2700:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2958:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2897:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2593:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.3130:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.3291:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2372:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2398:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2573:  17%|█▋        | 67/401 [00:45<03:47,  1.47it/s]training loss: 0.2573:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2689:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2556:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2730:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2669:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2271:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3265:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2222:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2655:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3261:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2527:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2778:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2773:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2600:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2794:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3152:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2972:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2886:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2727:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2731:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3334:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2926:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2782:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2230:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2725:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2372:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2439:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3107:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3504:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3036:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2697:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3226:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2829:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2950:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2891:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2979:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2760:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2886:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3253:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3180:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2198:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2811:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2675:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2637:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2716:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2751:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2799:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2987:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3398:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3245:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2169:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3000:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2974:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2920:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3061:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2575:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3012:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2193:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3062:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2850:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2663:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2949:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3347:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2426:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3182:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3365:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2549:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2325:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3004:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3091:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2703:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2984:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3214:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2501:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2477:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2219:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2691:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2596:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.2877:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3720:  17%|█▋        | 68/401 [00:45<03:12,  1.73it/s]training loss: 0.3720:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2784:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2620:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2719:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2850:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2791:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2907:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3393:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2498:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2489:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2846:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3089:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2443:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2920:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2490:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2101:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2598:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3441:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2965:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2787:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2132:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3172:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2739:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2787:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3070:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2829:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2742:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2672:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2742:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2795:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3034:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2683:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3104:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2041:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3245:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3344:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2766:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2640:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2592:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2263:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2722:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2757:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2246:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2597:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2717:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2451:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2968:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3159:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2432:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2881:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2714:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2477:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2813:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2939:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2881:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2888:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3115:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2657:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2953:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2599:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3438:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2716:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2920:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2541:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2408:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2356:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2775:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3003:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3587:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2456:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2482:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2810:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2383:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2870:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2721:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3425:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3366:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.3271:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.2644:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.1606:  17%|█▋        | 69/401 [00:45<02:49,  1.96it/s]training loss: 0.1606:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3007:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2890:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3458:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2654:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3073:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2168:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3200:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3041:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2419:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2733:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2674:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2798:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2541:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2452:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2630:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2280:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3119:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2751:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2382:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2865:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2922:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3203:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2565:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2601:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3195:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3412:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2599:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3390:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2788:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2862:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2737:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3208:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3105:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3084:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2781:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2402:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3304:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2630:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2685:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2925:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3673:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3518:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2840:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3055:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3032:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2538:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2820:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3297:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.3008:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2264:  17%|█▋        | 70/401 [00:45<02:30,  2.19it/s]training loss: 0.2845:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.1893:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2920:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2755:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2299:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2980:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2913:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2483:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2926:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2170:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2442:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.3235:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2961:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.3674:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2572:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.3146:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2920:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2480:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2362:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2570:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2979:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2526:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2521:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.3308:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2844:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2579:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2790:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2725:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2557:  17%|█▋        | 70/401 [00:46<02:30,  2.19it/s]training loss: 0.2557:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2438:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3259:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2524:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2975:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3188:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2370:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2670:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2541:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2505:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2366:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2388:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3028:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2645:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2686:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2870:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2782:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2716:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2805:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2634:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2780:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2602:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2966:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3217:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2822:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2429:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2371:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2699:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3479:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2949:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3065:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2596:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3212:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2895:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2698:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2771:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2384:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2518:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2451:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2580:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3037:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2788:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2888:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3060:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2814:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2572:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2962:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3040:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3511:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2663:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2801:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2924:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2687:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2279:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3010:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2473:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3003:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2721:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3039:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2402:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3037:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3133:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3087:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2718:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3307:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2970:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2933:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3039:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2603:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2370:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2925:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3136:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2781:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2601:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2360:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2620:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2717:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.2737:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.3291:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.4307:  18%|█▊        | 71/401 [00:48<06:06,  1.11s/it]training loss: 0.4307:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2788:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2010:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2437:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2794:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2920:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2644:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2882:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2805:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.3208:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2650:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2796:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2249:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2944:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2670:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.3142:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2886:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2952:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2312:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2861:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.3089:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2224:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2426:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2149:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2843:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2823:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2509:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2601:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2409:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2874:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2899:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2883:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.3280:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.3228:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2874:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2472:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2878:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2351:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2899:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.3452:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2666:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.3067:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2884:  18%|█▊        | 72/401 [00:48<04:54,  1.12it/s]training loss: 0.2991:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3240:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2967:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3953:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2994:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3167:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3042:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2863:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2911:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3336:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3448:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2349:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2850:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2196:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2450:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2677:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2902:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2878:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3355:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3316:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2915:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2706:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3055:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2452:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2767:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2613:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2566:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3149:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2401:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3097:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2764:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2964:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2746:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2890:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2718:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.2834:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3319:  18%|█▊        | 72/401 [00:49<04:54,  1.12it/s]training loss: 0.3319:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2612:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2594:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2708:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2776:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3546:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2835:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2681:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2887:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2757:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2284:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2296:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2881:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2854:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2477:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2482:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3139:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2730:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2708:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2685:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3165:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3101:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2705:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2625:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3384:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3310:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2806:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3001:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3027:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2211:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3192:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3087:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3258:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2511:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2423:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2806:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2512:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2468:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3007:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2861:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2989:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2868:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2781:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3368:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3267:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2522:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2932:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2878:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3331:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2597:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2209:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2715:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2755:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2212:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2498:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2755:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3093:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3013:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3310:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2602:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2627:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2470:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3021:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2114:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2484:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3210:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2581:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3074:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2203:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3514:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2821:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2612:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2731:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2650:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2570:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2494:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2588:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2616:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.3088:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2237:  18%|█▊        | 73/401 [00:49<03:56,  1.39it/s]training loss: 0.2237:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3046:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3151:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2319:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2830:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2932:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2020:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2698:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2928:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2441:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2644:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2583:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3003:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2431:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2822:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2776:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2821:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2814:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2705:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2834:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2801:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2712:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2943:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3239:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2147:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2589:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2632:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2533:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2932:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2229:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2553:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3189:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3373:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2807:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2812:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2806:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3331:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3451:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3475:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2760:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2649:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3083:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3096:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3153:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2571:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2965:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2733:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2711:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2497:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2815:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2809:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2961:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3046:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2502:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2859:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2749:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3192:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3133:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3171:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2757:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2923:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2775:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3477:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2680:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3267:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2728:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3368:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3112:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2473:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2621:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2750:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3631:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2583:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2487:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2538:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2636:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2665:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2740:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.2866:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3804:  18%|█▊        | 74/401 [00:49<03:15,  1.67it/s]training loss: 0.3804:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2622:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2573:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2512:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3483:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2359:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3460:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3342:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3279:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2906:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3154:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2720:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3079:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2144:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2682:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2256:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2755:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3385:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2677:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2269:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2626:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2617:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3461:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3032:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2186:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2385:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2182:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3548:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2900:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2699:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2969:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2850:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2969:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2527:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2860:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2603:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2913:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2153:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3027:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2431:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2463:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2536:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2957:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3038:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3173:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.3146:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2387:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2516:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2583:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2543:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2380:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2527:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2725:  19%|█▊        | 75/401 [00:49<02:48,  1.93it/s]training loss: 0.2611:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2842:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3011:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2790:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3231:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3027:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2838:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2419:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3373:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2555:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3430:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3109:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3202:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3253:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2186:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2529:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3334:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3154:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3035:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2630:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2422:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2886:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2409:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2545:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.2505:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.3084:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.4297:  19%|█▊        | 75/401 [00:50<02:48,  1.93it/s]training loss: 0.4297:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2501:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3130:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3044:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2260:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2935:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2763:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3036:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3224:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2853:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2561:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2754:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2782:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3225:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2359:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2550:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2620:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3034:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3042:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3061:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2927:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2863:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2520:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3208:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2401:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2878:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3016:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2981:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3701:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2698:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2633:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2941:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2839:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2956:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2711:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2814:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2902:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2938:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2498:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2723:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2596:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2925:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3110:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2941:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2669:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3265:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3027:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2904:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2699:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3440:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2720:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2605:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3452:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2562:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2663:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2487:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2836:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2525:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3618:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2748:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2629:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2927:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2596:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2515:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2829:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2430:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2934:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2801:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2573:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2373:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3526:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3078:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2841:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2468:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3177:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.3141:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2672:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2871:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2782:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2707:  19%|█▉        | 76/401 [00:50<02:28,  2.18it/s]training loss: 0.2707:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2868:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2708:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2720:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2790:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2586:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2678:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2884:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3230:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2474:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2974:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3219:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2366:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3325:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2447:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2872:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2720:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3035:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2857:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3120:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3200:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2988:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3081:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2647:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3057:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2415:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3071:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2667:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3202:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3479:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2550:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2462:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3240:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2707:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2267:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3133:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2961:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2502:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2957:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2765:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3224:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3102:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3444:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2553:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2564:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3010:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2311:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2943:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3325:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2688:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2555:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2681:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2349:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2976:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2783:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2200:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2845:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2815:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3269:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2659:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2697:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3541:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3158:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2800:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2683:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2789:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2721:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2818:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3297:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2471:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2883:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2946:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2945:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2719:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2667:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2686:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.3532:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2721:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2810:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2619:  19%|█▉        | 77/401 [00:50<02:15,  2.39it/s]training loss: 0.2619:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2884:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2652:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3129:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2277:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2662:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2530:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2608:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2187:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2496:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3027:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2491:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2561:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2382:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2594:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3066:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2723:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2736:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2463:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2999:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2840:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2656:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2568:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2408:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2506:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2934:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2933:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2643:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2862:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2684:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2638:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3517:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2477:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2821:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2510:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2997:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3510:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2728:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2521:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2713:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2822:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2624:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3343:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2423:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3533:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2584:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2887:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2528:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2497:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3168:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3485:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2392:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2776:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2734:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2417:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2887:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2414:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2911:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2430:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2460:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3068:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2822:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2107:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.2815:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3235:  19%|█▉        | 78/401 [00:50<02:05,  2.58it/s]training loss: 0.3047:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.3158:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2857:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2838:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2706:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.3075:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2912:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2665:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.3083:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2908:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2925:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2848:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.3006:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.2730:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.4330:  19%|█▉        | 78/401 [00:51<02:05,  2.58it/s]training loss: 0.4330:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2466:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2856:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2936:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2889:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2449:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2446:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2714:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2532:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2582:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3700:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2946:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2753:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2380:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3252:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2916:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3045:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2983:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3082:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2778:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3156:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2514:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2198:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2882:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2782:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2908:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3028:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2965:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2393:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3229:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2596:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2548:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2882:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2972:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2432:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2786:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2616:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2971:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2415:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2904:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2782:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3046:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2632:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3109:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3445:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3262:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3140:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2819:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3080:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2599:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2832:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2991:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2732:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2647:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3054:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3179:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2464:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2764:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2852:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2782:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2699:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2755:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2348:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2632:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3168:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2766:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2974:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2419:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2879:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2921:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3148:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2998:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2755:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2645:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2703:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2604:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.3967:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2851:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2871:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2429:  20%|█▉        | 79/401 [00:51<01:57,  2.73it/s]training loss: 0.2429:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3163:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2778:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2975:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3228:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3791:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3012:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2803:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2777:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3258:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2938:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3322:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2714:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3129:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2896:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2638:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2965:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2532:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3275:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3315:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2761:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3025:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2762:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2649:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2677:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2582:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2912:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3392:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2911:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2696:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2364:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3942:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3117:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3462:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3173:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2198:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2717:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2794:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3094:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3054:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2330:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2461:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2531:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2146:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3095:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3212:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2737:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3760:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3592:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2926:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2710:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2962:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2730:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3009:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3233:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2536:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2382:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2682:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2957:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3185:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2889:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2575:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2679:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3028:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2441:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3079:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3049:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2789:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2761:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3932:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3238:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2580:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2668:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2733:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2213:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3480:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2940:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2544:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.3102:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2868:  20%|█▉        | 80/401 [00:51<01:54,  2.81it/s]training loss: 0.2868:  20%|██        | 81/401 [00:53<05:28,  1.03s/it]training loss: 0.2492:  20%|██        | 81/401 [00:53<05:28,  1.03s/it]training loss: 0.2922:  20%|██        | 81/401 [00:53<05:28,  1.03s/it]training loss: 0.3132:  20%|██        | 81/401 [00:53<05:28,  1.03s/it]training loss: 0.2677:  20%|██        | 81/401 [00:53<05:28,  1.03s/it]training loss: 0.2650:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2201:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2753:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2808:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2935:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2937:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2553:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2363:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2820:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2614:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2927:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3270:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3032:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2747:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2672:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2794:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2985:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2965:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2613:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3149:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.1937:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2908:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2919:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2749:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2559:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2244:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2950:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2955:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3468:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3338:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2490:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2448:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2913:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3019:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2800:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2839:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3112:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3567:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2508:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2998:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2620:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2340:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2467:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2396:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2432:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2148:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2796:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2830:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3050:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2836:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3403:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2869:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2676:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2291:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3108:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3168:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2736:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2614:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2633:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2301:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2682:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3009:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3013:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2606:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2200:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2860:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2888:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2689:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2693:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2378:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2461:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.2746:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3032:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3548:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3601:  20%|██        | 81/401 [00:54<05:28,  1.03s/it]training loss: 0.3601:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2769:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.1948:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2803:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2722:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2492:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2507:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2727:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3251:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3112:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2796:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2538:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2724:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2561:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2384:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2601:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2495:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3224:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3273:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2459:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2874:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2648:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2428:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2923:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3047:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2540:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2797:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2433:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2720:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2706:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2693:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2439:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2482:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2754:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2597:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3048:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2884:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2758:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2893:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2704:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2661:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3013:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2998:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2758:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2715:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2354:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3013:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2585:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2730:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2548:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3054:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2717:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3226:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3295:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3092:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2915:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3466:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2849:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2499:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2734:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3202:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2200:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2517:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2750:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2679:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2494:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2940:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2923:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2934:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2835:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2553:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2612:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2682:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2813:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2749:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2675:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2872:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.3103:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.2427:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.4593:  20%|██        | 82/401 [00:54<04:19,  1.23it/s]training loss: 0.4593:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3397:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2721:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3013:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3553:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2752:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3031:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2617:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2574:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2770:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2558:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2962:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2569:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2777:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3043:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2894:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2463:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3216:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2443:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2712:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2302:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2920:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3347:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2749:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2787:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2699:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2894:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2924:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2619:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2292:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3006:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2809:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3154:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3604:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2864:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2547:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2632:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3479:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2825:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2712:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2495:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2690:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2659:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2334:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3054:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2650:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3245:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3012:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2794:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2683:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2339:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2585:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2786:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2653:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2535:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3009:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3108:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2614:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3047:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2416:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2849:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2432:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2866:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2942:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2443:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3127:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2843:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2377:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2415:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2924:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3059:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3005:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2574:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2792:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.3030:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2858:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2283:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2473:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.2653:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.4780:  21%|██        | 83/401 [00:54<03:31,  1.50it/s]training loss: 0.4780:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.3174:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2590:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2890:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2782:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2642:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2635:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.3212:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.1993:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2682:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2827:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2605:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.3028:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2908:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.3137:  21%|██        | 84/401 [00:54<02:58,  1.78it/s]training loss: 0.2856:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2691:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3108:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2836:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3154:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2207:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2053:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2410:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2375:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3273:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3246:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2853:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2642:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2443:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2443:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2772:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2957:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2163:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3122:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2628:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2268:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3834:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2853:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2333:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2761:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2804:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3054:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3115:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2761:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2343:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2891:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2486:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2465:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.1764:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2463:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3119:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3239:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2647:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2537:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2475:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2468:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2843:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3023:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2502:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3004:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2856:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2244:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2403:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2763:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2946:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3068:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2942:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2750:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2297:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2580:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3126:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.1829:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2736:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2790:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2547:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3170:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2995:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.3047:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2322:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2727:  21%|██        | 84/401 [00:55<02:58,  1.78it/s]training loss: 0.2727:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2355:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2692:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2962:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2292:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2567:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3061:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2523:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2821:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2331:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2951:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2447:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2780:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2178:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2601:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2598:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2355:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2809:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2302:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2902:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2912:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2526:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2708:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2878:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2326:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3069:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3491:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2943:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2465:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3469:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2503:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2644:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3157:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2658:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2049:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2758:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2877:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2790:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2904:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2669:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3298:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3092:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2661:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3059:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3062:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2747:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2549:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2622:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2691:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2564:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2910:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2540:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2438:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2899:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3084:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2503:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2954:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2888:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3368:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2452:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3415:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2720:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2929:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3189:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3366:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2836:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2619:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2860:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2630:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2674:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2693:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.3169:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2934:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2664:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2377:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2769:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2540:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2599:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.2390:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.1167:  21%|██        | 85/401 [00:55<02:35,  2.04it/s]training loss: 0.1167:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2644:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2862:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2651:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2820:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2467:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2779:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2985:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2882:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2535:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2816:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2852:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2393:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2555:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2675:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2657:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2928:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2624:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2370:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2785:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3120:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2855:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2796:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2687:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3151:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2606:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2394:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2970:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2107:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2981:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2393:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2908:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2651:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2388:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2711:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3139:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2485:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2749:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2682:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2601:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2478:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2892:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2652:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3080:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2669:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2813:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2607:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3156:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2996:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2676:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3181:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3203:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2950:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2939:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2925:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2788:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2769:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2515:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2609:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2963:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2615:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2710:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2585:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3050:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2874:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2199:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2926:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2449:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2527:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3112:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2791:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2834:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3249:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3083:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3012:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2837:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3027:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2825:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.2215:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3054:  21%|██▏       | 86/401 [00:55<02:20,  2.24it/s]training loss: 0.3054:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.2289:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.3051:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.2501:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.3191:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.2516:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.3002:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.3092:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.2918:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.3092:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.2788:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.2583:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.2483:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.3564:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.2635:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.3325:  22%|██▏       | 87/401 [00:55<02:09,  2.43it/s]training loss: 0.3131:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2797:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2940:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3123:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2328:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2565:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2575:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3091:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2923:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2229:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2914:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2401:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2861:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2950:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2618:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3041:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2974:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2160:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2384:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2571:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2787:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2918:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3099:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2738:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2604:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2828:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3198:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2835:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2858:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3105:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2856:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2159:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3135:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3012:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2776:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2828:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2717:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3256:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2490:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2886:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2734:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2733:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2833:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2861:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2391:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3195:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2614:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2706:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2673:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2053:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3037:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2673:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2545:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2528:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3006:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2529:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2388:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3084:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3085:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2934:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3289:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.3210:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2144:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2822:  22%|██▏       | 87/401 [00:56<02:09,  2.43it/s]training loss: 0.2822:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2839:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2609:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2633:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2824:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2054:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3226:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2115:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3027:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2737:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2694:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2748:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2709:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2676:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3130:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2168:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2327:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2762:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2610:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2410:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2755:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2328:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3031:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2404:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2530:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2361:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2585:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2597:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3491:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2837:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3021:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3059:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3051:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2644:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2807:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2536:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2859:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2846:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2616:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2631:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2534:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2715:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2660:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2359:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3192:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2927:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2761:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2425:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2967:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2818:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2294:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2469:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2646:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2428:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2295:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2873:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2715:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2643:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2614:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2246:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2527:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2855:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2783:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2246:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2771:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2623:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2546:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3213:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.1977:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2144:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2922:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2779:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2957:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2543:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3175:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2664:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2775:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.2699:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.3276:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.1434:  22%|██▏       | 88/401 [00:56<01:59,  2.62it/s]training loss: 0.1434:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2968:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2643:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2489:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2721:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2534:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3047:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3088:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3204:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3019:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2572:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2897:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3221:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2670:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2843:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3594:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2407:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2797:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3064:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3689:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2597:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2349:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2385:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2745:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2750:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2482:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2912:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2484:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2947:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2299:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3054:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2391:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2817:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2772:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2772:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2688:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2880:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2679:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2301:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2281:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2081:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2351:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2853:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3065:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.1867:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2319:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2372:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3011:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3276:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2447:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2747:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3113:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3015:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2445:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2627:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2878:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3134:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2547:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2829:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2778:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2711:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2661:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3840:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2806:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2369:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3278:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2912:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2800:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2466:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2602:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2495:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3125:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2401:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3277:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2315:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2567:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3000:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2697:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.2661:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3634:  22%|██▏       | 89/401 [00:56<01:52,  2.76it/s]training loss: 0.3634:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2762:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.3039:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2208:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2823:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2505:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.3034:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2846:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2914:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2877:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2935:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2675:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2304:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2628:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2820:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2061:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2707:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2862:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2359:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2945:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2551:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2705:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2945:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2330:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2967:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2072:  22%|██▏       | 90/401 [00:56<01:49,  2.85it/s]training loss: 0.2831:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3502:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2771:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2852:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2501:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2627:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3078:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2434:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2365:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2315:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2474:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2492:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2996:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2832:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2525:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2253:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3065:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2448:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2806:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2435:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2651:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2718:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3506:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2762:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2805:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3194:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2364:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2697:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2689:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2534:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3037:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3035:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2803:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2572:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2597:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2998:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2468:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3224:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2446:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3010:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2218:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2384:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2611:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2157:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2924:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2194:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2850:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2396:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2703:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.3162:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2915:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2798:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2377:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2970:  22%|██▏       | 90/401 [00:57<01:49,  2.85it/s]training loss: 0.2970:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2740:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2480:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2377:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2551:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2893:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3163:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3229:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2892:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3021:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2867:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2224:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3128:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2864:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2149:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2600:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2915:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2772:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2750:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2928:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2388:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3395:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2770:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3175:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2434:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2284:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2060:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2225:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2686:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3069:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2830:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2432:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2825:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2172:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2895:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2806:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2828:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2746:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2316:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2802:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2559:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2352:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2539:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2419:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2608:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2766:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2395:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2652:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3034:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2706:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2635:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2038:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2731:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3205:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2584:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2549:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2723:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2386:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2506:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2913:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2207:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2335:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2405:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2838:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3280:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2586:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2964:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2882:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3013:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3193:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2496:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2632:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2459:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.3060:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2767:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2180:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2793:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2732:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2407:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2353:  23%|██▎       | 91/401 [00:59<05:14,  1.02s/it]training loss: 0.2353:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2695:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.3036:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.3104:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2991:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2306:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2764:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2803:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2658:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2344:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2999:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2899:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2899:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2586:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2931:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2624:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2301:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2570:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.3159:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2983:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.3024:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2634:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2829:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2808:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2685:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2995:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.3324:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2747:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.3076:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2669:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2897:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2591:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2270:  23%|██▎       | 92/401 [00:59<04:17,  1.20it/s]training loss: 0.2667:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2701:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2430:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2549:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2819:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2926:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2927:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2783:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2542:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3014:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3333:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2584:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2669:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2832:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2541:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3130:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3142:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3116:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2283:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2786:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3034:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2845:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2813:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2350:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2454:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2414:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2911:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2226:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2867:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2594:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2329:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2904:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2824:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2650:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2121:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3433:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2417:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2340:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2988:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2577:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3050:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2447:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3166:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2502:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2709:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.3059:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2745:  23%|██▎       | 92/401 [01:00<04:17,  1.20it/s]training loss: 0.2745:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3021:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2381:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2857:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2360:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3045:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2302:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2381:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2909:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2544:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2603:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2444:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2738:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3235:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2480:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2611:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3214:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2986:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2972:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2746:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2591:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2720:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2457:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2454:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2514:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2473:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2717:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2382:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2168:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3075:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2209:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2732:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3087:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2935:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2517:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2661:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2558:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2626:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2753:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2781:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2643:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3129:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2811:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2952:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2288:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2893:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2638:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2926:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2529:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2453:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3074:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2248:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2581:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2587:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3133:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2452:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2362:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2682:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3033:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2526:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2874:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2864:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2869:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3072:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2689:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3062:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2933:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2390:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2788:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3173:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2433:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2908:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3074:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2414:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3104:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2505:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2681:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2447:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.2821:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3132:  23%|██▎       | 93/401 [01:00<03:28,  1.48it/s]training loss: 0.3132:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3189:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2847:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3110:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2438:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2570:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2314:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2871:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2527:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2729:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2660:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3216:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2569:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3125:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2444:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2553:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2849:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2798:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2218:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2040:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3284:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2726:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2284:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3259:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3224:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2505:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2977:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2366:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2388:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3120:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2539:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2732:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2344:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2245:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3251:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2702:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2614:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2858:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3233:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3012:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2895:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2709:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2243:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2407:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2895:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2713:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2479:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2540:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3249:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2782:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2884:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2663:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2569:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2364:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2745:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2288:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2626:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2066:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2237:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2778:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2660:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2323:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2843:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2723:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2821:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2422:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2715:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2809:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3047:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2559:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2558:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2749:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2775:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2881:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2936:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3406:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2606:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.2457:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.3176:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.4094:  23%|██▎       | 94/401 [01:00<03:01,  1.69it/s]training loss: 0.4094:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2832:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2523:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2552:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2245:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.3520:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.3127:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.1945:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2639:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2565:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.3334:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2749:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.3068:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2667:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2433:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.3365:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2489:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2446:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2619:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2934:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2398:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2963:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2681:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2705:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2366:  24%|██▎       | 95/401 [01:00<02:36,  1.95it/s]training loss: 0.2569:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3266:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2476:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2200:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2808:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3083:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2630:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2664:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2873:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2398:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2915:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3068:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3201:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2617:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2492:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2878:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3451:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2404:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3026:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2656:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2913:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2912:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2620:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2635:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2520:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2572:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2493:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2669:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2439:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2325:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2806:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3007:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2998:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2816:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.1883:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2700:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2395:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3420:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2295:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2334:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2833:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2862:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2451:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2360:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2253:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2515:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.3186:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2655:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2711:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2861:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2743:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2857:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2429:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.2716:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.1615:  24%|██▎       | 95/401 [01:01<02:36,  1.95it/s]training loss: 0.1615:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2703:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2384:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2349:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2304:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2461:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2797:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2842:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2993:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2514:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2754:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2586:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2959:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2500:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3339:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2823:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2906:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2657:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2635:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2741:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3182:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2453:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2433:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2915:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2573:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2500:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2892:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3102:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2430:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.1979:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2699:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2639:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2541:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2464:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2560:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2839:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2588:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2368:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2975:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2401:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2583:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2664:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2844:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2195:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2325:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2693:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2506:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2766:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2279:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2465:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2810:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2899:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2860:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3126:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2898:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3284:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2647:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2851:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3083:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3078:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2421:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2366:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2404:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2587:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3229:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3257:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3045:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2960:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2925:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2436:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2001:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3032:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2710:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2625:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3011:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.3045:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2837:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2727:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2680:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2261:  24%|██▍       | 96/401 [01:01<02:18,  2.21it/s]training loss: 0.2261:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3003:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3208:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2189:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2815:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2951:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3063:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2799:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2677:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3415:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2890:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2403:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2599:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2797:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3445:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2571:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2866:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2275:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2348:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2698:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2890:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2425:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2854:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2559:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2943:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2665:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2592:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2689:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2706:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2531:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2351:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3173:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2512:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2227:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2974:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2760:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2502:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2774:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2809:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2852:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2493:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2432:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2724:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2457:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3003:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2697:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2892:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2715:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3381:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2636:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2595:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2935:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3433:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2395:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2842:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2479:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2005:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2054:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2409:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2799:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.1690:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3227:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3126:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2772:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2426:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3192:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2975:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2096:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3010:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2808:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2714:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2821:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2627:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2633:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2441:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3177:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2374:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.2808:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3169:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3151:  24%|██▍       | 97/401 [01:01<02:05,  2.41it/s]training loss: 0.3151:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2650:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3217:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2624:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2672:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2484:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2957:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2778:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3180:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2929:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3018:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2537:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2650:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3567:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3033:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3019:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2524:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2257:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3215:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2462:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2852:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3366:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3087:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2614:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2686:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2308:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2272:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.3045:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2354:  24%|██▍       | 98/401 [01:01<01:58,  2.55it/s]training loss: 0.2416:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2871:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2807:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.3604:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2667:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2303:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2545:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2766:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2530:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2935:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2561:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2408:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.3690:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2648:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2844:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2599:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2350:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2323:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.1937:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2952:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2303:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.3105:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2643:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2863:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.3033:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2731:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2587:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2833:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2566:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2295:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2824:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2382:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2659:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2223:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2749:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2593:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2867:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2759:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2836:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2901:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2750:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.3393:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.3486:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.3195:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2730:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2641:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2550:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2676:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2289:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2770:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2017:  24%|██▍       | 98/401 [01:02<01:58,  2.55it/s]training loss: 0.2017:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2463:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2307:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2969:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2441:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3117:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2667:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2227:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3008:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2738:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2201:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2343:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3373:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2869:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2259:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2674:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2937:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3186:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3591:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2543:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3859:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2501:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2674:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3203:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2708:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3051:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2556:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2459:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2721:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2471:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2381:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2652:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2308:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2267:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2635:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2708:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2817:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2934:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2616:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2614:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2585:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2282:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3003:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2590:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2732:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3072:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2695:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2571:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3062:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3363:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2640:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2766:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2440:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2654:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2460:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2089:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2214:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2214:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3116:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3128:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2445:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2771:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2538:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2781:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2185:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2210:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2463:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2630:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2946:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2394:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2367:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3311:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3224:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.3090:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2666:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2761:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2906:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2823:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2216:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2304:  25%|██▍       | 99/401 [01:02<01:53,  2.67it/s]training loss: 0.2304:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2837:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2361:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.3274:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2801:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2679:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2738:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2414:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2769:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2529:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2722:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2796:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2611:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2561:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2643:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2752:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2670:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.3000:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2806:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2678:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2771:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2852:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.3049:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2827:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.3218:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2719:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2338:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2809:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2924:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2614:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2734:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2909:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2784:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2786:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2542:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2636:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2792:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2774:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2578:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2495:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2808:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2417:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2586:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.3219:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2793:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2904:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2593:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2604:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2796:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2278:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.3219:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2999:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2661:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2655:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2045:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2762:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2445:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2356:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2639:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2443:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.3165:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2627:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2486:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.3053:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2815:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2519:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2232:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2482:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2609:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2941:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2738:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2341:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2732:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2528:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2330:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2890:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2697:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2587:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2816:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2905:  25%|██▍       | 100/401 [01:02<01:49,  2.75it/s]training loss: 0.2905:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2209:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2772:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2462:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2788:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2816:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2817:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2904:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3067:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2423:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3022:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2461:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2603:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3318:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2590:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3076:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2996:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2382:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3288:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2613:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3051:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3059:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2616:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3180:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2830:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2338:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2557:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2410:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3337:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2150:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2694:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2850:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2763:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3375:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2466:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2747:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2690:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3133:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2892:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2400:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2895:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2727:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2337:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2203:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2363:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2892:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2935:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3212:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2839:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2497:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2605:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2426:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2339:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2507:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2632:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2617:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2577:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2996:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2541:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2810:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2184:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3156:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3054:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3014:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2670:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2818:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2195:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2444:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2199:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.3082:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2520:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2755:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2639:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2224:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2418:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2698:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2810:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2557:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2981:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2680:  25%|██▌       | 101/401 [01:05<05:27,  1.09s/it]training loss: 0.2680:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2391:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2263:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2194:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2748:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2074:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2817:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2202:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2448:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2465:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2615:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2573:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2416:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3072:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2441:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2833:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2453:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2962:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2950:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2655:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2704:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2245:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2649:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2707:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3270:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2641:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2344:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2934:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2376:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2629:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2803:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2972:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2339:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3062:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2674:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2825:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2597:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2914:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2782:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3025:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3087:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2113:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2551:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2021:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2499:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2519:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3350:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2492:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2564:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2551:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2506:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3169:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2502:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3263:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2205:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2462:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2484:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2911:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2208:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2361:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3164:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2883:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.3057:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2626:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2988:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2012:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2814:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2639:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2865:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2520:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2553:  25%|██▌       | 102/401 [01:05<04:20,  1.15it/s]training loss: 0.2873:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.1977:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.3265:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.2972:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.2486:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.2626:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.2588:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.2769:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.2257:  25%|██▌       | 102/401 [01:06<04:20,  1.15it/s]training loss: 0.2257:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2348:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2807:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3306:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2134:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2898:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3025:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2719:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2670:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2845:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2439:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2714:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2939:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2176:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2183:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2828:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2478:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2214:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2437:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2664:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2577:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3025:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2445:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2411:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2606:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2849:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2446:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2528:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2980:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3151:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2993:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2699:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2191:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2335:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2692:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2750:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2610:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3140:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2283:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2617:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2562:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2492:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2397:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3324:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2811:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2719:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2420:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2139:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3228:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3186:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2508:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2626:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2651:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2805:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.1984:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2770:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2966:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2537:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2764:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2920:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2836:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2611:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2892:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2672:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2319:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2960:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2667:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3042:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2124:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2328:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2322:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2556:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3032:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2907:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2041:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2700:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2605:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3109:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.3215:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2099:  26%|██▌       | 103/401 [01:06<03:32,  1.40it/s]training loss: 0.2099:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2728:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2244:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2764:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2550:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2573:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2821:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2565:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2532:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2358:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2752:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2444:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2335:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2742:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2087:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3441:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2736:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2774:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2311:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2685:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3277:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2838:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2813:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2844:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2677:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2772:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2688:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2738:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2244:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2383:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3050:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2473:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2087:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2873:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2327:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3020:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2766:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2657:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2587:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2471:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3085:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2387:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2691:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2901:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2539:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2303:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2835:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2957:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3143:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2656:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2638:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2756:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2775:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2909:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2331:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2333:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2474:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2270:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2698:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3010:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2662:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2943:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2383:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2668:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2304:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2394:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2896:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2765:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2804:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2354:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.1918:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2750:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2618:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2588:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2754:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2176:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2687:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2787:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.2349:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3592:  26%|██▌       | 104/401 [01:06<02:59,  1.66it/s]training loss: 0.3592:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2890:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2744:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2997:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2665:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.3344:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2867:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2942:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.3283:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2810:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2385:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2660:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2687:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2205:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2618:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2684:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2996:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2606:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2678:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.3591:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2396:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2555:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2782:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2273:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2399:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2829:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.3370:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2199:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.3005:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.3217:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2527:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2838:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2217:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2511:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2822:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2227:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2555:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2603:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2217:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2584:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.3544:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2457:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2395:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2128:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2738:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2244:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2383:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2552:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2200:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2631:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2515:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2269:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.3286:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2048:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2165:  26%|██▌       | 105/401 [01:06<02:37,  1.88it/s]training loss: 0.2789:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2904:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2260:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2697:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2986:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2804:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2358:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2565:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2526:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2768:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.1731:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2843:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2693:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.3024:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2475:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2270:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2928:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2420:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2964:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2993:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.3072:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2191:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2458:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.2887:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.1795:  26%|██▌       | 105/401 [01:07<02:37,  1.88it/s]training loss: 0.1795:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2624:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2352:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3203:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2795:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2397:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2665:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2447:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2606:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2389:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3359:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2829:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2904:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2852:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2575:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2492:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2813:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2527:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2358:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2665:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2850:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2517:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2237:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3141:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2618:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2422:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2301:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2296:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2479:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2289:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2922:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2613:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3029:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2774:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2526:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2319:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2258:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2367:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2224:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2937:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2306:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2572:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2779:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2539:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3161:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2816:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3151:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3071:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2446:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2997:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2577:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2701:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3372:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3194:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2806:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.3098:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2957:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2654:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2914:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2500:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2499:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2954:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2044:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2900:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2481:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2634:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2637:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2616:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2901:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2961:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2881:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2912:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2739:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2964:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2404:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2572:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2744:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2052:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.2754:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.4064:  26%|██▋       | 106/401 [01:07<02:20,  2.09it/s]training loss: 0.4064:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2281:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.3081:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2800:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2555:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2835:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.3166:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2174:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2469:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2788:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2633:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2461:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2624:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2624:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2151:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.1990:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.3030:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2330:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2880:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2344:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2491:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2772:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2485:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2435:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.3308:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.3299:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2283:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2639:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2686:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2882:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2354:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2686:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2384:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2695:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2468:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2796:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2062:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2762:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2574:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2642:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2537:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2690:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2799:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2266:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2635:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2626:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.3331:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2046:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2484:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2590:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2472:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2688:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2855:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2770:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2659:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.3147:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2313:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.3356:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2825:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2987:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2503:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2811:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2918:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2560:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2788:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2687:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2294:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2587:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2337:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2511:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2597:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2319:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2538:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2278:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2799:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2637:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2772:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2668:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2349:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2512:  27%|██▋       | 107/401 [01:07<02:12,  2.22it/s]training loss: 0.2512:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2449:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2803:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2642:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2852:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2700:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2072:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2178:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.3034:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.3022:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2689:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2660:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2153:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.3578:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2448:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2260:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2787:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2813:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2878:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2455:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2781:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2065:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2635:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2633:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2685:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.3232:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2404:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2858:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2906:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2330:  27%|██▋       | 108/401 [01:07<02:06,  2.33it/s]training loss: 0.2494:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2425:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2639:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2733:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2745:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2901:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2661:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2986:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2626:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2802:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2995:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.3269:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.3020:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2501:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.3151:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2689:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2279:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2220:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2409:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2912:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2735:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2461:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2647:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.3074:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2247:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2404:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2874:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2658:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.3073:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2711:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2326:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2836:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2620:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2352:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.3423:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.3292:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2610:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2534:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2592:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2597:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2630:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2820:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2701:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.3101:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2555:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2357:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2712:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2402:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2671:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2518:  27%|██▋       | 108/401 [01:08<02:06,  2.33it/s]training loss: 0.2518:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2399:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2631:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2511:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2594:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2401:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2564:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2091:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2652:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2165:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2280:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2451:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2764:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2460:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3185:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2906:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2327:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3528:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2953:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3545:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2558:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.1965:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2061:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2448:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2491:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2954:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2523:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3131:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2399:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2394:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2743:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2393:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2603:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2954:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2424:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2597:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2762:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3177:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2733:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2431:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2629:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.1896:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2462:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2599:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2841:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2504:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2323:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2461:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2596:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2514:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2506:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3077:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2628:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2378:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2834:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2504:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3120:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3171:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2913:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2132:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2156:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2853:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2141:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2553:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2381:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2668:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2470:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2672:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2145:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2363:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2516:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3114:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2993:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2364:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2962:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2987:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2590:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2685:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.2189:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3731:  27%|██▋       | 109/401 [01:08<01:58,  2.47it/s]training loss: 0.3731:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2394:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2653:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.3240:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2589:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2716:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2601:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2765:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2917:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2479:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2651:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2279:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2559:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2589:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2321:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2970:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2744:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2243:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2575:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2929:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2703:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2546:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2773:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2375:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2616:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2517:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2574:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2424:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2740:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2553:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2865:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2645:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2762:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2848:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2804:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2523:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2562:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.3158:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2108:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2069:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2156:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.3179:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2105:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2465:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2341:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2545:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2055:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2413:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2469:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2110:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.1948:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2565:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2727:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2781:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2469:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2553:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2850:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.3319:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.3291:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2420:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.1925:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2010:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2718:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2409:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2278:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.1920:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.3191:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2742:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2569:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2522:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.3245:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2544:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2917:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2538:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.3157:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2760:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2414:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2776:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.2544:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.1743:  27%|██▋       | 110/401 [01:08<01:54,  2.55it/s]training loss: 0.1743:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2718:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2422:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2642:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2430:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2499:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2723:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2814:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2316:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2714:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.3180:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2228:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2523:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2816:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2323:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2125:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2391:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.1972:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2339:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2367:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2669:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2414:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2628:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2992:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2404:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2445:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2710:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2975:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2307:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2364:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2739:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2581:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2488:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2083:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2436:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2348:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.3205:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2109:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2790:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2828:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2921:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2519:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2054:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2520:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.3235:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.3216:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2671:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2481:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2232:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2237:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2220:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2403:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2111:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2422:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2931:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2925:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2560:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2957:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.3052:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2830:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2426:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2609:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2594:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2395:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2283:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2433:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2550:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2277:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2000:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2770:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.3063:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2856:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2638:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2543:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2825:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.1936:  28%|██▊       | 111/401 [01:11<05:41,  1.18s/it]training loss: 0.2247:  28%|██▊       | 111/401 [01:12<05:41,  1.18s/it]training loss: 0.2654:  28%|██▊       | 111/401 [01:12<05:41,  1.18s/it]training loss: 0.2915:  28%|██▊       | 111/401 [01:12<05:41,  1.18s/it]training loss: 0.3409:  28%|██▊       | 111/401 [01:12<05:41,  1.18s/it]training loss: 0.3409:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2501:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2517:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2158:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.1897:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2095:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3040:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2460:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2464:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3176:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2437:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2689:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2465:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2954:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2519:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2774:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2847:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3061:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2575:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2470:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2757:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2544:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2502:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2277:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2153:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2854:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2564:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2330:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3246:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2637:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2199:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2827:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2281:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3197:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2583:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3115:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2442:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2551:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2092:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2798:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2730:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2349:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2580:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2857:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2542:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2762:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2725:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2634:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2251:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3146:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2882:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2500:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3362:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2345:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2345:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2883:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2178:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2864:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2952:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2214:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3134:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2752:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2094:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2641:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2360:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2892:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2904:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2683:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2363:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2708:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2610:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2450:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2031:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2368:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2394:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2395:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2380:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3001:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.2391:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3103:  28%|██▊       | 112/401 [01:12<04:34,  1.05it/s]training loss: 0.3103:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2217:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2465:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2155:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2464:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2397:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2861:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2195:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2598:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2879:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2230:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2945:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2528:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2919:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.3415:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2745:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.3054:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2436:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2641:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2595:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2406:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2628:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2248:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2848:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2641:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2360:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.3205:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.1890:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2238:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2597:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2250:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2489:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2446:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2534:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2146:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2634:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2263:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2482:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2949:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2992:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2760:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2681:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.3100:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2654:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2741:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2779:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2432:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2896:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2734:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2383:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2671:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2285:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.3389:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2259:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2774:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2812:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2493:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2403:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.3050:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.3184:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2538:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2205:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2924:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2611:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2792:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2865:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2944:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2881:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2556:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.3221:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2810:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2842:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.1965:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2673:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2684:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2799:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2631:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2829:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2865:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2643:  28%|██▊       | 113/401 [01:12<03:45,  1.28it/s]training loss: 0.2643:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2702:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2426:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2208:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2895:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2437:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2687:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2629:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2827:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2085:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2263:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2031:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2390:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2576:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2340:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2711:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.3072:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2236:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2607:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2359:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2366:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2146:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2280:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2654:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2326:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2701:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2312:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2585:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2516:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2327:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2328:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2688:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2375:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2728:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2499:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2410:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2830:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2548:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2382:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.3072:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2398:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.1871:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2407:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.3035:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2356:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2665:  28%|██▊       | 114/401 [01:12<03:09,  1.51it/s]training loss: 0.2399:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2798:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2980:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2214:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2590:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2319:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2584:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2422:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.3013:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2610:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2440:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2216:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.3007:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2276:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2780:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2493:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2584:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2948:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2729:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2641:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2931:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2794:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2515:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2890:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2501:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2113:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2138:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2521:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.3186:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2315:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2776:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2576:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2556:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2253:  28%|██▊       | 114/401 [01:13<03:09,  1.51it/s]training loss: 0.2253:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2463:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2441:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3157:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2351:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2362:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2444:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3017:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2721:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2241:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2998:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2225:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2416:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2699:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2669:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2689:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2917:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2000:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2996:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2461:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3088:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2827:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3040:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2547:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3126:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2886:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2449:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2645:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2263:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2186:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3077:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2558:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2876:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2506:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2791:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2594:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2274:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2753:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2344:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2585:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2296:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2458:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2821:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2238:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2595:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2521:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2841:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2645:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2121:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3212:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2987:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2541:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2867:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2586:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2720:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2575:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2621:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2481:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2337:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3089:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2270:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2796:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2614:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2672:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2355:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2612:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2409:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2393:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2248:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2584:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2563:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2376:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2924:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2625:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2402:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2628:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.3491:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2418:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.2528:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.1392:  29%|██▊       | 115/401 [01:13<02:44,  1.74it/s]training loss: 0.1392:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2274:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3161:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2484:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3034:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2387:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3166:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2765:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3171:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2687:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2177:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2693:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2814:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2470:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2667:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2541:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2608:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2631:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2181:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2452:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2787:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2460:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2640:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2223:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2128:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2776:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2461:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3141:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2491:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2438:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2866:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2458:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2620:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2548:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2499:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2918:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2305:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3262:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2567:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2800:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2499:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3033:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2698:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2257:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3253:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2348:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3372:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2188:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2362:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2576:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2597:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2684:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2571:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2702:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2602:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2104:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2355:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2902:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2331:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2756:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2419:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2317:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2660:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2333:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2724:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2504:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2184:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2740:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2298:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2744:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2409:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2577:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2785:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.3037:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2566:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2239:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2176:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2880:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.2825:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.1699:  29%|██▉       | 116/401 [01:13<02:27,  1.93it/s]training loss: 0.1699:  29%|██▉       | 117/401 [01:13<02:19,  2.03it/s]training loss: 0.2265:  29%|██▉       | 117/401 [01:13<02:19,  2.03it/s]training loss: 0.2010:  29%|██▉       | 117/401 [01:13<02:19,  2.03it/s]training loss: 0.3343:  29%|██▉       | 117/401 [01:13<02:19,  2.03it/s]training loss: 0.2245:  29%|██▉       | 117/401 [01:13<02:19,  2.03it/s]training loss: 0.2478:  29%|██▉       | 117/401 [01:13<02:19,  2.03it/s]training loss: 0.2431:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2927:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2563:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2479:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.3035:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2390:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2489:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2126:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2681:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2435:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.3168:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2217:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2540:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2993:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2149:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2209:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2648:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2840:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.1939:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2897:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2481:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2184:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2200:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2097:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.3319:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2590:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2867:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2839:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.3104:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2572:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.3304:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2048:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2680:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2651:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2751:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2876:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2288:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2946:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2374:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2926:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2415:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2480:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.1911:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2751:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2306:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2283:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2551:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2798:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.3012:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2732:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2304:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2257:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2799:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2573:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2806:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2733:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2500:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2511:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2638:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2336:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2464:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2587:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2307:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2550:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2793:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2862:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2384:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.3365:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2764:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2546:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2511:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2419:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.2304:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.1821:  29%|██▉       | 117/401 [01:14<02:19,  2.03it/s]training loss: 0.1821:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2514:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2820:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2760:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2999:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2972:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2272:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2258:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2533:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2455:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2506:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2405:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2675:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2200:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2166:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.1965:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.3071:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2896:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2349:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2332:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2501:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2444:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2603:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2595:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2273:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2705:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2833:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2877:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2649:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2666:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2627:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.3049:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2194:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2605:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2669:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2485:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2282:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2932:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.3241:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2557:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2456:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2405:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2471:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2634:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2511:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2243:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2688:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2961:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2781:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2647:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2967:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2642:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2187:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2592:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2607:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2381:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2610:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2859:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2295:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.3044:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2314:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2408:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2160:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2460:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2455:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2679:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2313:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2203:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.3382:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2423:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2070:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2602:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.3024:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2680:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2625:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2702:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2483:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2540:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.2770:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.3669:  29%|██▉       | 118/401 [01:14<02:15,  2.08it/s]training loss: 0.3669:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2845:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2122:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2864:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2236:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2005:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2731:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.3429:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2584:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2965:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2594:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2398:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2539:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2811:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2585:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2741:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2287:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2403:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2024:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2387:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2686:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.3099:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2669:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2608:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2676:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2941:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2460:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2514:  30%|██▉       | 119/401 [01:14<02:10,  2.16it/s]training loss: 0.2361:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2317:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2245:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2597:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2225:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.3040:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2640:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2750:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2603:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2768:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2378:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2722:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2582:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.3198:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.3012:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2294:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2198:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2499:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2965:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2741:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2303:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2302:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2787:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2401:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2518:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2599:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2138:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.3189:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2336:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2418:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2486:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2943:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2716:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2085:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2276:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2651:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2409:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2909:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2762:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2158:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2115:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2745:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2278:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2960:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2403:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.3658:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2855:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2455:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2189:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2828:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.2835:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.1679:  30%|██▉       | 119/401 [01:15<02:10,  2.16it/s]training loss: 0.1679:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.3694:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2847:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2302:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2941:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2477:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2607:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2350:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2352:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2196:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2765:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2883:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2846:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2411:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2633:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2472:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.3024:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2665:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2807:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2740:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2229:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.3124:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2324:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2595:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2889:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2631:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2537:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2907:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2001:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2548:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2734:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2785:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2411:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.3214:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2540:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2482:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2429:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2989:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2365:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2033:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.3111:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2812:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2491:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2590:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2468:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2734:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2377:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.3308:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2363:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2559:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2552:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.3058:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2487:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.1916:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2422:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2873:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2620:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2453:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2425:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2636:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2623:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2469:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2600:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2735:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2374:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2707:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2807:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2507:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2331:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2856:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2705:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2595:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2415:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2726:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2333:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2535:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2423:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2321:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2312:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2824:  30%|██▉       | 120/401 [01:15<02:05,  2.24it/s]training loss: 0.2824:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2441:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2296:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3069:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2639:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2761:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2795:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2019:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2625:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2234:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2062:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2588:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2721:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2486:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2632:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2512:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2766:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2980:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2545:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2819:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2359:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2639:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2560:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2257:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3028:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2826:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2481:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2493:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2267:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2562:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2506:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2643:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2217:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2666:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2186:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2756:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2303:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2539:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2501:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2834:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2247:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2441:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2648:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3388:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2348:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2937:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2373:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2781:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2233:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3001:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2937:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2371:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2743:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2740:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2691:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2497:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2545:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2131:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2519:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3076:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3625:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2415:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2807:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2678:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2725:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2477:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2297:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2802:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2683:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2549:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2441:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2737:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2619:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2456:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3087:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2873:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3441:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.3550:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.2399:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.1094:  30%|███       | 121/401 [01:18<05:48,  1.25s/it]training loss: 0.1094:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.1972:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2631:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2046:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2916:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2599:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2833:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2150:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2993:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2915:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.3398:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2542:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2763:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.3143:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.3056:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2683:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2493:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2425:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.3488:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.3157:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2280:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2316:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2634:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2559:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2428:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2398:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2083:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2584:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2574:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2335:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2446:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2292:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2775:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2828:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.1751:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2291:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2494:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.3030:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.3024:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2508:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2130:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2280:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2311:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2170:  30%|███       | 122/401 [01:18<04:36,  1.01it/s]training loss: 0.2019:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2453:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2606:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2996:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2770:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2049:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2943:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2768:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2527:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.3195:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2461:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2443:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2380:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2974:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2665:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2658:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2640:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2848:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2216:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2565:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2633:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2894:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2677:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2338:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2401:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2306:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2449:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2638:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2761:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.3396:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2448:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2516:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2909:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2634:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2892:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2547:  30%|███       | 122/401 [01:19<04:36,  1.01it/s]training loss: 0.2547:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2804:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2573:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2559:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2823:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2978:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2174:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2685:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2715:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2629:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2730:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2616:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2153:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2313:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2664:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2390:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2496:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2518:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2593:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2739:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2323:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.3263:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2021:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2888:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2960:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2825:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2242:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2662:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2560:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2788:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2458:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2145:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2721:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2190:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2192:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2827:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.3027:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2395:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2364:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2726:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2520:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2231:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2361:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2767:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2661:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2686:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2406:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2684:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2298:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2626:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2281:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2600:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2848:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2643:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2518:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2226:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2735:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2301:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2748:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2514:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2499:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2837:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2872:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2781:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2739:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2572:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2453:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2745:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2960:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2271:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.1856:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2491:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2666:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2074:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2047:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2582:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.3171:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2640:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.2514:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.3807:  31%|███       | 123/401 [01:19<03:48,  1.22it/s]training loss: 0.3807:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2591:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2225:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2764:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2952:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2126:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2663:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2256:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.1937:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2695:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2346:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2925:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2275:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2742:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2864:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2894:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2589:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2915:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2859:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3475:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2334:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2754:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3248:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2560:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2803:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2323:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2746:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2686:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2755:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3135:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3057:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2396:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3068:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2282:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2267:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2217:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3139:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3077:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2815:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3168:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2571:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2357:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.1930:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2117:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2822:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2179:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2765:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2869:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3251:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2636:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2609:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2539:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2944:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2639:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2328:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2398:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2998:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2434:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3033:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2364:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2193:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2864:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3020:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2537:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2422:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2763:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2146:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2398:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2888:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2286:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2394:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2309:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2435:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2670:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2066:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2271:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2472:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3268:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.2601:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3853:  31%|███       | 124/401 [01:19<03:09,  1.46it/s]training loss: 0.3853:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2448:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2599:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.3191:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2302:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2213:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2789:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2381:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2287:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2355:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.3012:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2130:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2604:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2606:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2860:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2461:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2475:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.3127:  31%|███       | 125/401 [01:19<02:42,  1.70it/s]training loss: 0.2381:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2776:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2311:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2865:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2791:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2164:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2399:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2423:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2868:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2769:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2958:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2345:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2423:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2577:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2170:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2651:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2837:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2572:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2566:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2709:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2944:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2720:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2758:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2912:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2458:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2381:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2742:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2264:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2604:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.3051:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2643:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2072:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2460:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2734:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2253:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2931:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2318:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2801:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2995:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2118:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2528:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2911:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2639:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2818:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2343:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2572:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2548:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2561:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2744:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2773:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2364:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2767:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2578:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.3175:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2821:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.3441:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2254:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2818:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2789:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2836:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.2625:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.4311:  31%|███       | 125/401 [01:20<02:42,  1.70it/s]training loss: 0.4311:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2330:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2942:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2618:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2439:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2464:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2717:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2431:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2946:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2419:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2666:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2120:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2593:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2450:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2429:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2782:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2699:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2399:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2972:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2462:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2441:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2669:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2434:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.3220:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2903:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2330:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2463:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2675:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2882:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2764:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2521:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2940:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2925:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2505:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2321:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2421:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2517:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2690:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2466:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.1977:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2435:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2686:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2340:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2513:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2434:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2507:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2871:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.3164:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2895:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2325:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2621:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2469:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2078:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2643:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2933:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2639:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2419:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2393:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2271:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2527:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2375:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2514:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.3082:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2467:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2007:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2740:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2475:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2476:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2285:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2623:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2580:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2379:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2564:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2523:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2737:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2796:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2468:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2893:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.2598:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.1227:  31%|███▏      | 126/401 [01:20<02:22,  1.93it/s]training loss: 0.1227:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2332:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2906:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2468:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2317:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2849:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2404:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2488:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2140:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.3112:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2023:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2428:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2584:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2608:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2548:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.1874:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2287:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2549:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2490:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2763:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2715:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2935:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2029:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2288:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.3051:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2700:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2826:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2764:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2379:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.3133:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2950:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2929:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2855:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2340:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2322:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2057:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2583:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2640:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2628:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.3107:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2819:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2972:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2926:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2434:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2266:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2578:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2773:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2207:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.1956:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2274:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2454:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2612:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.3113:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2538:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2635:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2740:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2574:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2538:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2774:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2320:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2202:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2760:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2524:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2749:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2917:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2563:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2926:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.3402:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2851:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2276:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2440:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2574:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2500:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2365:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2618:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2356:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2713:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2447:  32%|███▏      | 127/401 [01:20<02:08,  2.14it/s]training loss: 0.2789:  32%|███▏      | 127/401 [01:21<02:08,  2.14it/s]training loss: 0.2741:  32%|███▏      | 127/401 [01:21<02:08,  2.14it/s]training loss: 0.2741:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2447:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2525:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2795:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2229:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2660:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2860:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3156:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2784:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2611:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2400:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2975:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2241:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2472:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2638:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2666:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2438:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2058:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2794:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3105:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2140:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2097:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2720:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2426:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2251:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.1966:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2879:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2809:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2089:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2681:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2578:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2502:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2919:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2482:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2690:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2731:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2312:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2943:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2305:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2682:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2288:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2339:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2998:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2903:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2555:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2859:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2439:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2106:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2199:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3054:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2636:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2333:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2545:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2047:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2946:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2235:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2451:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2619:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2732:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3186:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2484:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3089:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2292:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3082:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2713:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2271:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2192:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2037:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2521:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3316:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2285:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2465:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3392:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2425:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2738:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2260:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2825:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.3204:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2621:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2366:  32%|███▏      | 128/401 [01:21<02:00,  2.26it/s]training loss: 0.2366:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.1878:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2102:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2700:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2623:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2921:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2886:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2301:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3015:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2256:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2434:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2553:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2153:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2567:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2260:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2653:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3052:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3405:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2065:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2502:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2933:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2318:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2633:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2434:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3006:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3061:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3207:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2470:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2278:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2820:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2849:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2660:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3271:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2663:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2355:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2555:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2387:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2072:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2699:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2913:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2910:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2850:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2511:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.1980:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3258:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2762:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2567:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2621:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2640:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2918:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2575:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2760:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2446:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2868:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2517:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2460:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3127:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2674:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2763:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2922:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3106:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2075:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2439:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2956:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.1954:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2398:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2634:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2430:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2911:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2228:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2216:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2430:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3059:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2593:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2639:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2822:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.3387:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2227:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2548:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2544:  32%|███▏      | 129/401 [01:21<01:53,  2.40it/s]training loss: 0.2544:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2629:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2975:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2432:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2674:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2823:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2847:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2504:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2959:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2378:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2611:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.3497:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2158:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2498:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2274:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2655:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2684:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2742:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2411:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.1923:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2746:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2301:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2337:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2412:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2827:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2411:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.1972:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2891:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.3300:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.3114:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2225:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2502:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2865:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2743:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2615:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2452:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2349:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.3112:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2506:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2597:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2405:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2048:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2747:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2522:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2685:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2582:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.3083:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2594:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2676:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2454:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2746:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2161:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.3049:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2936:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2350:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2630:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2722:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2445:  32%|███▏      | 130/401 [01:21<01:48,  2.50it/s]training loss: 0.2783:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2227:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2753:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2122:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2233:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2951:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2283:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2899:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2616:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2557:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2267:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2704:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.3186:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2037:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2196:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2056:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2572:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2710:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2377:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2348:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.2934:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.3384:  32%|███▏      | 130/401 [01:22<01:48,  2.50it/s]training loss: 0.3384:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2354:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2583:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2596:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.3196:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2470:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2681:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2391:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2332:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2019:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2358:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2279:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2115:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.3098:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2334:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2160:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2676:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2537:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2819:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2395:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2200:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2415:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2853:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2358:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2481:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2305:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2477:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2383:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2671:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2905:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2799:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2335:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2948:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.3115:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2315:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.1982:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2612:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2304:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2468:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2466:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2881:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2507:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2745:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2607:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2685:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2846:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2423:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2132:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2629:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2582:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2927:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2261:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2550:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2345:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2337:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2354:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2211:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2682:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2746:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2617:  33%|███▎      | 131/401 [01:24<05:18,  1.18s/it]training loss: 0.2362:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2260:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2780:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2573:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2617:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.3153:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2477:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2727:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2484:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2584:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2455:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2136:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2315:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2989:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2660:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2384:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.3089:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2701:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2796:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2830:  33%|███▎      | 131/401 [01:25<05:18,  1.18s/it]training loss: 0.2830:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2439:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3900:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2784:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2442:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2318:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2265:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2887:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3235:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2244:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2592:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2541:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3271:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2880:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2442:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3130:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2750:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3184:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2597:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2484:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2606:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2316:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2109:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2376:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2592:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2530:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2426:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2775:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3115:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2453:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2503:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2255:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2637:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2302:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2795:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2171:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2543:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2730:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2947:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2904:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2032:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2902:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2146:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2737:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2522:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2673:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2136:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2310:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2735:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2748:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2317:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2452:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2464:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2656:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2360:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2454:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2968:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.1786:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2688:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2625:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2205:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2947:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2859:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2029:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2584:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2439:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2139:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3335:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2523:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2193:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2120:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2765:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2423:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2443:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2425:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3012:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.3624:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2418:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2544:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2688:  33%|███▎      | 132/401 [01:25<04:11,  1.07it/s]training loss: 0.2688:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2098:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2480:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2719:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2928:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2831:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2662:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2726:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2655:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2689:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2420:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2447:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2286:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2681:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2615:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2572:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2468:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2561:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2835:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2574:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2656:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2241:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2163:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2649:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2669:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2416:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2752:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2513:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.1962:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2639:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2414:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2733:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2451:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2273:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2240:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2489:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2497:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2493:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2520:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2113:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.3046:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2269:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.1998:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2403:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2464:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2501:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2914:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2755:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.3110:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2242:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2853:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2261:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2465:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2881:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2669:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.1922:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2924:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2397:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2228:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2067:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2747:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2599:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2672:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2705:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2642:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2481:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2913:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2070:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2249:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2202:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.3404:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.3102:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2757:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2650:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2859:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2597:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.3004:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2323:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2599:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2292:  33%|███▎      | 133/401 [01:25<03:24,  1.31it/s]training loss: 0.2292:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2729:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2638:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2439:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2252:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.3203:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2829:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2422:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2361:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2269:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2491:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2251:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2569:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2500:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2415:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2389:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2435:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2438:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2685:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2531:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2699:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2978:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2319:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2468:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2638:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.3012:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2545:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2963:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.3049:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2530:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.3086:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2442:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2708:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2139:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2286:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.3230:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2888:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.3092:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2664:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2329:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2467:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2350:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2527:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2217:  33%|███▎      | 134/401 [01:25<02:51,  1.56it/s]training loss: 0.2323:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.3000:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2931:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2494:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.3163:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2475:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2532:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2519:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2187:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2609:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2417:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.1744:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2669:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2007:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2601:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2017:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2887:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2744:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2200:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2436:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2476:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2575:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2407:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2742:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2645:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2017:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2765:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.3118:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.3034:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2795:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2450:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2431:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2238:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2267:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2483:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2976:  33%|███▎      | 134/401 [01:26<02:51,  1.56it/s]training loss: 0.2976:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2236:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2564:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2096:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2545:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2367:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2987:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2338:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2692:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2474:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2858:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2479:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2951:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2582:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2279:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2128:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2956:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2604:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3073:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3029:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2733:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2656:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2932:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2541:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2479:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2583:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2762:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2307:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2358:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2482:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3316:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2529:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.1885:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2022:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2922:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3100:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3012:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2433:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2671:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2116:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2848:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2607:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2654:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2801:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2602:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2321:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2901:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2563:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2585:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2140:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.1970:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2449:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3121:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2643:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2287:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3133:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2268:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2354:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3123:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2135:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2624:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2925:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2516:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2022:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2429:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2198:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2974:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2376:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2819:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2570:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2973:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3052:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2696:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3140:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2210:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2342:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2586:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2524:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.2530:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3142:  34%|███▎      | 135/401 [01:26<02:27,  1.80it/s]training loss: 0.3142:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2507:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2484:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2476:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2736:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2377:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2127:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2172:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2325:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2998:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2358:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2419:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.3121:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2527:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2331:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2311:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2733:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2377:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2962:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2492:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2555:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2139:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2771:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2882:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2272:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2859:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2726:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.1989:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2164:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.1980:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2594:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.3113:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.3157:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2550:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2670:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2843:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2913:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2833:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2403:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2620:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2348:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2642:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2198:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2997:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2738:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2414:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2943:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.1986:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.3000:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2307:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2727:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2734:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2772:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2588:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2192:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2466:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2421:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2578:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2925:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2347:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2731:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2231:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2396:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2599:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2218:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2378:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2655:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.1842:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2346:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2365:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2589:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2799:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2519:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2725:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2201:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2085:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2144:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2508:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.2480:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.1533:  34%|███▍      | 136/401 [01:26<02:10,  2.03it/s]training loss: 0.1533:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2670:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2353:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2456:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2818:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2780:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2544:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.3022:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2788:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2413:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2956:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2578:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2660:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2473:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2755:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2242:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.3598:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2642:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2660:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.3046:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2889:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2612:  34%|███▍      | 137/401 [01:26<02:01,  2.17it/s]training loss: 0.2296:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2966:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2560:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.3385:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2204:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2360:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2987:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2330:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2764:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2514:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2385:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2126:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2446:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2583:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2499:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2584:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.3291:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2503:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2509:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2387:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2462:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2583:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2433:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2994:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2581:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2411:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2659:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.3155:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2735:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2055:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2571:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2406:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2156:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2765:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2485:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2656:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2313:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2814:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2330:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2139:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2580:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2513:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2416:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2726:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2520:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2710:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2436:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2565:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2325:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2694:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2380:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.3052:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2146:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2545:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2843:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2799:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.2228:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.3269:  34%|███▍      | 137/401 [01:27<02:01,  2.17it/s]training loss: 0.3269:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2532:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2303:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2424:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2574:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2835:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2271:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2955:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2672:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2263:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2930:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2664:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2072:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2040:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2731:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2814:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2007:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2379:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2392:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2727:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2900:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2320:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.3156:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2790:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.3462:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2254:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2588:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2547:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2677:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2150:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2517:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2242:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2307:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2879:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2487:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2239:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2448:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2583:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2431:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2409:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2774:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2390:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.3031:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2698:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2766:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2374:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2240:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2396:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.3379:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2672:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2104:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2568:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2662:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2807:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2367:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2493:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2553:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2683:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2201:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2683:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.1920:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2677:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2664:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2667:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2635:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2338:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2245:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2692:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2816:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2710:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2596:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2971:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2339:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2284:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2842:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2435:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2182:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.2261:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.3117:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.1945:  34%|███▍      | 138/401 [01:27<01:54,  2.29it/s]training loss: 0.1945:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2457:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2521:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2664:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2774:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2361:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2654:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.1943:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2711:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2507:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2503:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2798:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2449:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2241:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.3304:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2691:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2604:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2453:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2520:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2376:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2146:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2254:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2693:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2879:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2853:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2335:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2625:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2597:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.3149:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2618:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.3298:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2519:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2338:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.1987:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2632:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2063:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2895:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2880:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2739:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2829:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2293:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2555:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.3974:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2276:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2481:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2740:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2328:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2333:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2928:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2203:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2294:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2109:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2445:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2977:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2373:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2377:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2459:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.1779:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2438:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.3110:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2545:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2762:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2691:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2271:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2574:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2205:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2139:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2539:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2289:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2020:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2436:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2115:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2640:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2518:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2886:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.3082:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2626:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2675:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2507:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2333:  35%|███▍      | 139/401 [01:27<01:48,  2.41it/s]training loss: 0.2333:  35%|███▍      | 140/401 [01:27<01:42,  2.54it/s]training loss: 0.2463:  35%|███▍      | 140/401 [01:27<01:42,  2.54it/s]training loss: 0.2625:  35%|███▍      | 140/401 [01:27<01:42,  2.54it/s]training loss: 0.3058:  35%|███▍      | 140/401 [01:27<01:42,  2.54it/s]training loss: 0.2988:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2286:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2372:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2591:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2544:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2324:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2512:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2755:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2824:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2724:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2180:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2551:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2665:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2112:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2020:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2469:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2520:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2737:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3189:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2648:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2865:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3018:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3134:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2765:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2151:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2658:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3587:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2456:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2774:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2422:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3440:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2262:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3021:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2886:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2519:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2752:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2450:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2616:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2387:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3017:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2448:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2734:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2603:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2593:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2628:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2935:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2481:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2415:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2602:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2439:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2013:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2703:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2605:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2428:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3205:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2301:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2347:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2736:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2913:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2817:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2914:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2511:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2545:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2444:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2982:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2474:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2710:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2855:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3122:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.3097:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2644:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2272:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2662:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2483:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2652:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2407:  35%|███▍      | 140/401 [01:28<01:42,  2.54it/s]training loss: 0.2407:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2891:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2863:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2386:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2798:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2775:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2272:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2769:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2627:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2391:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.3162:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2570:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2030:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2771:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2421:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2727:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.1943:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2804:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2462:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2233:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2784:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2849:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2436:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2667:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2793:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2490:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2488:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2447:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2186:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2225:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2865:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2368:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2840:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2092:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.1903:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2118:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2652:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2024:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2063:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2500:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2932:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2264:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2264:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2139:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2489:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2430:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2423:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2653:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.2328:  35%|███▌      | 141/401 [01:30<04:48,  1.11s/it]training loss: 0.1826:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2933:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2260:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2580:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2333:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2978:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2608:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2363:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2461:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2759:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.3012:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2408:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2009:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2375:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2815:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2513:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2383:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.1653:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2914:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.3231:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.1885:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2696:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2270:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2216:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2708:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.3017:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2384:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2727:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2436:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.2380:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.1080:  35%|███▌      | 141/401 [01:31<04:48,  1.11s/it]training loss: 0.1080:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3383:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2296:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2087:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3408:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2518:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2532:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3098:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2125:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2286:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2483:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2977:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2416:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2645:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2394:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2102:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2267:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2142:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3026:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2532:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2397:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2813:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2296:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2797:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2507:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3122:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2257:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2472:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2532:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3088:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2849:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3109:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2579:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2374:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2200:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2294:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3028:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2823:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2722:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2430:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3353:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2794:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2227:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2705:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2377:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2603:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2815:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2155:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2667:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2622:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2631:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2615:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2587:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2065:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2367:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2863:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3177:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3463:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2445:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2372:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2680:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2205:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2290:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2686:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2795:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2465:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2202:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2265:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2010:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2491:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2500:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2664:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2017:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2964:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3001:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2433:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.3374:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2645:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.2563:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.1998:  35%|███▌      | 142/401 [01:31<03:50,  1.13it/s]training loss: 0.1998:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2331:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2961:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.1751:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.3062:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2543:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2266:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2430:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.1844:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2442:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.1863:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2544:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2273:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2371:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2573:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2468:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2888:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2935:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2339:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2537:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2599:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2642:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2628:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.1922:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2923:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2298:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2314:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2469:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2602:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2218:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2849:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2223:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2367:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2379:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2716:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2599:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.1971:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2426:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2090:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2346:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2325:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2445:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2571:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2408:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2256:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2504:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2505:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.3287:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2681:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2058:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2444:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.1910:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2487:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2488:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2178:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2359:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2904:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2567:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2895:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2427:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2851:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2308:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2665:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2140:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2691:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2937:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2437:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2794:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2177:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2900:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2045:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2855:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.3041:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2476:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2560:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2890:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.3272:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2957:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2369:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2927:  36%|███▌      | 143/401 [01:31<03:09,  1.36it/s]training loss: 0.2927:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2706:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2378:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2231:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2722:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2376:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2425:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2813:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2162:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2904:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2940:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2556:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2311:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2138:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2389:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2888:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2507:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2673:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2572:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2965:  36%|███▌      | 144/401 [01:31<02:42,  1.58it/s]training loss: 0.2320:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2259:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2508:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2449:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.3047:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2275:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2433:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2492:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2214:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2612:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.3209:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2400:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2404:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2001:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2352:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2507:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2909:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2711:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2603:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2037:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2458:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2381:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2333:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2801:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2629:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2169:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2720:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2541:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2266:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2556:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2616:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2640:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2429:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2629:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2326:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2399:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2848:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2814:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2921:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.3481:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2389:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2773:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2407:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2001:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2524:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2495:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.3009:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2480:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.3146:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2676:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2655:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2443:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2630:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2084:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2307:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2550:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2832:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2436:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.2391:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.3711:  36%|███▌      | 144/401 [01:32<02:42,  1.58it/s]training loss: 0.3711:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2479:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2933:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2366:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2970:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2241:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.3323:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2752:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2594:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2394:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.3215:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2509:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2599:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2846:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2911:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2706:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2351:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2601:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.3071:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2920:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2489:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2209:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2682:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.3019:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2511:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2703:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2589:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2140:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2425:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2732:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2345:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2452:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2939:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2528:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2534:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2677:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2795:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2724:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2689:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2790:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2004:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2528:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2719:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2655:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2756:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2801:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2664:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2271:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2757:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2700:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2543:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2317:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2514:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2392:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2922:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2917:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2023:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2537:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2291:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2356:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.1967:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2500:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2787:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2391:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2254:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2434:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2804:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2645:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2364:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2813:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2369:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2276:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2779:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2808:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2539:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2451:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.1976:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2428:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2757:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2425:  36%|███▌      | 145/401 [01:32<02:21,  1.80it/s]training loss: 0.2425:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2622:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2742:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2366:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.3000:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2845:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2433:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2350:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2877:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.3287:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.3097:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2066:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2150:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2174:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2689:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2469:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2740:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2093:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2446:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2707:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2675:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2626:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2336:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2119:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2437:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2661:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2087:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2657:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2738:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2493:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2823:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.3151:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2569:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2374:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2099:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2242:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.3001:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.3162:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2581:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2864:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2520:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2610:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2894:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2672:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2847:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2599:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2843:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2050:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2106:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2696:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2767:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2326:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2429:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2751:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2683:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2348:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2987:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2288:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2873:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2786:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.1906:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2127:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2329:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2550:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2532:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2647:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2554:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2839:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2598:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2267:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2433:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.2718:  36%|███▋      | 146/401 [01:32<02:06,  2.01it/s]training loss: 0.3252:  36%|███▋      | 146/401 [01:33<02:06,  2.01it/s]training loss: 0.2179:  36%|███▋      | 146/401 [01:33<02:06,  2.01it/s]training loss: 0.2734:  36%|███▋      | 146/401 [01:33<02:06,  2.01it/s]training loss: 0.2840:  36%|███▋      | 146/401 [01:33<02:06,  2.01it/s]training loss: 0.2804:  36%|███▋      | 146/401 [01:33<02:06,  2.01it/s]training loss: 0.2428:  36%|███▋      | 146/401 [01:33<02:06,  2.01it/s]training loss: 0.2422:  36%|███▋      | 146/401 [01:33<02:06,  2.01it/s]training loss: 0.2233:  36%|███▋      | 146/401 [01:33<02:06,  2.01it/s]training loss: 0.2233:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2788:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2955:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2424:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2573:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2348:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2710:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2323:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2613:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.3103:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2036:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2326:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2973:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2359:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2419:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2087:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.3507:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.3181:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2393:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2960:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2859:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2644:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2481:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2738:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2239:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2693:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2203:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2399:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2574:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2412:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.1995:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2266:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2418:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2708:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.3214:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2737:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2433:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2230:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2433:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2615:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2760:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2593:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2737:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2924:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2464:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2086:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2381:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.1665:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2976:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2375:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2604:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2760:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2386:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2307:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2682:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2548:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2538:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2969:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2423:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2762:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2761:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2515:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2456:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2477:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.1928:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2246:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2136:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2528:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2060:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2627:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2784:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2597:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2639:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2440:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2743:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2243:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2518:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2623:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2202:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2823:  37%|███▋      | 147/401 [01:33<01:58,  2.15it/s]training loss: 0.2823:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2017:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2452:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2494:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2595:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2294:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2677:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.1974:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2396:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2439:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2764:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2415:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2871:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2519:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2521:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2358:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2731:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2247:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2512:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2777:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.3043:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2176:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2561:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2402:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2551:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2211:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2591:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2387:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2499:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2210:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2059:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2001:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2752:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2693:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2381:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2268:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2574:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2465:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2359:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.1999:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2705:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2146:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2636:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2654:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2536:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2665:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2599:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2815:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2462:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2763:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2838:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2994:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2777:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2368:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2911:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2187:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2551:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2403:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2496:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2498:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2703:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2411:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2550:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2640:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.1955:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2246:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2260:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2430:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2124:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2835:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2841:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2243:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2335:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2437:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2591:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2638:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2499:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2317:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2817:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2328:  37%|███▋      | 148/401 [01:33<01:48,  2.33it/s]training loss: 0.2328:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2861:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2771:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2092:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2864:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2358:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2000:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2483:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2696:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2213:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2662:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2778:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2262:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2590:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2577:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.3062:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2065:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2143:  37%|███▋      | 149/401 [01:33<01:56,  2.15it/s]training loss: 0.2041:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2701:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2559:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2469:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2808:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2343:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2264:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2408:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2672:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2124:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2814:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2706:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2552:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2175:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2694:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2217:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2647:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2367:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2591:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.3225:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.3389:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.1957:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2832:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2285:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2437:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2401:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2886:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2685:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2583:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2247:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2578:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2403:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2783:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2796:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2237:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2781:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.3693:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2488:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2329:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2992:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2359:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2631:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2114:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2526:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2166:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2529:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.3337:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2764:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2362:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2459:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2560:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2176:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2542:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2710:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2246:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.3086:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2914:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2695:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2925:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2453:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.2176:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.1900:  37%|███▋      | 149/401 [01:34<01:56,  2.15it/s]training loss: 0.1900:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2919:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2208:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2407:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2287:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2387:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2599:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2313:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2567:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2282:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2516:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2035:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2462:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2600:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2443:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2793:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2743:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2631:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2721:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2587:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2552:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.3278:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2810:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2328:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2604:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2373:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2195:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2600:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2763:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2703:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2850:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2160:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.3345:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2439:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2492:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2761:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.1995:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2544:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2406:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2698:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2032:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2510:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2395:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.3188:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2537:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2585:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2664:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2029:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2423:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2772:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2601:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2832:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2701:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2730:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2417:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.3001:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.3096:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2462:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2684:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2695:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2625:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2359:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2934:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2383:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2590:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2615:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2453:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.3012:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2857:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2868:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2526:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2680:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.3034:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2919:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2489:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2494:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2497:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2936:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2487:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2255:  37%|███▋      | 150/401 [01:34<01:49,  2.29it/s]training loss: 0.2255:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2691:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2168:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2984:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2327:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3046:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2806:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2309:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2658:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2730:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3001:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2434:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2248:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2483:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2973:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2163:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2629:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2271:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3175:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2420:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2601:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2778:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3390:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2494:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2711:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2329:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2033:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2520:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2402:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3051:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2614:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2235:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2804:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2408:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2571:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2481:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2315:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2105:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2359:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2352:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2173:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2791:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2825:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3265:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2200:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3196:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2245:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2507:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3092:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2613:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2199:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2234:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.1990:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2233:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2704:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2106:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3042:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2350:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2680:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2839:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2950:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.3344:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2740:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2045:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2229:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2617:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2875:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2567:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2163:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2475:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2223:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2326:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2531:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2288:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2906:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2460:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2097:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2259:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2348:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2640:  38%|███▊      | 151/401 [01:37<04:55,  1.18s/it]training loss: 0.2640:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2174:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2306:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2736:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2285:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.1916:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2886:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2669:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2885:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2137:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2768:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2081:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2604:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2781:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2179:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2486:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2597:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2477:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2599:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2494:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2826:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2183:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2600:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.3367:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.1969:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2120:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2637:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2393:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.1995:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2206:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2280:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2004:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2165:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2377:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2375:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2334:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2218:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2945:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2625:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2572:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.3042:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2631:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.3131:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2490:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2396:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2428:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2613:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.3008:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2351:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2532:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2659:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.1922:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2639:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.3256:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2766:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2166:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2452:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2433:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2590:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2570:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2423:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2484:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2743:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2184:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.2472:  38%|███▊      | 152/401 [01:37<04:02,  1.03it/s]training loss: 0.1735:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2025:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2828:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2447:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2103:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2668:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2614:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2232:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2119:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2576:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2756:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2377:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2377:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.2670:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.3100:  38%|███▊      | 152/401 [01:38<04:02,  1.03it/s]training loss: 0.3100:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2229:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.1912:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2026:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2577:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2401:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2433:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2591:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.1707:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2230:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.3031:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2785:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2896:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.3215:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2662:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2973:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2331:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2308:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2178:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2585:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2765:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2345:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.3026:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2783:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2458:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2298:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2491:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2258:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2280:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2416:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2486:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2066:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2221:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2602:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.1756:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2111:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2083:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2390:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2417:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.3173:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2357:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2553:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2687:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2042:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2755:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.1723:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2459:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.1724:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2584:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.3134:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2146:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2482:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2864:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2763:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2464:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2354:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2348:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2337:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2740:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2715:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2374:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2830:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2169:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2269:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.1979:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2175:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2616:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2695:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2494:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2518:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2167:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2197:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2814:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2295:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2594:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.3195:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2466:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2365:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.2344:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.1182:  38%|███▊      | 153/401 [01:38<03:20,  1.24it/s]training loss: 0.1182:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2776:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2055:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2571:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2652:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2554:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2669:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2853:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2580:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2124:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2997:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2401:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2440:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2838:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2207:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2571:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2478:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2695:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2617:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2299:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2029:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2942:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2251:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.3250:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.3154:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2997:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2143:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2533:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2440:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2117:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2467:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2334:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2670:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2772:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2500:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2460:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2344:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2449:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2314:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2302:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2225:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2585:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2351:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2775:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2174:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2336:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2847:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2809:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2590:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.1975:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2592:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2477:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.1995:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2503:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2103:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.3237:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2350:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.3002:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2377:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2504:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.3100:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2302:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2484:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.3091:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2906:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2732:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2471:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2837:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.3117:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2658:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2864:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2496:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2050:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2618:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2367:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2169:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2766:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2386:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2166:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2711:  38%|███▊      | 154/401 [01:38<02:48,  1.47it/s]training loss: 0.2711:  39%|███▊      | 155/401 [01:38<02:32,  1.61it/s]training loss: 0.2499:  39%|███▊      | 155/401 [01:38<02:32,  1.61it/s]training loss: 0.2170:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2031:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.3133:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.3004:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2775:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2704:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2875:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2699:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2518:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2218:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2387:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2610:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2106:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2461:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.3010:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2683:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2588:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2224:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.1806:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2634:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2387:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2046:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2711:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2782:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2135:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2010:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2744:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2495:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2611:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2391:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2163:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2733:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2447:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2143:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2576:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2285:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.1876:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2063:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2822:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2155:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2605:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2792:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2629:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2415:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2978:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2071:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.1756:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2475:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2355:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2291:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2424:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2087:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2499:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2579:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2240:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2889:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2385:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2353:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2427:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2247:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2368:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2168:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2321:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.1993:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2373:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2367:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.1967:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2187:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2452:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2234:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.1883:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2924:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.1961:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.1990:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2293:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2875:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2170:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2812:  39%|███▊      | 155/401 [01:39<02:32,  1.61it/s]training loss: 0.2812:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2168:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2784:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2448:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2020:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2545:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2683:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2729:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2268:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2893:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2636:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2945:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2110:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2581:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2564:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2654:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2056:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2779:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2231:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2734:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2290:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2793:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.1900:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2047:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2044:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2349:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2190:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2537:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2532:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2979:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2940:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2700:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2329:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2512:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2557:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2666:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.3140:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2554:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2847:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2699:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2509:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2916:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2481:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2819:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2614:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.1866:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2706:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2334:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.3016:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2304:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2578:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2525:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2090:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2918:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2597:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2411:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2401:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.3217:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2190:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2648:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2280:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2373:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2670:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2684:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2547:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2553:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2465:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2379:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2407:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2831:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2895:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2322:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2439:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2680:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2580:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.1816:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.3034:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2196:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2970:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2934:  39%|███▉      | 156/401 [01:39<02:13,  1.84it/s]training loss: 0.2934:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.3010:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2223:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2927:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2420:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2397:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2458:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2326:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2159:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.1911:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2234:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2396:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2277:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2639:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2429:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2367:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2325:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2930:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2735:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2781:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2407:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2530:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2410:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2173:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.3021:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2376:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2228:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2000:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2282:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2542:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2768:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2050:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2501:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2981:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2292:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2946:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2441:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2214:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2161:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2412:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2490:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2456:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2062:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2316:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2760:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2867:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2251:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2559:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2624:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.3153:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2497:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2690:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.3666:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2317:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2389:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2600:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2843:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2441:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2311:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2843:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2330:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2397:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2300:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2694:  39%|███▉      | 157/401 [01:39<01:59,  2.05it/s]training loss: 0.2070:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2173:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2160:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2252:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2855:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2519:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2082:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.1912:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2771:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2379:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2140:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2081:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2289:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2111:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.2630:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.1235:  39%|███▉      | 157/401 [01:40<01:59,  2.05it/s]training loss: 0.1235:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2264:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2710:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2248:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2655:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2085:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2047:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2055:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2411:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2862:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2235:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2336:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.1957:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2792:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2602:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2341:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2778:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.3051:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2748:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2585:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2646:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2128:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2167:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2411:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2418:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2986:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2768:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2459:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.1741:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2165:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2842:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2754:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2870:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2141:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2887:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2126:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2304:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2764:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2182:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2466:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2402:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2173:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2264:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.1891:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2864:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2132:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2726:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2191:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2550:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.3148:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2237:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2794:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2444:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2525:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2320:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2364:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2188:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2088:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2320:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2788:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.1967:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.3063:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2562:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2391:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2652:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.1996:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2819:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2410:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2577:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2098:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2162:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2020:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2380:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.1993:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2434:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2172:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2477:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2327:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.2638:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.1707:  39%|███▉      | 158/401 [01:40<01:48,  2.23it/s]training loss: 0.1707:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2256:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2139:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2163:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2809:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2725:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2569:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2208:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2283:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2741:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2654:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2691:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2749:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2830:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2243:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2242:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2815:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2087:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2679:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2594:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.1967:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2719:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2487:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2357:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.1887:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2581:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2392:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2670:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2833:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2816:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2215:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2495:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2656:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2300:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2529:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2456:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2241:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2716:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2859:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2085:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2396:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2217:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2174:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2578:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2648:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2409:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.3259:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2036:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2211:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2394:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2154:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2463:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2644:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2253:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2709:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.3130:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2813:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2383:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2513:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2167:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2653:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.1768:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2425:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2674:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2207:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2655:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2240:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2439:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2677:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2088:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2088:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2049:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2623:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2893:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2481:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2773:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2397:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2457:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.2897:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.1329:  40%|███▉      | 159/401 [01:40<01:42,  2.35it/s]training loss: 0.1329:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2457:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.1887:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2719:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.3192:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2389:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2255:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2676:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2325:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2379:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2289:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2270:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2433:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2405:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2119:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2781:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2465:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2134:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.1760:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2824:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2272:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2214:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2077:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2970:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2661:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2189:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2117:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.1852:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2397:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2086:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.3158:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2251:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2240:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2798:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2352:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2101:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2282:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.1929:  40%|███▉      | 160/401 [01:40<01:38,  2.44it/s]training loss: 0.2447:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2321:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2127:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2595:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2719:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2055:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2879:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2081:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.1974:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2813:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.1837:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2389:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2338:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2110:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2547:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2318:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2127:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2642:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2719:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2495:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.1854:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2459:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2741:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2605:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2120:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2178:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2281:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2813:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2461:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2690:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2706:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.3254:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2919:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2357:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2286:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2343:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2533:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2187:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2924:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2305:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.2638:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.3089:  40%|███▉      | 160/401 [01:41<01:38,  2.44it/s]training loss: 0.3089:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2032:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2781:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2262:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.3084:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2380:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.1897:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2071:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2450:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2431:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2199:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.3272:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2669:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2554:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2731:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2226:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2546:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2576:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2911:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2672:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2589:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2196:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2622:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.1962:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2251:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2025:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2862:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2038:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2742:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2129:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2451:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2691:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2336:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.3302:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2625:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2435:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2244:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2232:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2043:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2076:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2672:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2345:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.1981:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2944:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2336:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2721:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.3011:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.3174:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2075:  40%|████      | 161/401 [01:43<04:42,  1.18s/it]training loss: 0.2422:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2591:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2504:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2190:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2606:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2529:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.1741:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.3146:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2354:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2550:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2704:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.1993:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2373:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2209:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2584:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2773:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2429:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2136:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.1934:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2352:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2153:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2471:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2484:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2858:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2055:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2424:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2408:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2431:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2825:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2268:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2324:  40%|████      | 161/401 [01:44<04:42,  1.18s/it]training loss: 0.2324:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2422:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2991:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2693:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2530:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2907:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2382:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2264:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2415:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2507:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2486:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2160:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2782:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2501:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2617:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2440:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2428:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2365:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2367:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2169:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2471:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2227:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2852:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2703:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2572:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2540:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2701:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2483:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2058:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2557:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2322:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2267:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2154:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2697:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.1896:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2585:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.1901:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2137:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2404:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2060:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2240:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2677:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2693:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2482:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2347:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2550:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2652:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2173:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2883:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2424:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2283:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.1940:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2616:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2175:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2448:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2371:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2433:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2458:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.3037:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2553:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2245:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2508:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2569:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2519:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.3159:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2485:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2453:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.3200:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2856:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2682:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2428:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2499:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2501:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2991:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.1963:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.3054:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2614:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2219:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2472:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2288:  40%|████      | 162/401 [01:44<03:43,  1.07it/s]training loss: 0.2288:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2414:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2230:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2814:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2155:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2567:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2503:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2599:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2644:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2738:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2533:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2370:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2151:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2514:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.3000:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2400:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2434:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2736:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2406:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2501:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2710:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2823:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2409:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2630:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2145:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2189:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2750:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2831:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2561:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2491:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2784:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2747:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2211:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2497:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2579:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2183:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2296:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2733:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2508:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2561:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2786:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2513:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.1971:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2316:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2497:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2339:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2937:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2430:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2314:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.3089:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2280:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2787:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.3000:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2769:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2322:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2064:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2103:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2181:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2644:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2888:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2339:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2443:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2395:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2145:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2436:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2746:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2598:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2269:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2458:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2386:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2039:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.3503:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2776:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2334:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2451:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2425:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2358:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.1923:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.2583:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.3941:  41%|████      | 163/401 [01:44<03:04,  1.29it/s]training loss: 0.3941:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2454:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2109:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2835:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2639:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2480:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2325:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2237:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.3051:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2500:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2346:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2605:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2169:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2115:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2591:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2474:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2427:  41%|████      | 164/401 [01:44<02:34,  1.53it/s]training loss: 0.2040:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2550:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2462:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2316:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2244:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2368:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2478:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2362:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2249:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.1869:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2087:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2122:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2293:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2452:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2654:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2171:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2272:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2358:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2281:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2372:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2275:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2530:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.1767:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2023:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2211:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2877:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2138:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2622:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2303:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2318:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2542:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2144:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2992:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2025:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2793:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2774:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.3046:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2051:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2066:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2757:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2332:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2449:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2237:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2059:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2616:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2568:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2927:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2417:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2419:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2850:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2360:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.3001:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2287:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.1921:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2905:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2661:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2465:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2988:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.1847:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2455:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2264:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2231:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2792:  41%|████      | 164/401 [01:45<02:34,  1.53it/s]training loss: 0.2792:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2177:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2316:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2510:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2118:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2238:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2196:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2307:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2430:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2594:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2372:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2586:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2858:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2147:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2359:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2328:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2512:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2806:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.1776:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2517:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2491:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2406:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2073:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2395:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2503:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2789:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2930:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2440:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2017:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2476:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2705:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2694:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2632:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2403:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2284:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2977:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2753:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.3163:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2802:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2037:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2300:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2507:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2657:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2330:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2413:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2112:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.1791:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2464:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.1829:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.3235:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2211:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2962:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2560:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2688:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2460:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2872:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2120:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2476:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.1953:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2506:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2681:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2279:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2168:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2493:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2317:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2058:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2354:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2507:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2561:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2892:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2558:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2413:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2214:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2243:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2071:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2520:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2200:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2203:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2681:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2717:  41%|████      | 165/401 [01:45<02:14,  1.76it/s]training loss: 0.2717:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2622:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2368:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2496:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2285:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2734:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2397:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2706:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2025:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2114:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2488:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2696:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2092:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2597:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.3055:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2537:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2633:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2293:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2481:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2157:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2208:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2180:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.1901:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2348:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2321:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2327:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2828:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2103:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2684:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2584:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2110:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.3059:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2304:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2332:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2522:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2532:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2375:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2598:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2821:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2372:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2430:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.1751:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.1889:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2409:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2740:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2364:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.1756:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2242:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2359:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2617:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2702:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2812:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2337:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2783:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2426:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2547:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2318:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2537:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2450:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2486:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2401:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2765:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.1888:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2511:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.1744:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2628:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2810:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.1909:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2574:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2533:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2590:  41%|████▏     | 166/401 [01:45<02:00,  1.95it/s]training loss: 0.2988:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.2503:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.2776:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.2157:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.2502:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.2449:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.3132:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.2550:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.2401:  41%|████▏     | 166/401 [01:46<02:00,  1.95it/s]training loss: 0.2401:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2148:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2508:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2261:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2365:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2688:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2510:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2463:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2695:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2331:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2097:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2255:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2994:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2781:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2687:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2223:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2574:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2470:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2703:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2984:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2429:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2474:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2623:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2127:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2538:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2980:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2336:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2534:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2318:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2415:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2891:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2722:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2548:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2139:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2153:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2096:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2029:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2446:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2491:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2621:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2045:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2714:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.1847:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2109:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2342:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.1981:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2412:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2592:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2499:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2732:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2347:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2125:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2594:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2784:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2232:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2612:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.1991:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2704:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2628:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2897:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2104:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2858:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2123:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2273:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2627:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2545:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.3081:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.1907:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2471:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2308:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2513:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2900:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2115:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2172:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2809:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2201:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2257:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.2964:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.3044:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.3548:  42%|████▏     | 167/401 [01:46<01:49,  2.14it/s]training loss: 0.3548:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2316:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2396:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2040:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2288:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2480:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2217:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2173:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2360:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2266:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2564:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2684:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2426:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2748:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2206:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2810:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2331:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2476:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.1900:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2208:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2345:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2270:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2002:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2433:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2089:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.1900:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2928:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2495:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2173:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.1896:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2235:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2719:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2501:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2532:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2670:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2201:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2606:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2777:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2692:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2627:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2794:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2297:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2856:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2680:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2526:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2668:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2476:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2138:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2631:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2114:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2797:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2561:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2041:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.3184:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2468:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2294:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2613:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2224:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2412:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2328:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.1985:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2197:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2431:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2327:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2662:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2761:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2287:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2290:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2585:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2756:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2149:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2210:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2613:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2604:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2220:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2417:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2334:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2548:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.3016:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2618:  42%|████▏     | 168/401 [01:46<01:41,  2.29it/s]training loss: 0.2618:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2430:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2260:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2465:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2541:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2287:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2478:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2274:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2888:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2068:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2024:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2388:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2018:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2652:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2182:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2899:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.1963:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2694:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2563:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2795:  42%|████▏     | 169/401 [01:46<01:42,  2.26it/s]training loss: 0.2368:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2206:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2209:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2637:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2758:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2847:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2931:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2251:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2026:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2227:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2372:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2098:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2203:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2260:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2273:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2153:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2011:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2530:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2912:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2048:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2158:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2812:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2136:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2577:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.1895:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2513:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2425:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2358:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2386:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2329:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2690:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2845:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2380:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2249:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2741:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2197:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2541:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2681:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2286:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2556:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.1948:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2612:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2119:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.3393:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2363:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2468:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2360:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2109:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2091:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2117:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2297:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2111:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2211:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2597:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2467:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2657:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2218:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.1949:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.2274:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.1706:  42%|████▏     | 169/401 [01:47<01:42,  2.26it/s]training loss: 0.1706:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2678:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.1715:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2227:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2655:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2455:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2632:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2501:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2441:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2468:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2219:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2380:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2235:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.1902:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2095:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2225:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2273:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2439:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2606:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2530:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.3107:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2583:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2145:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2468:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2531:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2526:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2656:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2142:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2676:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2282:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.1835:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.1935:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2465:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2580:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2304:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2488:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2277:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2396:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2258:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2677:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2299:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.3147:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2081:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2778:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2077:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2601:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2517:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2077:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.3455:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2436:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2732:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2098:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2106:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2135:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2183:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2606:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2659:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2407:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2550:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.3039:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2365:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2388:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2030:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2722:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2674:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2518:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2599:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2481:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2881:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2624:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2726:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.1983:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2714:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2331:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.1691:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2749:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2291:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2430:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.2695:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.3115:  42%|████▏     | 170/401 [01:47<01:56,  1.98it/s]training loss: 0.3115:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2289:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2602:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2903:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2356:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2414:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2019:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2187:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2246:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2470:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2509:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2122:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2103:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2216:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2729:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2199:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2395:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2512:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2249:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2455:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2094:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2265:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2080:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2329:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2046:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2309:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2827:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2542:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2166:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2268:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2328:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2487:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2607:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2405:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2656:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2214:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2635:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.1959:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2043:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2136:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2625:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2372:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2577:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2583:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2069:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2071:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.1956:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.3343:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.1812:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2129:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2875:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2201:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2346:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2563:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2746:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2274:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2433:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2401:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.3273:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2293:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2349:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2855:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2078:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2501:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2581:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2245:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2686:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2853:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2624:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2258:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.3046:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2715:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2566:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2050:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.3039:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2612:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2111:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2777:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.2582:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.1426:  43%|████▎     | 171/401 [01:50<04:50,  1.26s/it]training loss: 0.1426:  43%|████▎     | 172/401 [01:50<03:51,  1.01s/it]training loss: 0.2349:  43%|████▎     | 172/401 [01:50<03:51,  1.01s/it]training loss: 0.2571:  43%|████▎     | 172/401 [01:50<03:51,  1.01s/it]training loss: 0.2746:  43%|████▎     | 172/401 [01:50<03:51,  1.01s/it]training loss: 0.3223:  43%|████▎     | 172/401 [01:50<03:51,  1.01s/it]training loss: 0.2473:  43%|████▎     | 172/401 [01:50<03:51,  1.01s/it]training loss: 0.2052:  43%|████▎     | 172/401 [01:50<03:51,  1.01s/it]training loss: 0.2729:  43%|████▎     | 172/401 [01:50<03:51,  1.01s/it]training loss: 0.2043:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2413:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2326:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.1926:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2240:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.1974:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2746:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.3036:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2491:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2396:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2499:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2598:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2275:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2538:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2549:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2665:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2222:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2390:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2414:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2760:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2720:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2105:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2058:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2206:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2612:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2079:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2227:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2757:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.1988:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2703:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2843:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2885:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2006:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2055:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2505:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2374:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2423:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2315:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2261:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2441:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2500:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2401:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2766:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.3126:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2193:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2254:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2468:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2068:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.1857:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2387:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2413:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.1726:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2706:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2349:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2163:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2492:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2465:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2450:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2851:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2438:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2141:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2279:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2477:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2389:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2581:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2723:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2224:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2982:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.1862:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.2124:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.3070:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.3412:  43%|████▎     | 172/401 [01:51<03:51,  1.01s/it]training loss: 0.3412:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2432:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2299:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.1918:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2481:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2534:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2399:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.1903:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2551:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2774:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2243:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2287:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2821:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2788:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2750:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2197:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2708:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2216:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2443:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2147:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2290:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2274:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2507:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2860:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2757:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.1796:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2027:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.1957:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2652:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2353:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2158:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2776:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2062:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2270:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2527:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2569:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2883:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2323:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2541:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2840:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2429:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.3199:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2125:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2668:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2544:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2730:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2834:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2067:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2831:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2315:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2849:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2883:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2516:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.1972:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2471:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2998:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2176:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2112:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2674:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2366:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2029:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2291:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2501:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2712:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.1907:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.3194:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2460:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2409:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2561:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.3568:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2885:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2452:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2559:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2560:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2615:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2703:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2763:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2291:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.2005:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.3259:  43%|████▎     | 173/401 [01:51<03:08,  1.21it/s]training loss: 0.3259:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.1828:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2904:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2337:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2181:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2954:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2767:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2637:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2390:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2013:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2330:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2841:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.1848:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2170:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2296:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.1882:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2064:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2365:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2518:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2716:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2188:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2213:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2568:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2546:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2748:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2559:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2270:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2120:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2681:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2337:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2411:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2626:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.1782:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2790:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2877:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2503:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2309:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.1914:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2496:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2593:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2559:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2400:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2301:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2028:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2714:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2042:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2161:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2464:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2131:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2521:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2673:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2178:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.1964:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2489:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2886:  43%|████▎     | 174/401 [01:51<02:37,  1.44it/s]training loss: 0.2704:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2610:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2489:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2426:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2446:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2821:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2465:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2181:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2619:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2484:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2494:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2181:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2645:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2115:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2102:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2263:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.1844:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2582:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2574:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2353:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2192:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2288:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2571:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.2020:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.3871:  43%|████▎     | 174/401 [01:52<02:37,  1.44it/s]training loss: 0.3871:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2226:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2302:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2641:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.3040:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2746:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2163:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2802:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2280:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2393:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2441:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2443:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2275:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2529:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2299:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2378:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2022:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2312:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2384:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2410:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.1912:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2179:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2564:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2037:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2481:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2539:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2298:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2434:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2398:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2310:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2631:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2401:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2320:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2167:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2331:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2114:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2980:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2081:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2450:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2012:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2604:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.1893:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.3044:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2362:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2124:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2299:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.1760:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.1697:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2527:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2587:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2470:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2729:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.1877:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2424:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2709:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2174:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2506:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2336:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2059:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2951:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.1913:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2478:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2469:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2523:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2306:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2988:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.1743:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2161:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2685:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2779:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2716:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.3111:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2654:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.1695:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2214:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2349:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.3225:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2599:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2420:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2039:  44%|████▎     | 175/401 [01:52<02:15,  1.67it/s]training loss: 0.2039:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2751:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.1836:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2218:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.3105:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2175:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2523:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2293:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2161:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2129:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2623:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2646:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2770:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2081:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2064:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2571:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2417:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2859:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.3042:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2627:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.1974:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2784:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2381:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2895:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2731:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2684:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2908:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2434:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2029:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2266:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2244:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2611:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2569:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2167:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2155:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2708:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2207:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2399:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.1996:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2704:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2602:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2761:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.1910:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2137:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2203:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2732:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2835:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2464:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2603:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2094:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2359:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2371:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2613:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2230:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2167:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2918:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2604:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2405:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2336:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2365:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2384:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2784:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2424:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2146:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2539:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2092:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2128:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2208:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2950:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2140:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.1972:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2262:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2732:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.1733:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2388:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2348:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.1910:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.3098:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2834:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2250:  44%|████▍     | 176/401 [01:52<01:58,  1.90it/s]training loss: 0.2250:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2830:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2122:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2678:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2280:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2495:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2709:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2474:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2547:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2281:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2578:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2302:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2355:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2738:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.3010:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2826:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2639:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2797:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2020:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2904:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2658:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2199:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2543:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2156:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.3056:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2308:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.3150:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2413:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.1962:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2217:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2381:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2173:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2373:  44%|████▍     | 177/401 [01:52<01:47,  2.08it/s]training loss: 0.2200:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2567:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.1976:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2441:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2264:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2211:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.3009:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2702:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2524:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2306:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2190:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2662:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2548:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2517:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2468:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.1929:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2568:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2731:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2611:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2527:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2620:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2502:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2245:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2688:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2072:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2030:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2916:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2140:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2049:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2440:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2132:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2250:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2734:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2749:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2659:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2391:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2150:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2588:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2422:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2090:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.3192:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2611:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2461:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2083:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.2917:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.1956:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.1631:  44%|████▍     | 177/401 [01:53<01:47,  2.08it/s]training loss: 0.1631:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2109:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1897:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2213:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2388:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2165:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2304:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1852:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2931:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2588:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2811:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2477:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1804:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2276:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2354:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2094:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2525:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2645:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1809:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2062:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2547:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2031:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2437:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2276:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2193:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.3031:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2432:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2560:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1887:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2396:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2336:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2463:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2485:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2048:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2968:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2209:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2607:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2561:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2532:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2765:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1788:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2795:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2638:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2344:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2459:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2364:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2191:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2527:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2789:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2590:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2557:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1877:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2505:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2129:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2982:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2499:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2310:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2157:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1910:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2177:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2480:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2089:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2358:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2121:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2267:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2050:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2369:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2167:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2205:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1787:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1956:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2208:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2345:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2212:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2131:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2759:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.1931:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2398:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2631:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2113:  44%|████▍     | 178/401 [01:53<01:39,  2.24it/s]training loss: 0.2113:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1905:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2233:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2417:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2326:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2205:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2766:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2844:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2377:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2500:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2245:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2514:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2940:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2239:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2387:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2185:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2230:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2601:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2465:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2256:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2787:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1974:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2010:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2331:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2618:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2910:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2197:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2317:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2148:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2246:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1973:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2264:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2067:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2769:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2390:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2206:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2350:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2156:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2458:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2360:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2566:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2345:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2707:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1919:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2358:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2154:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2448:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2709:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2797:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2608:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1996:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2603:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2179:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2525:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1840:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2093:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2152:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2364:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2491:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1952:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2605:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2463:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2400:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2577:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2055:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2187:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2543:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2112:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2346:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1964:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2322:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2186:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2249:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2314:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2613:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1844:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2085:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2534:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.2499:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1478:  45%|████▍     | 179/401 [01:53<01:34,  2.35it/s]training loss: 0.1478:  45%|████▍     | 180/401 [01:53<01:30,  2.44it/s]training loss: 0.2648:  45%|████▍     | 180/401 [01:53<01:30,  2.44it/s]training loss: 0.1885:  45%|████▍     | 180/401 [01:53<01:30,  2.44it/s]training loss: 0.3014:  45%|████▍     | 180/401 [01:53<01:30,  2.44it/s]training loss: 0.1970:  45%|████▍     | 180/401 [01:53<01:30,  2.44it/s]training loss: 0.2524:  45%|████▍     | 180/401 [01:53<01:30,  2.44it/s]training loss: 0.2602:  45%|████▍     | 180/401 [01:53<01:30,  2.44it/s]training loss: 0.2845:  45%|████▍     | 180/401 [01:53<01:30,  2.44it/s]training loss: 0.2184:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2836:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2406:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2392:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1990:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2406:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2326:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2048:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2542:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2374:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2719:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1823:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.3004:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2621:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2427:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2390:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2631:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2231:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.3019:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1986:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2376:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1976:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2484:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2688:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2386:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2652:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2039:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2473:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2635:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2953:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2209:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2578:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2644:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2412:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2340:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.3254:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2706:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2146:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2767:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2212:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2238:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2944:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2117:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2361:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2241:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2663:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2928:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2383:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2389:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2159:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2875:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1902:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2119:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2427:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2033:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2436:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2059:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1987:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2668:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2949:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2602:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2390:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2471:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1822:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.3133:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2749:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2140:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1814:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2086:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2166:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.2825:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1412:  45%|████▍     | 180/401 [01:54<01:30,  2.44it/s]training loss: 0.1412:  45%|████▌     | 181/401 [01:56<04:14,  1.16s/it]training loss: 0.2301:  45%|████▌     | 181/401 [01:56<04:14,  1.16s/it]training loss: 0.2211:  45%|████▌     | 181/401 [01:56<04:14,  1.16s/it]training loss: 0.2447:  45%|████▌     | 181/401 [01:56<04:14,  1.16s/it]training loss: 0.1939:  45%|████▌     | 181/401 [01:56<04:14,  1.16s/it]training loss: 0.2201:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2560:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.3074:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.1942:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.1978:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2198:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2138:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2408:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2027:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2562:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.1905:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2612:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2119:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2352:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2406:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2165:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2084:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2450:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.1937:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2303:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2030:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2252:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2503:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.1967:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2537:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2007:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2670:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2408:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2866:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2172:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2350:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2028:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2951:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2526:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.1972:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2347:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2484:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2380:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2189:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2501:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2932:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2371:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2240:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2009:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2137:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2097:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2860:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2304:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2144:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2444:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2348:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2030:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2362:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2605:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2028:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2947:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2177:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2587:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2474:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.1884:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2383:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2807:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.3036:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2050:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2618:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2570:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2705:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2468:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2296:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.1771:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2746:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2259:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2431:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.2195:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.3631:  45%|████▌     | 181/401 [01:57<04:14,  1.16s/it]training loss: 0.3631:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2300:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2299:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2566:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2392:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2179:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2152:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.1623:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2662:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2284:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.1925:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2368:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2420:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2352:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.1951:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2762:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2077:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2241:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2812:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2238:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2622:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2410:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.1972:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2170:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2924:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2302:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2487:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2223:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2990:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2626:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2244:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2056:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2606:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2413:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.3006:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2060:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2614:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2389:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2798:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2551:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2257:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.2596:  45%|████▌     | 182/401 [01:57<03:55,  1.08s/it]training loss: 0.1989:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2131:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2563:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2177:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.1923:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2586:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2061:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2003:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2521:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2118:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2240:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2200:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2497:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2317:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2443:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2391:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2766:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2114:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.1997:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2853:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2263:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2507:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2352:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2183:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2070:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2917:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2428:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2327:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2357:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2535:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.1760:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.1987:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2568:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2074:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2510:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2534:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.2183:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.1611:  45%|████▌     | 182/401 [01:58<03:55,  1.08s/it]training loss: 0.1611:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2110:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2156:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2039:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2634:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2051:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2323:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2503:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1886:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2246:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1996:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2632:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1997:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2054:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2652:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2291:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2642:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2350:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2263:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2654:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2245:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2560:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2077:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2194:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1768:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2140:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2631:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2304:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2281:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2395:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2332:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2338:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2293:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2376:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2323:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2234:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2318:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2446:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2182:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.3031:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2530:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1928:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2592:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2535:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2354:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1972:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1853:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2063:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2451:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2059:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2629:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1884:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2030:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.3442:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2469:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2678:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1964:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2553:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2333:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2397:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1998:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2263:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2688:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2729:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2477:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1493:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2575:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2231:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1955:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2548:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2020:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2398:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2654:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2456:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2557:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2015:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1878:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2196:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.2260:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1945:  46%|████▌     | 183/401 [01:58<03:15,  1.12it/s]training loss: 0.1945:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2065:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2007:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2354:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2309:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2136:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2376:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2018:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2244:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2608:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2538:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2209:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2108:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2616:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.1888:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2371:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2548:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2090:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2545:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2776:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2621:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2583:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2349:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2695:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2129:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2075:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2547:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.1902:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.3061:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2238:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.1936:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2454:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.1999:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2204:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2187:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2773:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2245:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2090:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2014:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2874:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2435:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2271:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.1998:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2680:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2333:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2816:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2724:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2198:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2110:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2128:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2375:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2570:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2192:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2254:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2059:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2177:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2433:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2046:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2378:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.1905:  46%|████▌     | 184/401 [01:58<02:48,  1.29it/s]training loss: 0.2434:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2283:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.1707:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2402:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2179:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2531:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.1735:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2765:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2433:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2320:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2126:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2033:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2247:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2749:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2248:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2455:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2915:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2478:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2378:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2029:  46%|████▌     | 184/401 [01:59<02:48,  1.29it/s]training loss: 0.2029:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2525:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2556:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.1994:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2317:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2521:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2245:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2207:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2379:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.1890:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.1787:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.3069:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2452:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2118:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2521:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2810:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2434:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2286:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.3016:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2189:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2480:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2564:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2000:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2348:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2595:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2890:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.1635:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2100:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2449:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2589:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2650:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2159:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.1799:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2072:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2150:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2537:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2538:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2400:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2182:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2006:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2526:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2480:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2105:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.1750:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.3053:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2441:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2490:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2817:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2178:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2142:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2934:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2146:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.1857:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2251:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2023:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2522:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2490:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2127:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2479:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2407:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2786:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2584:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2069:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2545:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2206:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2554:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2905:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2138:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2721:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2720:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2476:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2420:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2171:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2024:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2088:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2076:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2061:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2443:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2194:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2470:  46%|████▌     | 185/401 [01:59<02:23,  1.50it/s]training loss: 0.2470:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1926:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2013:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2615:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2238:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2257:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2680:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2632:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1982:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2144:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2726:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2927:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1990:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2306:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2571:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2186:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2201:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2375:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1785:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2058:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2270:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2021:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2042:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2618:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2284:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2063:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2464:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2600:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2023:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2498:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2546:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2583:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2372:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1912:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2657:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2193:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2502:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2640:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1810:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2276:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2533:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1530:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2431:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1969:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1956:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1997:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2096:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2445:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1920:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.3052:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1807:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2484:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2651:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2387:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.3372:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2508:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2597:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2794:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2212:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1987:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2478:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2452:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2293:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2063:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2335:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2134:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2340:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2025:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2394:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2474:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2095:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1939:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1930:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2139:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2287:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2575:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2129:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2469:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.2070:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1312:  46%|████▋     | 186/401 [01:59<02:06,  1.70it/s]training loss: 0.1312:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2216:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.1827:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2636:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2714:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2118:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2539:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2602:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2660:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2306:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2106:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2250:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2847:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2546:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2131:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.1732:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.1909:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2380:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2907:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2309:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.1969:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2174:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.1933:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2299:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.1865:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2725:  47%|████▋     | 187/401 [01:59<01:50,  1.94it/s]training loss: 0.2377:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2051:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2471:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2112:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2401:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2200:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.1725:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2641:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2321:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.1800:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2665:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2460:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2014:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2624:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2573:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.1845:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.1731:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2822:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2072:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2720:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.3005:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2137:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.4400:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2402:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2354:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2129:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2187:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2278:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2181:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2237:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.1965:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2232:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2369:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2634:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2311:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2967:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2593:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2337:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2247:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2739:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2249:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2136:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2847:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2247:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2180:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2628:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2247:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2542:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2190:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2138:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2417:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2036:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.2510:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.1853:  47%|████▋     | 187/401 [02:00<01:50,  1.94it/s]training loss: 0.1853:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2098:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2760:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2536:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2803:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2360:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2841:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2705:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2620:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2148:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2594:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1896:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2976:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1732:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2556:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2100:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2697:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2260:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1580:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1797:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2348:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1711:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1870:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2295:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1923:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1861:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2634:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2314:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2168:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2839:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2662:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2294:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2408:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2054:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2008:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2688:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2053:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2414:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2725:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2207:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2093:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2378:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2112:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2272:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2420:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2415:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2044:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2040:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2207:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2265:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2227:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.3056:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2342:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2619:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2325:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2180:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2284:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2352:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2426:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2324:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2662:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2167:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2408:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1989:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1807:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.3074:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1730:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2722:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2534:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2168:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2143:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.1792:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2417:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2784:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2383:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2039:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2351:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2523:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2726:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2403:  47%|████▋     | 188/401 [02:00<01:49,  1.94it/s]training loss: 0.2403:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2443:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.1816:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2394:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2222:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2825:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2552:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2315:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2056:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.1743:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2217:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2673:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2692:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2545:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2187:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2407:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2340:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2332:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2774:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2366:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.1872:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.1946:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2303:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2408:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.1931:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2462:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2541:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2948:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.1855:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2365:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.1997:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2258:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2745:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2410:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2294:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2296:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2332:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2452:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2481:  47%|████▋     | 189/401 [02:00<01:43,  2.05it/s]training loss: 0.2485:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2175:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2309:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.3026:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.1914:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2812:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2175:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2296:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2200:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2709:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2520:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2338:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2205:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2510:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2800:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2920:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.1916:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2213:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2054:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.1880:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2551:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2102:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2411:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2065:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2514:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2820:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2554:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2088:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2271:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2257:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2070:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2214:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2080:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2604:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2165:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2204:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.1950:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2358:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2326:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.2380:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.1396:  47%|████▋     | 189/401 [02:01<01:43,  2.05it/s]training loss: 0.1396:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2240:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2411:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2148:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2107:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1655:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2448:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1967:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2422:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2411:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2454:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1933:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2253:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2894:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2850:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2162:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2547:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2697:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2262:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2386:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2443:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1632:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2452:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1831:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2001:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2129:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2730:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2435:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2064:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2158:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1877:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2953:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2330:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1575:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2531:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2394:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2615:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2082:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2630:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2365:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2360:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2118:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2023:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2390:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2024:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1962:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2533:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2242:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2279:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2760:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2123:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.3055:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2150:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1986:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2264:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2006:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2484:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2845:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2358:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1953:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2553:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2458:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2110:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2235:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2416:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2750:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2529:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2056:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2505:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2109:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2189:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2027:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2371:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1602:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2070:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2280:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2077:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.2143:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.1978:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.3991:  47%|████▋     | 190/401 [02:01<01:36,  2.18it/s]training loss: 0.3991:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2365:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2512:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2122:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2501:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2739:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2522:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2429:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1873:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2160:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1980:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2308:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1969:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2136:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2724:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2038:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2725:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2249:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2225:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2303:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2846:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2207:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2956:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2218:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2654:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2694:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2150:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2268:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2646:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1932:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2474:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2047:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2049:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1811:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2080:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1958:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2151:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1866:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1920:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2197:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2632:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2712:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1811:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2446:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2096:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2637:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2364:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2374:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.3057:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2301:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2615:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2324:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2286:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2064:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2308:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2280:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2284:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2108:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2376:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2355:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2842:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2718:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2066:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2341:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2436:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2329:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2245:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2313:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1986:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1998:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2459:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2006:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2429:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1916:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2632:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2455:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2702:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2340:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.2545:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1431:  48%|████▊     | 191/401 [02:04<04:06,  1.17s/it]training loss: 0.1431:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2232:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2542:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2560:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2019:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2370:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2212:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2650:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2781:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2007:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2202:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.1587:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2311:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2171:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.1886:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2268:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2273:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.1984:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2108:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.1713:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.1854:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2287:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2398:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2566:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.1951:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2347:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2019:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2128:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.2513:  48%|████▊     | 192/401 [02:04<03:27,  1.01it/s]training loss: 0.1658:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2339:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2598:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2096:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2750:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2165:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2450:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2786:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2645:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2213:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2203:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2044:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2121:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2478:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.1867:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2707:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.1999:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2174:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2146:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2494:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2317:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.3165:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.1944:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2156:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2732:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2244:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2478:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2720:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2347:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2215:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2490:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2000:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2366:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2801:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2594:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2579:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2851:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2448:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2691:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.1648:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2328:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2261:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2113:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2314:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2440:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2062:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2034:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2295:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2461:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.2326:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.3331:  48%|████▊     | 192/401 [02:05<03:27,  1.01it/s]training loss: 0.3331:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2671:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2241:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2512:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.3095:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2646:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2399:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2531:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2417:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2294:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2474:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2236:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1966:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2526:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1916:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2624:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1780:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2806:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2400:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2490:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2026:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2831:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2264:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2724:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2072:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2456:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2412:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2689:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2751:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1811:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2262:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2246:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2359:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2708:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1721:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2490:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2143:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1998:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2047:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2905:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2761:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2185:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2201:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2420:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2248:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1846:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2824:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2574:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2288:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1806:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1805:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2300:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2105:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1840:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1849:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2244:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2078:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2449:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.3132:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2216:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2615:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2484:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2278:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2194:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2273:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.1810:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2230:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2298:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2140:  48%|████▊     | 193/401 [02:05<03:23,  1.02it/s]training loss: 0.2378:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.2995:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.1945:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.2461:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.1855:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.2277:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.2242:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.2929:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.2621:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.2517:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.1888:  48%|████▊     | 193/401 [02:06<03:23,  1.02it/s]training loss: 0.1888:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2099:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1813:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2220:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2250:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2500:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2097:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.3126:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1878:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1822:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2880:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2556:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2744:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2500:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2030:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2424:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2435:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2911:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2104:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.3002:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2319:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2632:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2055:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1919:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2075:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1788:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2298:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1877:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2646:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2433:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2314:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2400:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2236:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1856:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2440:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2558:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2326:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2129:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2206:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2646:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1973:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2305:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2519:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2414:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2244:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2227:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1670:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.3031:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2160:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1952:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2674:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2288:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2232:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2314:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2319:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1971:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2045:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1879:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2925:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2492:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2141:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2157:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2603:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2393:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2086:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2444:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2436:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2228:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2042:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2185:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1964:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1618:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2339:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2078:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1855:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.1955:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2493:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2479:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2277:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2469:  48%|████▊     | 194/401 [02:06<02:51,  1.21it/s]training loss: 0.2469:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2287:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2437:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1917:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2573:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2526:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2155:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2606:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2313:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1774:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2402:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2144:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1866:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2327:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2285:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2267:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.3257:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2075:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2159:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2442:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2601:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2214:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2132:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2393:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2381:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2529:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2613:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1609:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2679:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2487:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2645:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2398:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2548:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2024:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2113:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2039:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2596:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2126:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2418:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2011:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2329:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2412:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2096:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2285:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2474:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2126:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2616:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2218:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2570:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2330:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2224:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1923:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1486:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2595:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2583:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1821:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2080:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2993:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2290:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2558:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2533:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2160:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2492:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1655:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1800:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.3219:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2158:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2951:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1745:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2351:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2433:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2236:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2463:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2364:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2415:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1909:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2353:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2380:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.2550:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1740:  49%|████▊     | 195/401 [02:06<02:19,  1.48it/s]training loss: 0.1740:  49%|████▉     | 196/401 [02:06<02:13,  1.54it/s]training loss: 0.2417:  49%|████▉     | 196/401 [02:06<02:13,  1.54it/s]training loss: 0.2189:  49%|████▉     | 196/401 [02:06<02:13,  1.54it/s]training loss: 0.1831:  49%|████▉     | 196/401 [02:06<02:13,  1.54it/s]training loss: 0.2350:  49%|████▉     | 196/401 [02:06<02:13,  1.54it/s]training loss: 0.2359:  49%|████▉     | 196/401 [02:06<02:13,  1.54it/s]training loss: 0.2685:  49%|████▉     | 196/401 [02:06<02:13,  1.54it/s]training loss: 0.2565:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2401:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2606:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2412:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2474:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1983:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1871:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2808:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1688:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2246:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2538:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2101:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2438:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1897:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2489:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2359:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2229:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2293:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2648:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2581:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2172:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2379:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2265:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.3087:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2766:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2387:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2028:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1851:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2514:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1887:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2710:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.3038:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2777:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1840:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2254:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2406:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2826:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2192:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2052:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2998:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2328:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2352:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2331:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2399:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2750:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2316:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1780:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1729:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2500:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2405:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2377:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2388:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2455:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2813:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.3112:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2499:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2638:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2345:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2695:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2572:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2281:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1994:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2154:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2605:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2020:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2918:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1722:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2415:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2449:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2231:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2338:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.2391:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1948:  49%|████▉     | 196/401 [02:07<02:13,  1.54it/s]training loss: 0.1948:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2629:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2178:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2074:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2278:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1870:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2576:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2073:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2559:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.3003:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2046:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2648:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2701:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1817:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2187:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2429:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2103:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2293:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2235:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1687:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2250:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2141:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2246:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2025:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.3060:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2563:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2529:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2176:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2562:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2087:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2278:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2242:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1965:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2429:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2643:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2248:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1969:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2396:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2483:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2514:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2097:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2759:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2113:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1990:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1971:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2140:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2389:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2315:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1928:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2381:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2128:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2264:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1888:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1849:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2303:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2527:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2533:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1996:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.1691:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2747:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.3261:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2970:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2400:  49%|████▉     | 197/401 [02:07<02:13,  1.52it/s]training loss: 0.2713:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2343:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.1915:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.3117:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2356:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2080:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2782:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2492:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.1862:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2441:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2116:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2556:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2091:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.1690:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2470:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2914:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2473:  49%|████▉     | 197/401 [02:08<02:13,  1.52it/s]training loss: 0.2473:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2348:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2636:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2068:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2062:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2179:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2374:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2669:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2006:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2272:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2192:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2006:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2433:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2475:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2253:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2049:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2809:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1951:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1887:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2275:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1721:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2016:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1963:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2130:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2059:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2213:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2552:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1901:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2491:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2010:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1973:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2456:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2346:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2002:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2162:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2192:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2525:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1751:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1880:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2919:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2782:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2402:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2494:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2403:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2343:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2228:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2401:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2277:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2389:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2563:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2206:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2109:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1783:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2612:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1911:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2056:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2083:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2380:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2195:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1727:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2028:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1944:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2116:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1993:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2614:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2819:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2287:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2601:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2145:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2245:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2530:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2111:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2301:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1889:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2084:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1639:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.1797:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2301:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2553:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2120:  49%|████▉     | 198/401 [02:08<02:02,  1.66it/s]training loss: 0.2120:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2546:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2130:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2123:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2232:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2471:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1774:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2225:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2601:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2535:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2436:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1908:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2491:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1640:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2433:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2018:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2586:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2117:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2552:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2375:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2485:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2615:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2399:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1997:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2124:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2000:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2123:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2160:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2167:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2012:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2217:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2294:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2679:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2422:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2764:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2276:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2676:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2232:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2304:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2156:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1920:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1868:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2160:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2313:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2604:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2688:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2405:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2090:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2226:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2524:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2616:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2773:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2424:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2401:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2185:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2422:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2914:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2018:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1958:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2269:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1893:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2647:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1981:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2275:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2520:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2408:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2146:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2689:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2389:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1950:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1872:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2326:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2294:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2272:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2482:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.3018:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.1885:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2235:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.2579:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.0972:  50%|████▉     | 199/401 [02:08<01:47,  1.88it/s]training loss: 0.0972:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2237:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2070:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2253:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2427:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2141:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2868:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2345:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2685:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2171:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2877:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2766:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2563:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2183:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.1946:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.1882:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.3010:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2104:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2351:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2324:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.1917:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2494:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2293:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2091:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2017:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2430:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2359:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.1929:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2924:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2258:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.1880:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.1781:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.1903:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2339:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2207:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2168:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2145:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2476:  50%|████▉     | 200/401 [02:08<01:35,  2.11it/s]training loss: 0.2152:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2625:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2901:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2961:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1965:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2159:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1886:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2567:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2042:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2722:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2444:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2546:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2498:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2380:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2961:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2069:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1809:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1927:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2741:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2573:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2265:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2491:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2226:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2623:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2196:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2174:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2240:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2257:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2799:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2292:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2051:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2804:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2295:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1978:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1764:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2091:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2522:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2529:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1953:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2307:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.2025:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1433:  50%|████▉     | 200/401 [02:09<01:35,  2.11it/s]training loss: 0.1433:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.1999:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.2150:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.2092:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.2474:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.2031:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.2111:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.2099:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.3103:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.2101:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.1895:  50%|█████     | 201/401 [02:11<04:14,  1.27s/it]training loss: 0.2126:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1827:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2398:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2082:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2163:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2143:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2218:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2458:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2404:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2445:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2433:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2370:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1998:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2631:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2150:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2841:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2374:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2219:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2569:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2522:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2615:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1836:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2004:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2126:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2268:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1900:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2915:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2067:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2427:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2683:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2186:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1869:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2775:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2027:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2360:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2117:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1613:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2214:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2043:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1862:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2377:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2061:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2041:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2178:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2622:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2524:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2345:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2405:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2369:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2077:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1785:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1965:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2381:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2358:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2672:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2669:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2721:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2213:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1492:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2707:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2019:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1984:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1967:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1924:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2159:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2245:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2380:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.2273:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1745:  50%|█████     | 201/401 [02:12<04:14,  1.27s/it]training loss: 0.1745:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1990:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2300:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2674:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2651:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2110:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2331:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2398:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2120:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2244:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1796:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2069:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1898:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2867:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2218:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2374:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1889:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2331:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2320:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2282:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2274:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2521:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2372:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2664:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2470:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2471:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2127:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2618:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2293:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2093:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1652:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2287:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2346:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2505:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2478:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2928:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2331:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2414:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1950:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2192:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2149:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2682:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2035:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2191:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1826:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2185:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2297:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1980:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2128:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1963:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1829:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1997:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2848:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.3344:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2001:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2569:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2216:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2027:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2194:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2613:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1827:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2334:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2395:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2308:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2405:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2004:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2162:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2156:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2168:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2645:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2604:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2294:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2272:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2812:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2266:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2379:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2216:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1887:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.2386:  50%|█████     | 202/401 [02:12<03:34,  1.08s/it]training loss: 0.1604:  50%|█████     | 202/401 [02:13<03:34,  1.08s/it]training loss: 0.1604:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2043:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2024:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1823:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2871:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1771:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2597:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2167:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2591:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2826:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2856:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2269:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2025:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1799:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2526:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1908:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1778:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1666:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2220:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2439:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1856:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2572:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1869:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2084:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2257:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2270:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2361:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2267:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2234:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2090:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2190:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1825:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1977:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2283:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2041:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2428:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2380:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1948:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2334:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2338:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2184:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2464:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2304:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2754:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2971:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2352:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2442:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1997:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2410:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1737:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1596:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2190:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1796:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2334:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2078:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2846:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2199:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2393:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2190:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2558:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2538:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1981:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2575:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1979:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1997:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1982:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2061:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2541:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2306:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2071:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2051:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2152:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2316:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2091:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2407:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1898:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2234:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1890:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.2015:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1377:  51%|█████     | 203/401 [02:13<02:58,  1.11it/s]training loss: 0.1377:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.1892:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2362:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2587:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2117:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2016:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.1797:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2539:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2214:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2249:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.1900:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.1891:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2905:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2179:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.1486:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2118:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.1933:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2708:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2110:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2099:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2169:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2141:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2969:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2212:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2702:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2191:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2481:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2377:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2593:  51%|█████     | 204/401 [02:13<02:52,  1.14it/s]training loss: 0.2290:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.3178:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1920:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1981:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2079:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2264:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1967:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2934:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2683:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2329:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2006:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2365:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2182:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1980:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2157:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2342:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1996:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1850:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1908:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2043:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2451:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2120:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2467:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2217:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2088:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2297:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2282:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2383:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2363:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2481:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2200:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1699:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1733:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2840:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2168:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2100:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1836:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2096:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2371:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2063:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1840:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2766:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1906:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2600:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1749:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2991:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2618:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1739:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1889:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.1992:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2390:  51%|█████     | 204/401 [02:14<02:52,  1.14it/s]training loss: 0.2390:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.1944:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2450:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2153:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2060:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2099:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2491:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2243:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2376:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2043:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2219:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2560:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2027:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.1866:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.1926:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2453:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.1784:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2124:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2053:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2270:  51%|█████     | 205/401 [02:14<02:52,  1.14it/s]training loss: 0.2565:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1887:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2664:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2324:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2361:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1771:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2210:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2056:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2170:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2689:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2258:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1808:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2445:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2522:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2519:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1900:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1790:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2783:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2380:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2702:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1925:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1699:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2020:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2188:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2006:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2510:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2389:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2434:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2114:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2678:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2347:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2208:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2455:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2574:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2022:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2263:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1529:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2441:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1898:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1880:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2140:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2612:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2528:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2266:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2394:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2926:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1503:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1908:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2046:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2147:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2181:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1998:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2547:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1807:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2675:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2039:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.1767:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2339:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.2737:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.0837:  51%|█████     | 205/401 [02:15<02:52,  1.14it/s]training loss: 0.0837:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1874:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2094:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2365:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2028:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2183:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1957:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2174:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1535:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2277:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.3062:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2431:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2265:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.3026:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2289:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2016:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2211:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2270:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2413:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1666:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2923:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2473:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1635:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.3112:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2762:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2059:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1981:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1763:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.3105:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2312:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2065:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1829:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2277:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2750:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1979:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1911:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2004:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1996:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2655:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2611:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1802:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2781:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2948:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2250:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2337:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.1983:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2426:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2455:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2332:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2050:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2302:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2545:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2538:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2006:  51%|█████▏    | 206/401 [02:15<02:44,  1.18it/s]training loss: 0.2048:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1858:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2362:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2502:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1929:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2325:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2058:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1845:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2556:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.3079:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2077:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2560:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1939:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1890:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2404:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1715:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1917:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2432:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2409:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2339:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2158:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2213:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1849:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2156:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.2056:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1086:  51%|█████▏    | 206/401 [02:16<02:44,  1.18it/s]training loss: 0.1086:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1952:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2348:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2119:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2274:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2894:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2323:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1855:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2286:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1854:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2313:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2823:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2210:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2198:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2036:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1945:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2121:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2434:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2111:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2306:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1991:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2517:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2080:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2160:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1572:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2180:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2126:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2474:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1833:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2001:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2483:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2150:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2382:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2849:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2525:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2075:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1803:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2429:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1910:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1891:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2047:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2442:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2953:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.3021:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1873:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2563:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1957:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2397:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2227:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2445:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2195:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2079:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1950:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2201:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2237:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2301:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2629:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2191:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1821:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2455:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1880:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2382:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2254:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2239:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.3115:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1731:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2262:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2498:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2593:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2569:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2263:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2471:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.3203:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1901:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.1677:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2160:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2260:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2443:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.2449:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.3648:  52%|█████▏    | 207/401 [02:16<02:32,  1.27it/s]training loss: 0.3648:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2119:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2017:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1899:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1973:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1998:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2355:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1657:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2676:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1799:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2038:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1963:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2655:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1970:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2010:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2478:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2372:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2018:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2928:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2369:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1996:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2190:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.3329:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1680:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1856:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2540:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2668:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1745:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1658:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2830:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2037:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2256:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2193:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2127:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2253:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2724:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2050:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2833:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.1929:  52%|█████▏    | 208/401 [02:16<02:12,  1.46it/s]training loss: 0.2087:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1733:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2187:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1973:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2057:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2940:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2838:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2149:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2589:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1940:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2371:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2258:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2065:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2751:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2554:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2345:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1806:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1736:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2469:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2807:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1836:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1973:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1844:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2383:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2433:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.3038:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2139:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2549:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2479:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2350:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2180:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1904:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2057:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1962:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.1822:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2472:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2212:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2249:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2540:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2145:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2125:  52%|█████▏    | 208/401 [02:17<02:12,  1.46it/s]training loss: 0.2125:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1945:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2444:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2723:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2575:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2443:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2497:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1645:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2233:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1954:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2860:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2073:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2215:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1994:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2248:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1710:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1816:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2217:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2387:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1720:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2031:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2289:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2316:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2592:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1982:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2096:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2098:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2691:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1862:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2384:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2254:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2197:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1644:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2599:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2226:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2210:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2355:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2766:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1615:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2220:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2270:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2066:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2359:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2382:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2390:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1985:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1923:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2257:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2942:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1926:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2329:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2058:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2233:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2561:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2555:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2295:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2431:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2256:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2240:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2669:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2099:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1781:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2004:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2263:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2218:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2458:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2272:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2040:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2069:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1916:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1737:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2332:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2207:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1991:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2715:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2401:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1715:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.1700:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.2236:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.4719:  52%|█████▏    | 209/401 [02:17<02:04,  1.55it/s]training loss: 0.4719:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.1775:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2748:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.1939:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2178:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.1886:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2002:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2299:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.3013:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2351:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2048:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2253:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.1970:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2490:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2133:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2100:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2388:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2250:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2792:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2567:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2243:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2565:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2475:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.1895:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.1766:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.3060:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2162:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2121:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2368:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2094:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2028:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2503:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2398:  52%|█████▏    | 210/401 [02:17<01:51,  1.72it/s]training loss: 0.2004:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2720:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2474:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2023:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2833:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.1925:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2307:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2567:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2340:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.1899:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2269:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.1799:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2268:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2266:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2085:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2501:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.1941:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2656:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2052:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2472:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.1776:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2209:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2791:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2851:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2094:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2177:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2083:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.1605:  52%|█████▏    | 210/401 [02:18<01:51,  1.72it/s]training loss: 0.2377:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2323:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2063:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2306:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2364:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2118:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2602:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2025:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2484:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.1883:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.1841:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2367:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.1796:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2524:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.1815:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.1911:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2045:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.2195:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.1941:  52%|█████▏    | 210/401 [02:19<01:51,  1.72it/s]training loss: 0.1941:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2537:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2534:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2408:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1965:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2007:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2587:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1917:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1895:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2120:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1828:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2272:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2141:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2400:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2563:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2136:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2469:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1832:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2019:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2212:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1576:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2492:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2168:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2477:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2275:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2718:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2593:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2479:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2211:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2446:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2654:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1950:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2026:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2212:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2145:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1966:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2559:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1548:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2206:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2091:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2062:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2379:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2746:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2584:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2240:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2109:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1942:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2504:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2263:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2307:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2186:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2258:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2314:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2059:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1811:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2557:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2740:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2459:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2064:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2313:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2919:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2319:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2074:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2066:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2773:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2283:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2494:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2631:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2868:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1987:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2734:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2356:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2137:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2430:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2554:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2101:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2140:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2394:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.2365:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1603:  53%|█████▎    | 211/401 [02:22<05:31,  1.74s/it]training loss: 0.1603:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2295:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2179:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2110:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2160:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.1968:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2304:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2111:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.1619:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2129:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2215:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2441:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.1808:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2368:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.3254:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2404:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2323:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2163:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2853:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.1990:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.1872:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2041:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.1896:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2258:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.1878:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.1986:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2274:  53%|█████▎    | 212/401 [02:22<04:31,  1.44s/it]training loss: 0.2012:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2655:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2377:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2506:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2214:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1812:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1929:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2654:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1953:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2060:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2103:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2605:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2475:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2666:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2238:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2190:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2811:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2254:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2250:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2007:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2156:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2180:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2322:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2315:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2109:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2413:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2636:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2203:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1631:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2523:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2606:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2255:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1852:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2226:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1703:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2466:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2099:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2136:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2195:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2657:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2251:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2122:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2031:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2244:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2372:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2539:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1996:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2186:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2196:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1884:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1991:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.2989:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1187:  53%|█████▎    | 212/401 [02:23<04:31,  1.44s/it]training loss: 0.1187:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.3002:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1917:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.3026:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2011:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2587:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2597:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1992:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1992:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2116:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2108:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1791:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2099:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1715:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1891:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2683:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2013:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2512:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2678:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2017:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2392:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2273:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2059:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2572:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2019:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2508:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2685:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1731:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2713:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2084:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1888:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2333:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1863:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1980:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2514:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1798:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1826:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1773:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.1880:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2104:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.2299:  53%|█████▎    | 213/401 [02:23<03:55,  1.25s/it]training loss: 0.3072:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1841:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2261:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2563:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2057:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2001:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1721:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1745:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2260:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2238:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1907:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1522:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2290:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2660:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2134:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2860:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1514:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1861:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2052:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2008:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1752:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2421:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2099:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2563:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1653:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2247:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1667:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2158:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1584:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2148:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2696:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2483:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1909:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2211:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2610:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.1883:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2273:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2179:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2289:  53%|█████▎    | 213/401 [02:24<03:55,  1.25s/it]training loss: 0.2289:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2059:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2168:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2580:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2414:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1821:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2540:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2380:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1808:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2351:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2333:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2347:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2297:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2193:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2335:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1847:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2042:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2450:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2254:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2198:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2667:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2393:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2487:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2183:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2551:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2040:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2132:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1873:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.3051:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1976:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1811:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2983:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2599:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2262:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2210:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2732:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2335:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1905:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2336:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1790:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1671:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2218:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.3225:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2022:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2423:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1751:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2141:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2146:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2030:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2253:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2129:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2310:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2417:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2809:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2170:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2357:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1907:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1759:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2421:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2010:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2552:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2857:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2162:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2400:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2456:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2385:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1931:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2422:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2819:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1751:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2894:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2169:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2104:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1991:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1820:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2467:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2044:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.2715:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1872:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1775:  53%|█████▎    | 214/401 [02:24<03:25,  1.10s/it]training loss: 0.1775:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2308:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2031:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2036:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2128:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2325:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2424:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2217:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2081:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.1881:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2656:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2658:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2038:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.1976:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.1695:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2175:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2342:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2549:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2858:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2290:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2269:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2289:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2225:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2237:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2457:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2085:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2487:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2573:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.1791:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2305:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.1913:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2064:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2770:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2346:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2527:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2235:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2386:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.1969:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2612:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.1877:  54%|█████▎    | 215/401 [02:24<02:45,  1.12it/s]training loss: 0.2800:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2438:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1837:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1913:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2207:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2191:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2076:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1849:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2442:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2267:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2103:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2931:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2668:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1882:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1731:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2197:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2174:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2440:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2492:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1862:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1966:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1995:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1930:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1826:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1992:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2408:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2180:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2286:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2481:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1720:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2071:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2463:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2249:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.3228:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1535:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2207:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1803:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1955:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.2329:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1427:  54%|█████▎    | 215/401 [02:25<02:45,  1.12it/s]training loss: 0.1427:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1863:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1869:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2078:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2362:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1838:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2112:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1828:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1478:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1957:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2399:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1945:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2457:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2766:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2281:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2744:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2278:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2350:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2542:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1951:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2628:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2286:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2253:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1807:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1723:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2453:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2779:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2356:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2183:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2059:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.3065:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2079:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1983:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2097:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2191:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2215:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2141:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1974:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2407:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2685:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2254:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2635:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1608:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2557:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2383:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1811:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2323:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2398:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2702:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2437:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2377:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.2267:  54%|█████▍    | 216/401 [02:25<02:46,  1.11it/s]training loss: 0.1915:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.1997:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2447:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2039:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2632:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2319:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2202:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.1887:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2028:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2072:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2241:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2190:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.1420:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2493:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2124:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2210:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2676:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2873:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2409:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2095:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2038:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2551:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2741:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2443:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.1589:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.1845:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2097:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2317:  54%|█████▍    | 216/401 [02:26<02:46,  1.11it/s]training loss: 0.2317:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2214:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2203:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2541:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1751:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2294:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1719:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2275:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2491:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1909:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2378:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2096:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2142:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2546:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2161:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2649:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2522:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1931:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1883:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1925:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2495:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2085:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1974:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1632:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2146:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2011:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2008:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1982:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1574:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2233:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1577:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2138:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2315:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2511:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2516:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1804:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2457:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2440:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1919:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2578:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.3297:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2603:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2097:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2449:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1741:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2187:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2315:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2328:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1795:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1885:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2371:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1729:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2426:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2554:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2210:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2426:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1982:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2504:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2252:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2407:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1413:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2366:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1930:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2044:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1488:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.1795:  54%|█████▍    | 217/401 [02:26<02:31,  1.22it/s]training loss: 0.2764:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.1987:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2011:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2441:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.1561:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2121:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.1951:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2321:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2945:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.1930:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2865:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2013:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.1962:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2383:  54%|█████▍    | 217/401 [02:27<02:31,  1.22it/s]training loss: 0.2383:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2121:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1749:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1962:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1541:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1767:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2139:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2481:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2416:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2051:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2261:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2157:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2473:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1580:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1985:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1923:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2426:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2600:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1678:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2087:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2196:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1960:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2606:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2403:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2206:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2061:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2282:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1823:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2172:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2303:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2493:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2113:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2513:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2179:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2120:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1999:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2042:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2891:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2448:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2394:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2464:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2191:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2350:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2159:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2437:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1716:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1779:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2285:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2088:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2213:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1892:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2661:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2136:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2119:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2805:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1657:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2231:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1512:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1564:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2242:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1975:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1646:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2868:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2194:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2090:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2591:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2444:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2182:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2403:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1540:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2433:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2270:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2422:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2979:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2305:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2179:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2976:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2189:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.1748:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2585:  54%|█████▍    | 218/401 [02:27<02:27,  1.24it/s]training loss: 0.2585:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2488:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2180:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1748:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2123:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2126:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1754:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2236:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2764:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2969:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2415:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2366:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1866:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1757:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2403:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2396:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2625:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2724:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2726:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1937:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2108:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2616:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2699:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2154:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2753:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2580:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2352:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1925:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2359:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2114:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1972:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2466:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2023:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2068:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1670:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1851:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1815:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2369:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1946:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1783:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2810:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2283:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2568:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1718:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1997:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2208:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1467:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1884:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2607:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2132:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1948:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2323:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2281:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2471:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2126:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1889:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1641:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2365:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2125:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.1906:  55%|█████▍    | 219/401 [02:27<02:13,  1.36it/s]training loss: 0.2852:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2257:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2336:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2137:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2193:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.1979:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2058:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2384:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2128:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2354:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.1811:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.1886:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2120:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2671:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2543:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2261:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2000:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2286:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.2236:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.1614:  55%|█████▍    | 219/401 [02:28<02:13,  1.36it/s]training loss: 0.1614:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2083:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2383:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2362:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2509:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1829:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2429:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2721:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1940:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2508:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2836:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.3064:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2312:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1842:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2039:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2385:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2232:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1717:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2859:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2451:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1920:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2631:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2148:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2180:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2270:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2130:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2310:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2215:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2099:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2144:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1761:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2054:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2327:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1523:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2414:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2026:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2019:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2384:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2027:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1669:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2245:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2291:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2056:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2381:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2468:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2661:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2397:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2070:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1834:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2575:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2585:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2504:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2083:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2142:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1931:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1727:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2071:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1914:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2142:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2558:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2347:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2392:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2413:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1970:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2608:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2129:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1929:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2618:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1699:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2376:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2309:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2515:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1973:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2492:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2030:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2031:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2107:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2481:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.2021:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1857:  55%|█████▍    | 220/401 [02:28<01:55,  1.56it/s]training loss: 0.1857:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1851:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1799:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1961:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2175:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2457:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2124:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1814:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1643:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2445:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2360:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1923:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2348:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2871:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2009:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2054:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2907:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2424:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2046:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2013:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2507:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2998:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1973:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2773:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1782:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2210:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2083:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2570:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2050:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2176:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2206:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1708:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2318:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1944:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1885:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2424:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2301:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2210:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1709:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1997:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2161:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2172:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1927:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2245:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2197:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2422:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2226:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1980:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1896:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1878:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1969:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2213:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2186:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2369:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2154:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1771:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1986:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2351:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2463:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1732:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2528:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2282:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2393:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2230:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1551:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2394:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1809:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1716:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1814:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1873:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2124:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2033:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2307:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2368:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2167:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.1781:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2528:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2158:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2453:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2390:  55%|█████▌    | 221/401 [02:31<04:02,  1.35s/it]training loss: 0.2390:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2375:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2020:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2134:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2412:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2307:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2306:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1862:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2228:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2221:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2026:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2526:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2962:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2271:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2728:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2735:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2185:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1500:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2900:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2354:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2069:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2576:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2669:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1958:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2810:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1704:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1261:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1971:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2438:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2262:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2464:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2550:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2185:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2088:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1784:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2427:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2252:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2178:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2105:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1976:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1774:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2735:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2460:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2723:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1813:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2541:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2080:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2611:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.1977:  55%|█████▌    | 222/401 [02:31<03:09,  1.06s/it]training loss: 0.2317:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.1989:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2159:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2398:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.1601:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2317:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2151:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2536:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2075:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.1855:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2157:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.1851:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.1712:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2464:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2614:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2062:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2427:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2301:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2786:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2376:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2643:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2262:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2311:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2188:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2782:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2352:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2030:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.1969:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2512:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2320:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2945:  55%|█████▌    | 222/401 [02:32<03:09,  1.06s/it]training loss: 0.2945:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2435:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2268:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1791:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2085:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2174:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2249:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2051:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1714:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2424:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1976:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2360:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2766:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2310:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2258:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2675:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2083:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2342:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2678:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2211:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2681:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1923:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2460:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2110:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1812:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1734:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1920:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2628:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2549:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2737:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2155:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1943:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1860:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2029:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2469:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2324:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2104:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2147:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2117:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2638:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.1973:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2294:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2085:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2336:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2002:  56%|█████▌    | 223/401 [02:32<03:22,  1.14s/it]training loss: 0.2140:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2441:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2375:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2194:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2488:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.3076:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2045:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2108:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1845:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1758:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2198:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2216:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2005:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2097:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2418:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1861:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2364:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1764:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1930:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2258:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.3115:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1990:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2097:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2032:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2264:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1876:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2332:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1963:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1762:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2743:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2416:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1921:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.1993:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.2247:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.3690:  56%|█████▌    | 223/401 [02:33<03:22,  1.14s/it]training loss: 0.3690:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2183:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1751:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2297:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2119:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2176:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2740:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1708:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1802:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2158:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2218:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1909:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2054:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1679:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2430:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2411:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2194:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2532:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2312:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2118:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2341:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2461:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1926:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2408:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2237:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2567:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1654:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1794:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1965:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1996:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1982:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1863:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2454:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2640:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2069:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2070:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1815:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.3112:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2400:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2017:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2680:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2571:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2406:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2291:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2193:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2212:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2734:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1961:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1497:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2598:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1999:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2150:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1728:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2162:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2083:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2586:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1609:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2258:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1541:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1561:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2414:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2063:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1719:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2305:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2494:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2860:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2229:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1587:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2697:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2695:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2097:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2342:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2261:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2263:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1718:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2220:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2068:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.2388:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.1857:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.3429:  56%|█████▌    | 224/401 [02:33<02:41,  1.09it/s]training loss: 0.3429:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1872:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2303:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2671:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2080:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2064:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2134:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1925:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2357:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2324:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2228:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2351:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2357:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1782:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2304:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2335:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2567:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1955:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.3286:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2121:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2458:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2207:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1735:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2424:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2319:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1852:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1779:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1920:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2605:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2221:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2934:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2131:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.3023:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2529:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2359:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2360:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1947:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2163:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1857:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2528:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2056:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2125:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2113:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2443:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1731:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1711:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1963:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2081:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1867:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2485:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1912:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2023:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2533:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2433:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2413:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2911:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2273:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2281:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2420:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2289:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2698:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2218:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2217:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2161:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1912:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2232:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2107:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2538:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1558:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2038:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2125:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1702:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2207:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2118:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2220:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2605:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2472:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2649:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.2148:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1701:  56%|█████▌    | 225/401 [02:33<02:11,  1.33it/s]training loss: 0.1701:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.1626:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.1619:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2574:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2013:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2721:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2482:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2334:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2510:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2051:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2768:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2098:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2100:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.1588:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2363:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2356:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2487:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2365:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2114:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2042:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2643:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.1945:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2333:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2408:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.1928:  56%|█████▋    | 226/401 [02:33<01:50,  1.59it/s]training loss: 0.2541:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1860:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2252:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1978:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2149:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2660:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2064:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2334:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2200:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1643:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2210:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2367:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2398:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1964:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1672:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1793:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2304:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2225:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2406:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2336:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2770:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1737:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2509:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1606:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2000:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2313:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2630:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2499:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2051:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2519:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1967:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2173:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2373:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2030:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2553:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2146:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1883:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1927:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1756:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1576:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1950:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2083:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2343:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2402:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2313:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2067:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2688:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2199:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1651:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2153:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2082:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2470:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.2354:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1809:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1610:  56%|█████▋    | 226/401 [02:34<01:50,  1.59it/s]training loss: 0.1610:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2163:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1872:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2446:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2040:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2176:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2855:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2248:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1962:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2377:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2105:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2658:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2326:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2235:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2167:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2152:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1656:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2313:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2455:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2153:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1762:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1949:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2153:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2303:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2127:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2503:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1820:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2173:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1845:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1838:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1573:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2321:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2178:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1869:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2663:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1589:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2633:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2109:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2174:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2218:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2347:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2874:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2328:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2429:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2424:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2073:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1676:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1830:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2192:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2131:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1972:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2270:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2216:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2638:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1812:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2351:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2477:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2768:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1920:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1633:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2135:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2162:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.3062:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1896:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2495:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2094:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1959:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2531:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2154:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2242:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1673:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2066:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2190:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1472:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2020:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.1909:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2169:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2858:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.2088:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.3752:  57%|█████▋    | 227/401 [02:34<01:38,  1.76it/s]training loss: 0.3752:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2225:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2590:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1982:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1767:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2110:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2039:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1644:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2360:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2112:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2032:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2124:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2607:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1829:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2140:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2254:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1581:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1956:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2220:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2207:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1901:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1927:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2423:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2097:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1956:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1599:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2406:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1865:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1770:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2164:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1753:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2165:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1776:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2543:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2368:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1797:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2032:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2289:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2651:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2790:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2502:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.3172:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2293:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1879:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2628:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1846:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2528:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2498:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1969:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2630:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2175:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1724:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2013:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2842:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2704:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.1796:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2245:  57%|█████▋    | 228/401 [02:34<01:30,  1.91it/s]training loss: 0.2038:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2422:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2566:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2739:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2002:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2925:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2290:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2270:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2212:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.1996:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.1974:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.1554:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2303:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2638:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.1869:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2291:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.1910:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2849:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.1902:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.1838:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2326:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2235:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2552:  57%|█████▋    | 228/401 [02:35<01:30,  1.91it/s]training loss: 0.2552:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1764:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2171:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1806:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2173:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2137:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2098:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1855:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2368:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1871:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2507:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2455:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2723:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2133:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1841:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2444:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2162:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2331:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2289:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2145:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2382:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2474:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2529:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2112:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2465:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1524:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2338:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2277:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2231:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2102:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2152:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2129:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2046:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2411:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1923:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2432:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1896:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2424:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1969:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1956:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1449:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1820:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1938:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2176:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1870:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1785:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2465:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1716:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1859:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2095:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2045:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1519:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2312:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2279:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2294:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2233:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1759:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2857:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1878:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2467:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2217:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2351:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2528:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2509:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2027:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2449:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2069:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2232:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2124:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2000:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.3142:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2041:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1660:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2115:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1807:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2344:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1728:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.1818:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2057:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2539:  57%|█████▋    | 229/401 [02:35<01:21,  2.11it/s]training loss: 0.2539:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1531:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1710:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2054:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2351:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2451:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2246:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1658:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2878:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1697:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2208:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2281:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2100:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2173:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2460:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2490:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2218:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1936:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2138:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2156:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2384:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1982:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2421:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1914:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1616:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2613:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2261:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2200:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2037:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2433:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1922:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2087:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1950:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1761:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2488:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2330:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2009:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2578:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2113:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2113:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2598:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2191:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2316:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2460:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2009:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2677:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2645:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1912:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2037:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1811:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1810:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2370:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1753:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1758:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1604:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1839:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2025:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2572:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2248:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1837:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2118:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1962:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1835:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2498:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2129:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1554:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1768:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2622:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2154:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2134:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2421:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2733:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2047:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2071:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2806:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2051:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1407:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2507:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.2320:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1941:  57%|█████▋    | 230/401 [02:35<01:14,  2.28it/s]training loss: 0.1941:  58%|█████▊    | 231/401 [02:38<03:24,  1.20s/it]training loss: 0.2297:  58%|█████▊    | 231/401 [02:38<03:24,  1.20s/it]training loss: 0.2210:  58%|█████▊    | 231/401 [02:38<03:24,  1.20s/it]training loss: 0.2495:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1879:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1897:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2424:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2021:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2266:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2278:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2377:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2502:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2281:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2391:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1835:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1729:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1746:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1774:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2617:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2482:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2211:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2291:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2532:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2585:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2125:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2325:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2714:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2317:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2717:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1969:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2061:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2350:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2269:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2414:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2601:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1726:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2911:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2397:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.1886:  58%|█████▊    | 231/401 [02:39<03:24,  1.20s/it]training loss: 0.2284:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2103:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2022:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1852:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2303:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2322:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2278:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2483:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1961:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2458:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1880:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1692:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1916:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2307:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1980:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2206:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1954:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2052:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2260:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2252:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1970:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1429:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2377:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2447:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2410:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1915:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2154:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2974:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2281:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2484:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.2029:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1971:  58%|█████▊    | 231/401 [02:40<03:24,  1.20s/it]training loss: 0.1794:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.2319:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.2524:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.2875:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.2129:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.1931:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.1881:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.2106:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.1011:  58%|█████▊    | 231/401 [02:41<03:24,  1.20s/it]training loss: 0.1011:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2629:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2089:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2268:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2459:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2140:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.1743:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.1966:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2916:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.1972:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2180:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2815:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2308:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2162:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2655:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2560:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.1702:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2117:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2116:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2265:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2772:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.1912:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2262:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2287:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2174:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2407:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2789:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2017:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2000:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2342:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2526:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2331:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2301:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.1932:  58%|█████▊    | 232/401 [02:41<04:53,  1.73s/it]training loss: 0.2302:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2194:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1909:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1994:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2465:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2830:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2254:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2137:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2206:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2673:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2406:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1690:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2304:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1241:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2208:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2133:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1729:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2053:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2219:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1908:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2578:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2444:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2093:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1741:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2279:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2216:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1581:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2825:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1772:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2547:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2252:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.1515:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2114:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2388:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2180:  58%|█████▊    | 232/401 [02:42<04:53,  1.73s/it]training loss: 0.2141:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.2434:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.2266:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.1940:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.2436:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.2259:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.1790:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.1944:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.1673:  58%|█████▊    | 232/401 [02:43<04:53,  1.73s/it]training loss: 0.2568:  58%|█████▊    | 232/401 [02:44<04:53,  1.73s/it]training loss: 0.1842:  58%|█████▊    | 232/401 [02:44<04:53,  1.73s/it]training loss: 0.1842:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2455:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2198:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2104:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2444:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2087:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.1715:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.1792:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2334:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2470:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.1851:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2236:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.1951:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.1152:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2301:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2437:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.1912:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2169:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.1945:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2662:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2494:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2422:  58%|█████▊    | 233/401 [02:44<05:46,  2.06s/it]training loss: 0.2302:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1966:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2059:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1889:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1850:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1726:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2145:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2171:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1678:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2159:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2264:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2920:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2588:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1912:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2120:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2491:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2813:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2033:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2188:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2154:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2056:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2422:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1649:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1923:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2217:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2170:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2371:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2591:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2774:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1925:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.2431:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1970:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1780:  58%|█████▊    | 233/401 [02:45<05:46,  2.06s/it]training loss: 0.1784:  58%|█████▊    | 233/401 [02:46<05:46,  2.06s/it]training loss: 0.2323:  58%|█████▊    | 233/401 [02:46<05:46,  2.06s/it]training loss: 0.2124:  58%|█████▊    | 233/401 [02:46<05:46,  2.06s/it]training loss: 0.2812:  58%|█████▊    | 233/401 [02:46<05:46,  2.06s/it]training loss: 0.2034:  58%|█████▊    | 233/401 [02:46<05:46,  2.06s/it]training loss: 0.2081:  58%|█████▊    | 233/401 [02:46<05:46,  2.06s/it]training loss: 0.2189:  58%|█████▊    | 233/401 [02:46<05:46,  2.06s/it]training loss: 0.1966:  58%|█████▊    | 233/401 [02:46<05:46,  2.06s/it]training loss: 0.2198:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.2337:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.2302:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.2614:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.2266:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.2339:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.1962:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.2452:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.1671:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.2792:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.1857:  58%|█████▊    | 233/401 [02:47<05:46,  2.06s/it]training loss: 0.2286:  58%|█████▊    | 233/401 [02:48<05:46,  2.06s/it]training loss: 0.1732:  58%|█████▊    | 233/401 [02:48<05:46,  2.06s/it]training loss: 0.2251:  58%|█████▊    | 233/401 [02:48<05:46,  2.06s/it]training loss: 0.2029:  58%|█████▊    | 233/401 [02:48<05:46,  2.06s/it]training loss: 0.1527:  58%|█████▊    | 233/401 [02:48<05:46,  2.06s/it]training loss: 0.1114:  58%|█████▊    | 233/401 [02:48<05:46,  2.06s/it]training loss: 0.1114:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.1992:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.2071:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.1894:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.2443:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.2625:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.2461:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.3130:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.2232:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.1926:  58%|█████▊    | 234/401 [02:48<07:37,  2.74s/it]training loss: 0.1864:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.1750:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.1625:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2089:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2332:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2444:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2434:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2255:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2083:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2252:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.1545:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2369:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2127:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.2040:  58%|█████▊    | 234/401 [02:49<07:37,  2.74s/it]training loss: 0.1637:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2076:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1794:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1643:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2302:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2139:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1503:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2632:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2641:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2340:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2643:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2148:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.3112:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2598:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2154:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1970:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1820:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2031:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2730:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2080:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2690:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2096:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2217:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1833:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2529:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1892:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2402:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2593:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2081:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2186:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2104:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1747:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2452:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2397:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2733:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2016:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2124:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2071:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2377:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2457:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2613:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2345:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1854:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1772:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2537:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1922:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1970:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2004:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.1797:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2157:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2341:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2285:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2281:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2395:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.2201:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.3495:  58%|█████▊    | 234/401 [02:50<07:37,  2.74s/it]training loss: 0.3495:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.1953:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2334:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.1720:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2212:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2503:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2446:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2493:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2166:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2314:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2225:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2137:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2168:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2814:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2489:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2038:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2091:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2891:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.1870:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2178:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.1896:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2194:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2508:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2597:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.1774:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2286:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.1815:  59%|█████▊    | 235/401 [02:50<06:55,  2.50s/it]training loss: 0.2772:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2102:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1887:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2678:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2507:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2355:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2378:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2499:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2346:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2372:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2301:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1904:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2431:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2117:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2758:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1343:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2019:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2298:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1910:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1941:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2317:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1836:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2320:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1982:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2332:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2290:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1768:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1828:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2354:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1895:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2361:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2136:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2221:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2140:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2001:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2155:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1528:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1768:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2221:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2424:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2249:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1967:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2022:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1940:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2053:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.1939:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2705:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2841:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2510:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2503:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2324:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2052:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2425:  59%|█████▊    | 235/401 [02:51<06:55,  2.50s/it]training loss: 0.2425:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2078:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2356:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.1538:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2429:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2286:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2472:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2373:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2951:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2206:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.3345:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2203:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2717:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.1963:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2335:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2253:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.1743:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2060:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.1993:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2130:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2884:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2342:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2065:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2163:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2481:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2116:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2164:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2025:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2252:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.1897:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2492:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.1954:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2215:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2967:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.1605:  59%|█████▉    | 236/401 [02:51<05:44,  2.09s/it]training loss: 0.2735:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2765:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1536:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2099:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2152:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.3078:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2687:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2200:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2310:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1763:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2564:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2594:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2261:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2033:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2424:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2144:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2026:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1795:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1952:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2164:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2105:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2250:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1875:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2007:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2257:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.3255:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2240:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2177:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1901:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2408:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2215:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2073:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2345:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2871:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1879:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2481:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2073:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2558:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1409:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1867:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1903:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2066:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2286:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.2143:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1913:  59%|█████▉    | 236/401 [02:52<05:44,  2.09s/it]training loss: 0.1913:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2334:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.1732:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2753:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.1835:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2711:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2175:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2089:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2310:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.3774:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2298:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2012:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2614:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2637:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2058:  59%|█████▉    | 237/401 [02:52<05:00,  1.83s/it]training loss: 0.2268:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1771:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2112:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2168:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2335:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2807:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2354:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2107:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2539:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2459:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2438:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2730:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2184:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2289:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2077:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1912:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1937:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1708:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2675:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1949:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1952:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1916:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1513:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2806:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2145:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1832:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1733:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2290:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2030:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2217:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2151:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2622:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1489:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1974:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1699:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2540:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1780:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1706:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1575:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2139:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2079:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.3056:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1860:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2947:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1829:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2831:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2251:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2056:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2023:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1991:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2177:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2169:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1929:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1791:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2571:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1871:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1908:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1852:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2319:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2474:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.1924:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2708:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2182:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.2300:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.0802:  59%|█████▉    | 237/401 [02:53<05:00,  1.83s/it]training loss: 0.0802:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2370:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2086:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1762:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1912:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1332:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2297:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2066:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2020:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2062:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1755:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1717:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2471:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2251:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2205:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2477:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2171:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2655:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2210:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2861:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1691:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1758:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2297:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2232:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2497:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2626:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1976:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2306:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2218:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1667:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2190:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2407:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2233:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2145:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2625:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2124:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2485:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2488:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2066:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2450:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2064:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2250:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2243:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2021:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2589:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1583:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1583:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1948:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2145:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2166:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1392:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2638:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2463:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2544:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2353:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1994:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2539:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2644:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2930:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2361:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2118:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2140:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2499:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2572:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.1462:  59%|█████▉    | 238/401 [02:53<03:55,  1.44s/it]training loss: 0.2313:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.2183:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.1994:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.1871:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.2077:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.2440:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.1820:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.1990:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.1797:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.1882:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.2262:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.2594:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.3037:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.2077:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.3627:  59%|█████▉    | 238/401 [02:54<03:55,  1.44s/it]training loss: 0.3627:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1951:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1895:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2008:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2819:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2014:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.3038:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2468:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1871:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2391:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2013:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1767:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2276:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1521:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2571:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2211:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1716:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2024:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2101:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1989:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2445:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2190:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2258:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1995:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2218:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2307:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2370:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2469:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2281:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1661:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2815:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1824:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1972:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2028:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2319:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1985:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2446:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2261:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2252:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2692:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1678:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2157:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2260:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2547:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2092:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1881:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2293:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2557:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2258:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2394:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1771:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2066:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2638:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2368:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1463:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2249:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2179:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1679:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2235:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2022:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2516:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.3084:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1991:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2170:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2061:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1689:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.3088:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2360:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.3058:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1414:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2223:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2264:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2147:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1656:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1697:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2279:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1785:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2094:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.2278:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1051:  60%|█████▉    | 239/401 [02:54<03:16,  1.21s/it]training loss: 0.1051:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2492:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2197:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2607:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2072:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2198:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2249:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2149:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2097:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2031:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2297:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2775:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2531:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2409:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2110:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2507:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.1813:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2263:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2377:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2354:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2510:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2716:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2220:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2393:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2156:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2012:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2526:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2269:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2063:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.1606:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2374:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.1735:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2263:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2368:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.1965:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2235:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2090:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2413:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.1698:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.1789:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.1772:  60%|█████▉    | 240/401 [02:54<02:38,  1.02it/s]training loss: 0.2467:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2621:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.1312:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2162:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2128:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2544:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2253:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2618:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2067:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2041:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2209:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2489:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.1886:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2399:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2215:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2689:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2080:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.1941:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2113:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2071:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2691:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2057:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.1862:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2384:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2425:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2129:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2173:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.1365:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2024:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2066:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.1927:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2343:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.1860:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2037:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2350:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2517:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2306:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2289:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2701:  60%|█████▉    | 240/401 [02:55<02:38,  1.02it/s]training loss: 0.2701:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2273:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1999:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2452:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1652:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2039:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2586:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1917:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2032:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1819:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2436:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2281:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1757:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1981:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2912:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2704:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2582:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2240:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1922:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2305:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2078:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2347:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1890:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2431:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2480:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2052:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2359:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2857:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2659:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2017:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2195:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2335:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2692:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2207:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2352:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1931:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1521:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2446:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2074:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1663:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2074:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1956:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2199:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2562:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2665:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2224:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1828:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1642:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2118:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2443:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2044:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2529:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1699:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2414:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2137:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2590:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2385:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1807:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1912:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2056:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2232:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2170:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2639:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1657:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2176:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1696:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2415:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2091:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2037:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.3185:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2280:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2098:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1856:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2600:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1968:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2045:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1683:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.2877:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1945:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1306:  60%|██████    | 241/401 [02:58<04:40,  1.76s/it]training loss: 0.1306:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2104:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2435:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1969:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2258:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1998:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1991:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2616:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2378:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2443:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1964:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2140:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2260:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2231:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1853:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2274:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1705:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1766:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1594:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1833:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2346:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2598:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2946:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2180:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1741:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1876:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2003:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1765:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1900:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2243:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.3047:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1986:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2299:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2879:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2709:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2175:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2655:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2367:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2458:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1931:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2940:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2005:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1904:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1983:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2788:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1967:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2545:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2704:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2142:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2299:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1672:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2032:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2203:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1862:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2221:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2507:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2515:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2589:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1961:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2274:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1929:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2592:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.1970:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2226:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2571:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2226:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2400:  60%|██████    | 242/401 [02:58<03:34,  1.35s/it]training loss: 0.2401:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.1786:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2384:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2089:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2322:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2313:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2088:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.1871:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2055:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2348:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2346:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.2024:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.1953:  60%|██████    | 242/401 [02:59<03:34,  1.35s/it]training loss: 0.1953:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2286:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2311:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1815:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1731:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2178:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2628:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2311:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2483:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.3051:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2521:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.3368:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2029:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1518:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2209:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2938:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2165:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1990:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2362:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2602:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2598:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.3312:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2048:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2085:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1838:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2431:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1874:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2075:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2192:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.3063:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2220:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1446:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1769:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2586:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1900:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1720:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1833:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1875:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2834:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1603:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2445:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2730:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1969:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1659:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2386:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2592:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1462:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2619:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1826:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1758:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2319:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2201:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2344:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1901:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2574:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1886:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1822:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2370:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2623:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1940:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2226:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2800:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2122:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1799:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1823:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2122:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2288:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2246:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2411:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2308:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2289:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1886:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2154:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2131:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1403:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.2715:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1999:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1683:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.1832:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.4276:  61%|██████    | 243/401 [02:59<02:56,  1.12s/it]training loss: 0.4276:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2302:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2453:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2131:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.3028:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1891:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2361:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2042:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2745:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2079:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2302:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1874:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2132:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2448:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1602:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2065:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2251:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2074:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2846:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2446:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1990:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1815:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1463:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2026:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1874:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2601:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1658:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2136:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1648:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1889:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2294:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2276:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2134:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1583:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2687:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2460:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2195:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2415:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2336:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2292:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1647:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2386:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2639:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1859:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1721:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2748:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2370:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1969:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1519:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2330:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2205:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1992:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2260:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2432:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2161:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2146:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2175:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2350:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2071:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1886:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1884:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2304:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2065:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2034:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1855:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2496:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2877:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2399:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2489:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2447:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2398:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2062:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1746:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2216:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1895:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2064:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2487:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1842:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.2538:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1085:  61%|██████    | 244/401 [02:59<02:25,  1.08it/s]training loss: 0.1085:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2093:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2598:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2510:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2870:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2330:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2911:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.1952:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.1919:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2381:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.1820:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2518:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2068:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.1748:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2483:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.1508:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2335:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2272:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2287:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2513:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.1926:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.1980:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.1945:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2525:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2013:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2173:  61%|██████    | 245/401 [02:59<01:57,  1.33it/s]training loss: 0.2235:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1924:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2086:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1860:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2146:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1947:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2257:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1643:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2934:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2166:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2318:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1687:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2005:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2656:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2259:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2025:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2712:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1728:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1907:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2384:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2167:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1683:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2248:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2421:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1893:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2163:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2723:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2248:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2218:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1959:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1835:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1976:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1914:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2541:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.3049:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2176:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1855:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1851:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2745:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1774:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1796:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2316:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2293:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2362:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2049:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2397:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2192:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2240:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2425:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2129:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2194:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2213:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.2439:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1505:  61%|██████    | 245/401 [03:00<01:57,  1.33it/s]training loss: 0.1505:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2258:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1724:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2389:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2744:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2192:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2253:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1864:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1695:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1640:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1878:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1882:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1693:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2493:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1349:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2169:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2295:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2237:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1598:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2063:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2353:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1905:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1930:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2803:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1779:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1894:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2446:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1871:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1931:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1769:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2465:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1731:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1440:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1699:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1821:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2266:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2449:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1828:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2182:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2971:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2196:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1725:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2093:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2056:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1925:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1860:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2658:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2135:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1532:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1819:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1991:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1439:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1836:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2106:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2390:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2169:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2264:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2849:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1712:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2029:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2296:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1681:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2196:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2197:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2072:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2023:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1714:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1532:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2110:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2233:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1770:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2352:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2684:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1735:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1447:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1920:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.2028:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1791:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.1865:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.3429:  61%|██████▏   | 246/401 [03:00<01:39,  1.56it/s]training loss: 0.3429:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1900:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1647:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1793:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2282:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2283:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1844:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1788:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1899:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2180:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2715:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2541:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1886:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1551:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1679:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2761:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2088:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1810:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2341:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2615:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2553:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1936:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.1857:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2410:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2135:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2341:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2882:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.3100:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2103:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2152:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.2444:  62%|██████▏   | 247/401 [03:00<01:28,  1.74it/s]training loss: 0.3082:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1887:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2356:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1842:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1856:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2180:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1636:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1840:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2404:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1960:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2405:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2237:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2366:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2224:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2296:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2065:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2285:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2399:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2477:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2308:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2530:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1713:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2340:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1632:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2518:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1882:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2045:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2144:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1979:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1960:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2067:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2813:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2388:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2451:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.3025:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2149:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2335:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2339:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2807:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.3057:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1758:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1810:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2346:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1673:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1415:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2011:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1641:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.2924:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1463:  62%|██████▏   | 247/401 [03:01<01:28,  1.74it/s]training loss: 0.1463:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1967:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2440:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2020:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2543:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2540:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2023:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2287:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1906:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2476:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2206:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1693:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2702:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2568:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2829:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2116:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1975:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1956:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1871:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1520:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2028:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2625:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2517:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1602:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2108:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1835:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1858:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1979:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2045:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2208:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2978:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2157:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2603:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2284:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1954:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2302:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1949:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1843:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1973:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1848:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2475:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1750:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1966:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2123:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2102:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1827:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2322:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.1890:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2030:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2034:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2372:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2024:  62%|██████▏   | 248/401 [03:01<01:44,  1.46it/s]training loss: 0.2418:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.1588:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.1895:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2026:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2369:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2295:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.1893:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.1964:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2611:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2243:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2315:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.1902:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.1693:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2213:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2553:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.1750:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.1776:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2081:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2351:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2571:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2055:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2930:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.3171:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2301:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2223:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2290:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2090:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2219:  62%|██████▏   | 248/401 [03:02<01:44,  1.46it/s]training loss: 0.2219:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1882:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2274:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1732:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2072:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2088:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2266:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2316:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1678:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2720:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1916:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2106:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2311:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1805:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1824:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1996:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2513:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1771:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2334:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2073:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2376:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2497:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2507:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1678:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2147:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2547:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2666:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1781:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2719:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1882:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2126:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1894:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2817:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2219:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1990:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1553:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2265:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1848:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1948:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1797:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2109:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2184:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2444:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2340:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1917:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.3051:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1534:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1681:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1991:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2634:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.1915:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2346:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2168:  62%|██████▏   | 249/401 [03:02<01:36,  1.58it/s]training loss: 0.2357:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1830:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2078:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2399:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2056:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1912:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2684:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2439:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1741:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2093:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1766:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1823:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2177:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2129:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2947:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1960:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1935:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2276:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2255:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.3098:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2092:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2085:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2241:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2753:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2363:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.2924:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1919:  62%|██████▏   | 249/401 [03:03<01:36,  1.58it/s]training loss: 0.1919:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1967:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1875:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2060:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1864:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2198:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1721:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2713:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2147:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2233:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1949:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1993:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2305:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2196:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1783:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1988:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2029:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1951:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2072:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2095:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1514:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2100:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2004:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2024:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2218:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2132:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2525:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2127:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1867:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2310:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2727:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2051:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2600:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2100:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2085:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2759:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1984:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1904:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2279:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2156:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1974:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1769:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2371:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1846:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1969:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1893:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1584:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2797:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2233:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2150:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2059:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2345:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1859:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2320:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2548:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1897:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1912:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.3119:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1750:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2505:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2887:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2022:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2332:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1954:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2620:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2021:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2026:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2596:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1930:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1651:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2411:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2535:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1740:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2628:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1819:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.1804:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2080:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2249:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2161:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2561:  62%|██████▏   | 250/401 [03:03<02:03,  1.23it/s]training loss: 0.2561:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2464:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2040:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1988:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2329:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2547:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1839:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1928:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2710:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2345:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2244:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2692:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2723:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2333:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2073:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1693:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2286:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2303:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2011:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1913:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1860:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2570:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1749:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2046:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2313:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2332:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2191:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2934:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2418:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1568:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2189:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1833:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2336:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1559:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2039:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1980:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2128:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1936:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2646:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2171:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2013:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2134:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2603:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1891:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2188:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2097:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1875:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1806:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2833:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1958:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1494:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2402:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1705:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2215:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2414:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1775:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2001:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2773:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2355:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2244:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2028:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2537:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1967:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2229:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1929:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1893:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2742:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2168:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1845:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1776:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2254:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1952:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2053:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.1757:  63%|██████▎   | 251/401 [03:06<03:44,  1.50s/it]training loss: 0.2485:  63%|██████▎   | 251/401 [03:07<03:44,  1.50s/it]training loss: 0.2148:  63%|██████▎   | 251/401 [03:07<03:44,  1.50s/it]training loss: 0.2233:  63%|██████▎   | 251/401 [03:07<03:44,  1.50s/it]training loss: 0.2208:  63%|██████▎   | 251/401 [03:07<03:44,  1.50s/it]training loss: 0.1681:  63%|██████▎   | 251/401 [03:07<03:44,  1.50s/it]training loss: 0.1682:  63%|██████▎   | 251/401 [03:07<03:44,  1.50s/it]training loss: 0.1682:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1649:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1939:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2005:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1963:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2428:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2070:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2222:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2467:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2031:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2462:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2429:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1902:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2082:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1787:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2213:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2177:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2233:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1775:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2026:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2332:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2418:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2217:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2520:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2310:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2086:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1967:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1860:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1983:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1761:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1846:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2108:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2203:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2524:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1863:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2321:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2124:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1693:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2521:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2672:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1644:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1904:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2078:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2315:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2432:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2401:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1884:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2327:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2034:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2135:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2198:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2295:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1514:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2528:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1994:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1654:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1838:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1740:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2619:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2099:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2149:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2791:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2472:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2049:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2048:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2163:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2169:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2298:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2417:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1888:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2406:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2387:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2199:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2258:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2231:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2270:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2523:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1915:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.2003:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1565:  63%|██████▎   | 252/401 [03:07<03:00,  1.21s/it]training loss: 0.1565:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2448:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2983:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2038:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1624:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1702:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2281:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2095:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2992:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2369:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1594:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2197:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1944:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1851:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1788:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2942:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2084:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2472:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2009:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2182:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1991:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1668:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2220:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1960:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2212:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2038:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2455:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2291:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1873:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1386:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2039:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2203:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1646:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2927:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2018:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2207:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1795:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2133:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2548:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2194:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1952:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2097:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1875:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1697:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2258:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2556:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1710:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2191:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1709:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2821:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.1939:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2267:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2422:  63%|██████▎   | 253/401 [03:07<02:23,  1.03it/s]training loss: 0.2617:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2179:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2414:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2205:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2164:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.1836:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2003:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2865:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2051:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.1774:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2033:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2089:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2169:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2097:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2427:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2455:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2591:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2179:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2655:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.1953:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2022:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2098:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.3100:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.1975:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2400:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.2877:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.1863:  63%|██████▎   | 253/401 [03:08<02:23,  1.03it/s]training loss: 0.1863:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2570:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2088:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2283:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1833:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2861:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1689:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1835:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2435:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2083:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2342:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1982:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2354:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2175:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2085:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2301:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2063:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1916:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1997:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2495:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2106:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2524:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2045:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2077:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2142:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2107:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2022:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2096:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2074:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1488:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1978:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1654:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2497:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1866:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1755:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1936:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2080:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1962:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1970:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2282:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1850:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2556:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1902:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1821:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1495:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2452:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1360:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1805:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2487:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2281:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2337:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2278:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1996:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2057:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2387:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1987:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2337:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2088:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2775:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1994:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1799:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1988:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2409:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2108:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1588:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2133:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2182:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2058:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2086:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2043:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2233:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2180:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1693:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2273:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2180:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2318:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1838:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2000:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.2096:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1131:  63%|██████▎   | 254/401 [03:08<02:21,  1.04it/s]training loss: 0.1131:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1856:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1612:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2336:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.3484:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1809:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1963:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2299:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1914:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2132:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1541:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2253:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2035:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1877:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2406:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2049:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2302:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2797:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1829:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2128:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2191:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1897:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2689:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2192:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2281:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2182:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2329:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1789:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2103:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2167:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2123:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1691:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2070:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2006:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2138:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.3107:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.1801:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2124:  64%|██████▎   | 255/401 [03:08<01:55,  1.27it/s]training loss: 0.2241:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1981:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2130:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2763:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1831:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1993:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1945:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2658:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2345:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1987:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1697:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1965:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1741:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2856:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2081:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2404:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2030:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2244:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1938:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1904:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2065:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1897:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1751:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1942:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2409:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2732:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1947:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2172:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2032:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2097:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2283:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2011:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1523:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1740:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.1760:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2480:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2820:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2056:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2078:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2605:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2606:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2671:  64%|██████▎   | 255/401 [03:09<01:55,  1.27it/s]training loss: 0.2671:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1949:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2360:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1826:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2151:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2510:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1697:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2065:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1809:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2058:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2545:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1838:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2096:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1800:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2038:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2180:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1681:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1913:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1976:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1990:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1872:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2078:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2756:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2105:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2482:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2371:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2079:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1561:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1950:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1872:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2772:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2211:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2143:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2021:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.1989:  64%|██████▍   | 256/401 [03:09<01:45,  1.38it/s]training loss: 0.2501:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2445:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2111:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2751:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1702:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1760:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2812:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2394:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2381:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1955:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1745:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2120:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1928:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2175:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1803:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1967:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2454:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2042:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1592:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.1962:  64%|██████▍   | 256/401 [03:10<01:45,  1.38it/s]training loss: 0.2352:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2719:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2406:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2331:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.1803:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2119:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2707:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.1761:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.1828:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2385:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2615:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.1908:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2625:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.1810:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.1943:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.1985:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2203:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.1687:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2023:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2528:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2568:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2035:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2072:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.2425:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.0942:  64%|██████▍   | 256/401 [03:11<01:45,  1.38it/s]training loss: 0.0942:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1967:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2119:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2295:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2244:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1895:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2155:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2160:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2072:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1572:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2094:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1571:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2331:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2330:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2010:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2161:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1792:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2896:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1665:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.3054:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2197:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2043:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1866:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1674:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1812:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2842:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2049:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2314:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1956:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2140:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1524:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2712:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2087:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2936:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2828:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1887:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2377:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1843:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2871:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2000:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2086:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2686:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2026:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2109:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1746:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2063:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2059:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1704:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2082:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1969:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1995:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1732:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1719:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2243:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2545:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2178:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2133:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1816:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2227:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1890:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2377:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2142:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1944:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2261:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2093:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2066:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1945:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1871:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1433:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1383:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1866:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2068:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2724:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2251:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1751:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1805:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1660:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.2077:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.1881:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.3546:  64%|██████▍   | 257/401 [03:11<02:34,  1.07s/it]training loss: 0.3546:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.1972:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2052:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2595:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2677:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.1498:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.1660:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2558:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2355:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2682:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2571:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.1727:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.1522:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2511:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2056:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.1669:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2571:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2170:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2083:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2127:  64%|██████▍   | 258/401 [03:11<02:17,  1.04it/s]training loss: 0.2155:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1640:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2626:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2087:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2134:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1847:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2962:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2429:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1791:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2245:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2260:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2617:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2113:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2053:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2256:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2489:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1806:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2162:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1972:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1950:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2769:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2271:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2500:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2203:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2114:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2029:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2267:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2251:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2160:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2515:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1838:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2571:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2402:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2429:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2587:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2052:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2167:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2055:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1856:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2596:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1902:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2196:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1917:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2593:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2007:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2205:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2163:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1738:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1997:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1571:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1859:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1742:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1679:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1990:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2835:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2074:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.2175:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1759:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.1966:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.3256:  64%|██████▍   | 258/401 [03:12<02:17,  1.04it/s]training loss: 0.3256:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2480:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2048:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.1860:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2992:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2124:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.1196:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2228:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2380:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2155:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2412:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2569:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.1667:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2226:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.1957:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.1863:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2431:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2201:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2207:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2360:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2050:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2454:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2174:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2332:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2265:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.1882:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2091:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2341:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.1919:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2703:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2086:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2550:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2388:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2485:  65%|██████▍   | 259/401 [03:12<02:14,  1.05it/s]training loss: 0.2273:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1817:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1850:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2088:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1927:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1887:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2414:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2296:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1904:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2015:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2400:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1914:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2118:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2361:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1624:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2514:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2692:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1962:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2584:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1989:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2206:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2019:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2375:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2121:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2228:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2100:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2052:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2093:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2552:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1450:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1817:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2001:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2133:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1906:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2450:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2401:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1965:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1762:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2025:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2477:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2296:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2534:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.1870:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2062:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.2277:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.3010:  65%|██████▍   | 259/401 [03:13<02:14,  1.05it/s]training loss: 0.3010:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2174:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1617:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2552:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2195:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1791:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2121:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2159:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1913:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2870:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2053:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2639:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2194:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1721:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2610:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1928:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1909:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2096:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1895:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2620:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2126:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1887:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2141:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2190:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2637:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2582:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2682:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2450:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2449:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2145:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2246:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2063:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2422:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2625:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2106:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1868:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1706:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1780:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2241:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2080:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2621:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2294:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2157:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1688:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2277:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2295:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2137:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2053:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1874:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1691:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1773:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2299:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2415:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2517:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1807:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1671:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2107:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2567:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2139:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1434:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1682:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1926:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2939:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2053:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1951:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1900:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2160:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1700:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1908:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2571:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2061:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2717:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1874:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2138:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2145:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2800:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1631:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.1995:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.2110:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.4279:  65%|██████▍   | 260/401 [03:13<02:06,  1.11it/s]training loss: 0.4279:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.3068:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1795:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2427:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2155:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2016:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1423:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2492:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1726:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2380:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2070:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2263:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1764:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.3111:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1699:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1368:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1713:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2320:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2042:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1773:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2276:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2190:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1978:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2115:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2827:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2709:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1994:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1728:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2186:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1663:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1983:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2048:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2413:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2101:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2087:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2236:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1776:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2216:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2078:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2698:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2095:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2193:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2383:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2528:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2070:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.2238:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1766:  65%|██████▌   | 261/401 [03:16<03:28,  1.49s/it]training loss: 0.1942:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.3169:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2261:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2337:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2358:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2507:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2622:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2128:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2335:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2660:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2102:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2919:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2455:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.1695:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.1775:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2140:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2151:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2250:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2263:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2367:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2053:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.1883:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.1486:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2209:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.1701:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.1817:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2260:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2068:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.1969:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2504:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2076:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.1667:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2544:  65%|██████▌   | 261/401 [03:17<03:28,  1.49s/it]training loss: 0.2544:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1847:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2613:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1895:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2395:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2043:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1916:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1963:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2298:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1774:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2476:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1742:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2593:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2011:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2652:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1779:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2354:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2068:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2083:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1848:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2422:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.1714:  65%|██████▌   | 262/401 [03:17<03:11,  1.38s/it]training loss: 0.2115:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2108:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2476:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1834:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2147:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1880:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2694:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2192:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2464:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2230:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2271:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2411:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2097:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1957:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2535:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2009:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2517:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1765:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2216:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1708:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1684:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2517:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1683:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1904:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1707:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1970:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1968:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1899:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2273:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2132:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1859:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1690:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2139:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2055:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1964:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1587:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1797:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2142:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1769:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2231:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2107:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2452:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2377:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2326:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2131:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1594:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2137:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1885:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2339:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2252:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2438:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2394:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2040:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2171:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2144:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2655:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.2037:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1858:  65%|██████▌   | 262/401 [03:18<03:11,  1.38s/it]training loss: 0.1858:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2480:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2639:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2090:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1780:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1902:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2456:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2342:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2204:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1858:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1927:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2252:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2396:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2502:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2436:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1877:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1734:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1874:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2225:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2192:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1455:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2044:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2743:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1993:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1988:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2137:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2497:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1722:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2099:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2338:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1948:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2471:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1836:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2574:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1591:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1629:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2652:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2311:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1894:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1592:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1855:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2105:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1982:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2311:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1640:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1825:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2071:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1840:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.1744:  66%|██████▌   | 263/401 [03:18<02:44,  1.19s/it]training loss: 0.2813:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2184:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.1911:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.1632:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2844:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2237:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.1714:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.1733:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2247:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2399:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2102:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2020:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2075:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2098:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.1969:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.1863:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2352:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.3057:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.1984:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.1925:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2515:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2286:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2608:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2073:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2735:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2207:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2441:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2256:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2435:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2358:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2440:  66%|██████▌   | 263/401 [03:19<02:44,  1.19s/it]training loss: 0.2440:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1629:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2274:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1770:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2377:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1715:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1957:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1916:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2472:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2513:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2081:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2602:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2204:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2117:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2459:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1642:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1749:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2044:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1729:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2171:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1790:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2048:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1983:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1642:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2129:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2233:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2246:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1954:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2139:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2450:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.1797:  66%|██████▌   | 264/401 [03:19<02:53,  1.27s/it]training loss: 0.2045:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2042:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2369:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1876:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2154:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2417:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2244:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1518:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.3318:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2225:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2233:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.3051:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2294:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2554:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1954:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2215:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2030:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2654:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1819:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2325:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2533:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1882:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2038:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1913:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1954:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2490:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1789:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2324:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2017:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2004:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2467:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2282:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2419:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2077:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2358:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2118:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1962:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1667:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1908:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.3080:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2367:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2446:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2381:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2229:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2401:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2250:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.1739:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.2020:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.3313:  66%|██████▌   | 264/401 [03:20<02:53,  1.27s/it]training loss: 0.3313:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2212:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.3159:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2287:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2663:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1568:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1534:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2771:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1674:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1706:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2771:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2354:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1939:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1738:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2271:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1757:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2133:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1674:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1887:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2121:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2384:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1951:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2180:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2113:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1671:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2435:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2050:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2266:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2374:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2415:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1875:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1974:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2114:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2083:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2220:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1626:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2180:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2494:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2567:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2009:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2257:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1989:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2037:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2267:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2937:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1521:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2062:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1707:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2260:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2424:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2199:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2676:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2075:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2374:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1935:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2168:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2159:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2257:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2675:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2671:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2178:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1780:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1580:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1857:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2189:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2893:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1988:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2661:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2078:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2401:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1902:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1883:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2398:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1994:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1828:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2284:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1909:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.1646:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2596:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2322:  66%|██████▌   | 265/401 [03:20<02:22,  1.05s/it]training loss: 0.2322:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2257:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2266:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2079:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2216:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2078:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1653:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2290:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1734:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2363:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2045:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1970:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2028:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1847:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2242:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1786:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1961:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2382:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1802:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1778:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2519:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2332:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1850:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2575:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2105:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1713:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2063:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1810:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.1796:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2356:  66%|██████▋   | 266/401 [03:20<01:56,  1.16it/s]training loss: 0.2221:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2308:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2378:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2251:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2340:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1997:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2030:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2400:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1765:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2446:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1921:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2536:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2272:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1929:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2142:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2816:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2202:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1859:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2422:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2005:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1876:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2145:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1686:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2315:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1589:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1898:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1790:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1811:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1906:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2390:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1995:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2295:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2531:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1993:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1616:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2248:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1993:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2178:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2023:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1796:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2064:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1896:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2076:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2114:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2290:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2000:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1919:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1820:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.2098:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1170:  66%|██████▋   | 266/401 [03:21<01:56,  1.16it/s]training loss: 0.1170:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2198:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1976:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2057:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2013:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1878:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2296:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2481:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1617:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2368:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2493:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1558:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2166:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2231:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1918:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.3253:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2426:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1608:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2042:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2005:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2031:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2123:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2812:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1889:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1775:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2264:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2138:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2210:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2102:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2871:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2595:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2241:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2138:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1706:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2001:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1860:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1488:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2650:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1985:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1815:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1863:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1737:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1395:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1365:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1502:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1797:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1857:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2053:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2084:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2679:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2351:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2183:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.2216:  67%|██████▋   | 267/401 [03:21<01:42,  1.31it/s]training loss: 0.1780:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2144:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2302:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2139:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.1984:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2075:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2561:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2241:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2364:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2274:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2516:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.1677:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2162:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2704:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.1586:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2098:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2821:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2176:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2285:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2324:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2115:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2279:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2128:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2133:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.1894:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2331:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2855:  67%|██████▋   | 267/401 [03:22<01:42,  1.31it/s]training loss: 0.2855:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1791:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2197:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2392:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2470:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2574:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1954:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2169:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2057:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2171:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1775:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2242:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2106:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2563:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1776:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2144:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1845:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2734:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1793:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2105:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2411:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2450:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2226:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2087:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1813:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2380:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2233:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2022:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2373:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2494:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2394:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2743:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1836:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2182:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1747:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2989:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1941:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2550:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1893:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2093:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2184:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1418:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2525:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2452:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2521:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2396:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2315:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2390:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2268:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2136:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2530:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2043:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2221:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1685:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1793:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2034:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1937:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2324:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2100:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1882:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1626:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1959:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1952:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1994:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2006:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2219:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2377:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2102:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1846:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2691:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2673:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1602:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2638:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2210:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2359:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2243:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.1966:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2610:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.2317:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.3079:  67%|██████▋   | 268/401 [03:22<01:49,  1.22it/s]training loss: 0.3079:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2312:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2253:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2438:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1903:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1979:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2437:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2110:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2287:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1701:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2012:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2307:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1309:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2354:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1947:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1627:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2193:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1861:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2012:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1770:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2095:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2622:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2108:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2051:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2323:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2471:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2193:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1909:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2004:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1632:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2058:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1939:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2327:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2225:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2232:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1764:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1715:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2211:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2161:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2816:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1863:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1986:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1967:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2360:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1823:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2513:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2372:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2090:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1937:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1883:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1804:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.1943:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.3022:  67%|██████▋   | 269/401 [03:22<01:31,  1.44it/s]training loss: 0.2263:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2362:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1573:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2074:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2037:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1918:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2129:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2668:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2293:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1760:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2239:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2303:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2570:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2246:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2359:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1816:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1944:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1723:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2195:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2036:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2882:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2241:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2833:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2554:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.2212:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1931:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1102:  67%|██████▋   | 269/401 [03:23<01:31,  1.44it/s]training loss: 0.1102:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1711:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2246:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.3184:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1665:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2419:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2421:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2169:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2381:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1914:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2326:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2337:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1733:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2108:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1871:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2384:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1908:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.3142:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2861:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1956:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2043:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2032:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2086:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2064:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2760:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2265:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2692:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1512:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1950:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1384:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2293:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2125:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2700:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2246:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2241:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2660:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1787:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2672:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2202:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1929:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1810:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2262:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2118:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2465:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1918:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2033:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2140:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1919:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2600:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2213:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2830:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2031:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1812:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1820:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2069:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2243:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2228:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2377:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1883:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2653:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2016:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2058:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2638:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1942:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1972:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1945:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2066:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2763:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1807:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1874:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2176:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1789:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2001:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2096:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1986:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2246:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.1727:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2067:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.2095:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.3484:  67%|██████▋   | 270/401 [03:23<01:27,  1.49it/s]training loss: 0.3484:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2113:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2079:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2029:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2566:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2427:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1983:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1637:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2069:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2199:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2299:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2587:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2821:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2869:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2162:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2353:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1811:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2604:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2157:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2179:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2462:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2084:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1893:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1967:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2511:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2068:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1768:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1777:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1828:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2043:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2527:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1694:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1925:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2079:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1958:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1788:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2535:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2402:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1799:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2091:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2089:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1756:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2143:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2240:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1773:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2326:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2233:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2548:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2287:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2879:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2077:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2058:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2640:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2180:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2038:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2518:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2450:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1950:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2573:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2005:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1664:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.1445:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.3009:  68%|██████▊   | 271/401 [03:26<03:10,  1.46s/it]training loss: 0.2418:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.2029:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1897:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1703:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1843:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1950:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.2055:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.3466:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.2104:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1569:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1795:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1671:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.2253:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.2414:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.2745:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1882:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1784:  68%|██████▊   | 271/401 [03:27<03:10,  1.46s/it]training loss: 0.1784:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1980:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2218:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1978:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2351:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1745:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.3055:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2616:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2433:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2448:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2075:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2799:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1925:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1797:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2315:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2072:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2376:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2039:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2251:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2443:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1801:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1852:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1790:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2501:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1754:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2533:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2171:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2234:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2335:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2064:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2070:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1986:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2466:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1727:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2467:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2176:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2072:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1814:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2347:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2191:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2321:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1679:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2117:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2187:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2422:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2300:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2261:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2280:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2104:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2511:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2187:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2044:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1744:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2089:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1831:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2848:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2210:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2074:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2187:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2104:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2175:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2062:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2394:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2190:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1956:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1843:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1881:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2039:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2600:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1862:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2173:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2253:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1388:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1987:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2606:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1531:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.2249:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1672:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1733:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1436:  68%|██████▊   | 272/401 [03:27<02:31,  1.17s/it]training loss: 0.1436:  68%|██████▊   | 273/401 [03:27<02:18,  1.08s/it]training loss: 0.1824:  68%|██████▊   | 273/401 [03:27<02:18,  1.08s/it]training loss: 0.1970:  68%|██████▊   | 273/401 [03:27<02:18,  1.08s/it]training loss: 0.2659:  68%|██████▊   | 273/401 [03:27<02:18,  1.08s/it]training loss: 0.1684:  68%|██████▊   | 273/401 [03:27<02:18,  1.08s/it]training loss: 0.2727:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2248:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2502:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1600:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2539:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2347:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1788:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2163:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2331:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2305:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2506:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2440:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1922:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2495:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2538:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2609:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1703:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1787:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2353:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1807:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2360:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2004:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1788:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2249:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2512:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1937:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1929:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2098:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2214:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2321:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1956:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2959:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2771:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2610:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1946:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2337:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2482:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1501:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2360:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2381:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2246:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2030:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2163:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1962:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1577:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2446:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2125:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2224:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2285:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2111:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2326:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1760:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2226:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2546:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2197:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2731:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2029:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1706:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1821:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1567:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1907:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1707:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2348:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1914:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1871:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1959:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1966:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2190:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2054:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2450:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1584:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1905:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2179:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.2439:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1393:  68%|██████▊   | 273/401 [03:28<02:18,  1.08s/it]training loss: 0.1393:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2190:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2278:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1798:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1865:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2543:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2529:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2427:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1531:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2386:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2219:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2182:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2192:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2335:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2117:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2785:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1896:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1666:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2051:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1949:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1666:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2780:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2060:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2318:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2364:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2703:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2006:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1986:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2163:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1931:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1937:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2296:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2105:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2028:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2400:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2053:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1650:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2998:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2497:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2646:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2884:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2352:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2124:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2071:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2380:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2396:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2654:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2375:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2576:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2631:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1920:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1934:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2244:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2440:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2296:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2642:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1995:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2135:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1778:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2540:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1806:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2083:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2619:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2136:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2142:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2022:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2104:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2726:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1716:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1787:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2634:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2272:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2337:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2067:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2902:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1795:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.2212:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1615:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1983:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1753:  68%|██████▊   | 274/401 [03:28<01:51,  1.14it/s]training loss: 0.1753:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2101:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2226:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.1975:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2182:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.1364:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2163:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2462:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2015:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.1572:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2567:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2188:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.1750:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2070:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2628:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2182:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2439:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2259:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2080:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2377:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2011:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.1988:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2403:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.1618:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.1916:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2000:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2488:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2474:  69%|██████▊   | 275/401 [03:28<01:36,  1.30it/s]training loss: 0.2419:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1994:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2584:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2366:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1938:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2628:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2120:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1555:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2177:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2048:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1777:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2630:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1913:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.3251:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1988:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2122:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1967:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2294:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2254:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1592:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2234:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2308:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2289:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1662:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2344:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1966:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2211:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2637:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2212:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2139:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1809:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1747:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2079:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1525:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2202:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2225:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2201:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1995:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1852:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2569:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2170:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2444:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2061:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1911:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1889:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2281:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2437:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2468:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.1798:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2505:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2053:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2040:  69%|██████▊   | 275/401 [03:29<01:36,  1.30it/s]training loss: 0.2040:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2015:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2094:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1869:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2263:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2458:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2165:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2634:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2299:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2026:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2506:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2078:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1966:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2278:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1760:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1821:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2659:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2392:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2721:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1667:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1707:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1717:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2686:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2026:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1658:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2223:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2475:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2112:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2378:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2331:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2167:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1969:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1716:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2284:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1877:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2510:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2194:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2796:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2381:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.3066:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2044:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1821:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2122:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2342:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1965:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1865:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2260:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2311:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1788:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2670:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2129:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2234:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1661:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2174:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2060:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2714:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1946:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2624:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2012:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2143:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2803:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2684:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1995:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2446:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2358:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1626:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2067:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2392:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1825:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2235:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2549:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1933:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1340:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2307:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1868:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1919:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.1723:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2117:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2019:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2733:  69%|██████▉   | 276/401 [03:29<01:21,  1.54it/s]training loss: 0.2733:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2112:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2000:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2031:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2411:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2180:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2412:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2101:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1931:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1781:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2192:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2632:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2542:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2329:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1860:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1575:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1949:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2015:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1966:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1891:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1940:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2220:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1894:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2233:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2145:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2514:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2372:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2506:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1909:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.1897:  69%|██████▉   | 277/401 [03:29<01:14,  1.65it/s]training loss: 0.2231:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2085:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2480:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2196:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2188:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1966:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2250:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2155:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2358:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2346:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2611:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2017:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2070:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2744:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2063:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1364:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2366:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2268:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1979:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1816:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1956:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1923:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2671:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1646:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1685:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2230:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2316:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1868:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2209:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1969:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1700:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2503:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2310:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2033:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1830:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2218:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2244:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2365:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2866:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1929:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1940:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2326:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2328:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1674:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2251:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1856:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1497:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2337:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.2265:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1206:  69%|██████▉   | 277/401 [03:30<01:14,  1.65it/s]training loss: 0.1206:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2119:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1726:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2068:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2101:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1885:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2170:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2348:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2080:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2428:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1763:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1955:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1984:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1623:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2809:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1700:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2070:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1876:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2366:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2247:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2006:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2271:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2380:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2144:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2432:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1567:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2651:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1931:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2611:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1843:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2558:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2209:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1613:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2294:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2066:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2219:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1924:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1863:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1652:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1866:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2400:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2279:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1462:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1931:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1894:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2077:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2365:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2371:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2541:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2706:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1943:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2132:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1544:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1757:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1906:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1930:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2003:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2112:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2160:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1930:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1772:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2282:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1477:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1816:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2026:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2148:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2573:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2353:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.2031:  69%|██████▉   | 278/401 [03:30<01:25,  1.44it/s]training loss: 0.1839:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.2174:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.2290:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.2214:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.3061:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.2426:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.1671:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.1629:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.2441:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.1919:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.1991:  69%|██████▉   | 278/401 [03:31<01:25,  1.44it/s]training loss: 0.1991:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2711:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1785:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2645:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2052:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2131:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1927:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2550:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2027:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2785:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1610:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1381:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2267:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1850:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2392:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1348:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1922:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2080:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1820:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1791:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2647:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1937:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2104:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2136:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2097:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2104:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1866:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1836:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2220:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2372:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2449:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2163:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1902:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2270:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2268:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2373:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2296:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2379:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2099:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2429:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2037:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.3102:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2135:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1598:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2194:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2225:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1833:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2557:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2532:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2308:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1774:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1599:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2473:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2152:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2045:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2399:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2103:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2089:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2630:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1760:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1918:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1963:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1898:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2272:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2733:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2410:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2229:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2438:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1954:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2565:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2162:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2200:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1968:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2060:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.1924:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2302:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2654:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2272:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2331:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2830:  70%|██████▉   | 279/401 [03:31<01:13,  1.65it/s]training loss: 0.2830:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1632:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2022:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2016:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2371:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2327:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2204:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2053:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2206:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2260:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2578:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1897:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1494:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2302:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2613:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2218:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2236:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2419:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2295:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2301:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1593:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2342:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2134:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.3087:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2187:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2133:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2976:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1976:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2621:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1672:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2073:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1862:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2026:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2419:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1946:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2772:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1810:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2448:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2318:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1950:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2103:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1750:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1976:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2614:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1724:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2750:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2350:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1832:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2193:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2275:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2054:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2586:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2542:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2047:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1847:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2539:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2372:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2409:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2713:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2032:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2356:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2135:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2307:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2265:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2456:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1566:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2171:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2356:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2101:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2286:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2602:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2277:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2298:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2120:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2017:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2172:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2298:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.1396:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2791:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2209:  70%|██████▉   | 280/401 [03:31<01:11,  1.70it/s]training loss: 0.2209:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2398:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1775:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2426:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2552:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2264:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2911:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2936:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2036:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2013:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2488:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1628:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2228:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2047:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2598:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1896:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2368:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1872:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2373:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2023:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1975:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2071:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2225:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1979:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2567:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2247:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2560:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1993:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2303:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1898:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1890:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2149:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2216:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1914:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2206:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2235:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2319:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2075:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1923:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2412:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1865:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2166:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2052:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2162:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2363:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1946:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2654:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2321:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2461:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1802:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1960:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2250:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1626:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2141:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2344:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1962:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2445:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2543:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2402:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2393:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2206:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1926:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2056:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1973:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2144:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2656:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1961:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2602:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1860:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2075:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.1815:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2552:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2397:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2100:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2514:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2143:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2356:  70%|███████   | 281/401 [03:34<02:39,  1.33s/it]training loss: 0.2139:  70%|███████   | 281/401 [03:35<02:39,  1.33s/it]training loss: 0.2248:  70%|███████   | 281/401 [03:35<02:39,  1.33s/it]training loss: 0.1965:  70%|███████   | 281/401 [03:35<02:39,  1.33s/it]training loss: 0.1965:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1852:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2288:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2034:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2035:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2285:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2187:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1709:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2276:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1508:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2840:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1845:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2161:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1767:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1783:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2273:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2176:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2705:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2867:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1902:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2141:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2080:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1914:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2342:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1858:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.3176:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1870:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1699:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2271:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1831:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2046:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1987:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2025:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1869:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2232:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2595:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1932:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2053:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1944:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2005:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1723:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1874:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2050:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2444:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1793:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2103:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2613:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2401:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2257:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2251:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2465:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1808:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1858:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2636:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2095:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2116:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2073:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2141:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2396:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2830:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2515:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2236:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1607:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2512:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1970:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1895:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2192:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2735:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1850:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2324:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2189:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2169:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2821:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1877:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.1713:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2352:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2248:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2053:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.2142:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.0926:  70%|███████   | 282/401 [03:35<02:03,  1.04s/it]training loss: 0.0926:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1738:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1978:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2764:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2056:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1979:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1869:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2005:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1740:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2138:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2574:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1794:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2121:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2480:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2206:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1717:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2942:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1694:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1755:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2062:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2070:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2450:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1935:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2313:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2653:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2124:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1603:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2791:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1594:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2296:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1907:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1807:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2098:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2056:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1674:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2522:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1665:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1817:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2166:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2542:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2043:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2552:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1937:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1938:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2607:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1910:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2300:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2292:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1958:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1953:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2429:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1979:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1948:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2410:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2041:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1644:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2603:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1845:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2513:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1835:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2124:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2203:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2122:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2049:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1779:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2352:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2900:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2281:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2368:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2303:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2078:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2590:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2093:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1834:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2377:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2447:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1894:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2124:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.2696:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1728:  71%|███████   | 283/401 [03:35<01:37,  1.21it/s]training loss: 0.1728:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2525:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1735:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2600:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1629:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1763:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2108:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2209:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2500:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2126:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2377:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2413:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1952:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2149:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2098:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2037:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2089:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1982:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2036:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2246:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2412:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2273:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1589:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2502:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1815:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1707:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2311:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2135:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2362:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1539:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2352:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1906:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.3093:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1959:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2506:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2006:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2240:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2076:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2372:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2006:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1415:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1896:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2158:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2334:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2017:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1828:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2247:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2203:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2043:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2243:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2148:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2420:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2421:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2256:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1951:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1883:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2172:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2415:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2272:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2456:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2780:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2255:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2277:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1563:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1955:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2258:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1754:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2501:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2517:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1844:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2166:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.1627:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2211:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2111:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2027:  71%|███████   | 284/401 [03:35<01:19,  1.47it/s]training loss: 0.2081:  71%|███████   | 284/401 [03:36<01:19,  1.47it/s]training loss: 0.2286:  71%|███████   | 284/401 [03:36<01:19,  1.47it/s]training loss: 0.2178:  71%|███████   | 284/401 [03:36<01:19,  1.47it/s]training loss: 0.1794:  71%|███████   | 284/401 [03:36<01:19,  1.47it/s]training loss: 0.2719:  71%|███████   | 284/401 [03:36<01:19,  1.47it/s]training loss: 0.2719:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1598:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2185:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2354:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2109:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2066:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1860:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2069:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1986:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2183:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2627:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2373:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1762:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1771:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2441:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2106:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2094:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2235:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2749:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1572:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2513:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2335:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1900:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1889:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2671:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1597:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2583:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2266:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1913:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2789:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1912:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.3236:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2645:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2077:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2644:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2406:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1688:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2007:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2419:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2223:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2235:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1958:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1788:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1806:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2211:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2325:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2585:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1597:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2198:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2590:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1962:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1743:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1872:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2171:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2997:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2022:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1952:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2297:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2353:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2033:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1903:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2061:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2805:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1942:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2086:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2420:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1719:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1760:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2111:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2114:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2635:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2521:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1956:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2399:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2525:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1896:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2365:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2377:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.2870:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1589:  71%|███████   | 285/401 [03:36<01:06,  1.74it/s]training loss: 0.1589:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2116:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2148:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1484:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1645:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1688:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1873:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1879:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2348:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2421:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2576:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1819:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2017:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2329:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2267:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2316:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2312:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2321:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1761:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2196:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2269:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2343:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2480:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2533:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2716:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2113:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2377:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2677:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2569:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2076:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2394:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2456:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2629:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1628:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2277:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2229:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2323:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1502:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2200:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2094:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2419:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1798:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2042:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1984:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2376:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2558:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2353:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1674:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1649:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1749:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2118:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2135:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1920:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1816:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2496:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2477:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2146:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1600:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2176:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2336:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1982:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1697:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2388:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1687:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1995:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2603:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2465:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2237:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2418:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2394:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2092:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2004:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1834:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2233:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2478:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2111:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1924:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.1909:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2344:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2512:  71%|███████▏  | 286/401 [03:36<00:58,  1.97it/s]training loss: 0.2512:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1491:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1822:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2680:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1725:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1413:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2560:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2651:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2541:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1957:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1547:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1860:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2077:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1996:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2170:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2148:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2501:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2102:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2549:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2155:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1636:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2619:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2200:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1607:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1563:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2161:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2300:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1902:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2007:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1988:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1780:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1764:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1970:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1896:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2996:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1913:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1894:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1546:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1850:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2561:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2102:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1730:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2088:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1849:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1807:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2531:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2336:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1747:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2052:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1871:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2594:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2289:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1978:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2290:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2131:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1589:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2022:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1727:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1784:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1956:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1329:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2051:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1744:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2312:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2287:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.2622:  72%|███████▏  | 287/401 [03:36<00:52,  2.18it/s]training loss: 0.1496:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.1968:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.3065:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.2502:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.1790:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.1584:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.2793:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.1957:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.2428:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.2461:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.2404:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.2012:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.1753:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.1137:  72%|███████▏  | 287/401 [03:37<00:52,  2.18it/s]training loss: 0.1137:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1746:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2695:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2984:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2259:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1959:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2470:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1941:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2070:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2508:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2209:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1744:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2147:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2417:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2435:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1919:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2147:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1677:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2336:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1399:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2011:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2655:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2342:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2347:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.3151:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2032:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2268:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2612:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2701:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1925:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2008:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2659:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1840:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2168:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2472:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2180:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1812:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2113:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2556:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1691:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2489:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1958:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2257:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2070:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2038:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2081:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2389:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1815:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2006:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1783:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1826:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1620:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2399:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2213:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2648:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2129:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2599:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2180:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1865:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2508:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1994:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2000:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2136:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1879:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2881:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1878:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2212:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2394:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1983:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1912:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2367:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1960:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2561:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1729:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2384:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1988:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2277:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.1901:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2121:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2336:  72%|███████▏  | 288/401 [03:37<00:48,  2.35it/s]training loss: 0.2336:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2430:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2102:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2246:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2471:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2266:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2074:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1841:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1934:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2098:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2279:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2141:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2236:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1848:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2452:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1814:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2727:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1752:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2655:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2245:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1638:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2466:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1990:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2449:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2406:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2781:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2443:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2327:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1851:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2278:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1928:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2106:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2568:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2305:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2618:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2393:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1295:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2159:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2476:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2070:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2381:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2124:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2557:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2261:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2570:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2539:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1594:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1759:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2009:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1977:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2236:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1945:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1938:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1844:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1814:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2370:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2063:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2460:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2113:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2243:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1696:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2378:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2145:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2190:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.1881:  72%|███████▏  | 289/401 [03:37<00:50,  2.22it/s]training loss: 0.2055:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.1977:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.1813:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.1897:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.2098:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.1939:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.2138:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.2189:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.2088:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.2038:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.1762:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.2772:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.2327:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.2073:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.1727:  72%|███████▏  | 289/401 [03:38<00:50,  2.22it/s]training loss: 0.1727:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2018:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2103:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2120:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2315:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2559:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2401:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2117:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1993:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2339:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1993:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2592:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2344:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2576:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2607:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2281:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1755:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2198:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2038:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1949:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1978:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2754:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1838:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2208:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2256:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1697:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1406:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2155:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2633:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2290:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2298:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1725:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2337:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2086:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2553:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2366:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2442:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2135:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1513:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1673:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1963:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2289:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2161:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2368:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2316:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2146:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.3007:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2058:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2004:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1663:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2373:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2225:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2204:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1808:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2370:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2097:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2193:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1923:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1733:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2148:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2556:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2174:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2388:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2650:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2026:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1865:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2562:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2022:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1453:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1683:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2331:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2732:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2695:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2025:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1441:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2394:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2133:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2097:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.2100:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1455:  72%|███████▏  | 290/401 [03:38<00:52,  2.10it/s]training loss: 0.1455:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.2263:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.3167:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.1703:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.2660:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.1915:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.1988:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.2068:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.1997:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.1984:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.1266:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.1993:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.2078:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.2672:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.2136:  73%|███████▎  | 291/401 [03:40<02:10,  1.18s/it]training loss: 0.1801:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2102:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1987:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2133:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2075:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2337:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2664:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2162:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2188:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2667:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2156:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2149:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1689:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2339:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1962:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2412:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1886:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2112:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2019:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1612:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1709:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2386:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2168:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2069:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2364:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1932:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2426:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2000:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1985:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2281:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1938:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1804:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2253:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2139:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2745:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2517:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2197:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2363:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2069:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2531:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1691:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1806:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2405:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2226:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1878:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2164:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2330:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1959:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2132:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2024:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2109:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2428:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1809:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2488:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2738:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2184:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1778:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1882:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1951:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1920:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2475:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2306:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.1961:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2185:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2400:  73%|███████▎  | 291/401 [03:41<02:10,  1.18s/it]training loss: 0.2400:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1544:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1757:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2314:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1606:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2880:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1966:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1705:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1701:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2020:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1819:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1859:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1950:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2388:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2577:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1948:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2106:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2353:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1979:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2173:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2166:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1765:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2787:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2437:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2729:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2457:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1975:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1654:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2447:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2127:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1906:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1894:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2213:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2315:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2661:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2291:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1839:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1812:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2046:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2548:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2282:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1991:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2127:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1968:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2284:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1884:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2073:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2298:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2360:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2040:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2585:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1738:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2150:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1856:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2202:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2133:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1585:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2162:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2647:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2522:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2832:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2069:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2014:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1879:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1868:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2396:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2068:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1709:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1917:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2170:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1873:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1972:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2155:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1751:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2305:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1777:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2265:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2039:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.1939:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2008:  73%|███████▎  | 292/401 [03:41<01:41,  1.08it/s]training loss: 0.2008:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2121:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2306:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1860:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1677:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2318:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2184:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2425:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2016:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2735:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2109:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2479:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2292:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2004:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2464:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2050:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1830:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2153:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2367:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2292:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.3066:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2027:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1737:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2092:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1885:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2701:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2015:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2876:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1756:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2547:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2135:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1315:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1852:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1407:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2473:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2574:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2174:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2266:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2794:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1802:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1810:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1767:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2509:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2670:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2408:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2041:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1843:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2178:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2525:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2663:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2273:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2514:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2825:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2537:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2186:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2150:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1883:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2370:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2444:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1933:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2022:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1729:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2317:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2453:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2315:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2357:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2416:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2420:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2131:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1917:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.3193:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2049:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2064:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1842:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1937:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1972:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2156:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2564:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.2089:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1939:  73%|███████▎  | 293/401 [03:41<01:21,  1.33it/s]training loss: 0.1939:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.1851:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.1669:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.2285:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.2511:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.2127:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.1955:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.2177:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.1795:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.1922:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.2525:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.1938:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.1668:  73%|███████▎  | 294/401 [03:41<01:07,  1.59it/s]training loss: 0.1660:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2750:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1736:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1762:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1551:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1711:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2499:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1839:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2959:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1823:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2174:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1833:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2073:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1840:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2015:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1717:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2522:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2285:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2743:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2335:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2381:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2504:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1678:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2355:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2849:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2322:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2434:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1593:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2814:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2033:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2532:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1884:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.3026:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1888:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2151:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1825:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1494:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2479:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1709:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2960:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2040:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1955:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1956:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1831:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2708:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2583:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2126:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2082:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2245:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1845:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2243:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2433:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2128:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2497:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1925:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2359:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2323:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2292:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2155:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2564:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1662:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2738:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.2270:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1228:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1876:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1908:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1163:  73%|███████▎  | 294/401 [03:42<01:07,  1.59it/s]training loss: 0.1163:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2815:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2342:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2636:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2035:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2511:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2774:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1862:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2374:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2540:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1761:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1926:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2270:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1715:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2230:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1983:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1842:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1730:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2933:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2497:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2595:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1930:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2205:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2123:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2388:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2185:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2041:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2583:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2040:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2242:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1996:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2103:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2266:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1388:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1827:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2292:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2757:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2543:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1724:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2183:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2522:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2291:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1825:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1803:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2034:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1908:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2005:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1807:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1848:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2735:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2121:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1938:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2452:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2007:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1920:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1975:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2566:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2060:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2487:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2161:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2077:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1961:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1755:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1977:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2338:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2245:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2350:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2134:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2078:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1613:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2128:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2492:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1463:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2359:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2314:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1976:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2246:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.2059:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.1878:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.3390:  74%|███████▎  | 295/401 [03:42<00:57,  1.85it/s]training loss: 0.3390:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1650:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2467:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1796:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2656:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1837:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1801:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1496:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1977:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1914:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2155:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1582:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2800:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1940:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2313:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2320:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2885:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2091:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1688:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1887:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2460:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2280:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2111:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.3050:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1988:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2246:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1226:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1584:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1872:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1870:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2176:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1985:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2277:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1763:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2222:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2059:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1853:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2041:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2336:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2309:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2486:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2192:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1433:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1700:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1940:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.3357:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2129:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1835:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1461:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2047:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2072:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2257:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2737:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2298:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2290:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1625:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2114:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2018:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2422:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1660:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2528:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2038:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1826:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2062:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.2541:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1786:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1771:  74%|███████▍  | 296/401 [03:42<00:50,  2.08it/s]training loss: 0.1739:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.2008:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.2340:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.1922:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.2162:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.1957:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.1739:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.1788:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.2427:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.2121:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.2033:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.1963:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.3168:  74%|███████▍  | 296/401 [03:43<00:50,  2.08it/s]training loss: 0.3168:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2639:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1818:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1641:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1756:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2543:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2007:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2509:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2704:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1520:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2006:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2212:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.3085:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1903:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2448:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2388:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1913:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1939:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2475:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2051:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1784:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2304:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1976:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1949:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2013:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2774:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1929:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2533:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2576:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2249:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1629:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2641:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2177:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2280:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2409:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1706:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2531:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2629:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2586:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1999:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1930:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1761:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2340:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1698:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1514:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1417:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2275:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1962:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2216:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2226:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2015:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2085:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1884:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2110:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1624:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1964:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2720:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2221:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1479:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2051:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2345:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2108:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2144:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2157:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1954:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2395:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2225:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2158:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2208:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2551:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2142:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1886:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2470:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2578:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1898:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2383:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2481:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.1761:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2140:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2525:  74%|███████▍  | 297/401 [03:43<00:50,  2.07it/s]training loss: 0.2525:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2481:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1887:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2128:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2271:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2015:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2290:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1871:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1826:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1794:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2243:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1826:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2058:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2278:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2482:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1714:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2270:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2246:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2173:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1839:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2165:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2029:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1402:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1758:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2383:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2305:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2435:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2215:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2346:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2644:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2180:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2071:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2072:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1976:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2097:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2253:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2716:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2232:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2018:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2164:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2889:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2413:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1835:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2201:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2517:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2087:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1588:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2049:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2008:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1837:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2029:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2874:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1975:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2558:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2522:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2220:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2057:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1863:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1977:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1978:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1732:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2398:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2430:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2207:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1460:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1885:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2438:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1974:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1746:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2165:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1932:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1910:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.3032:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1918:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1923:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.1689:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2084:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2162:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.2122:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.4140:  74%|███████▍  | 298/401 [03:43<00:45,  2.25it/s]training loss: 0.4140:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2139:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1813:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1710:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2149:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2373:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2089:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1909:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2059:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2148:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1700:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1848:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2485:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2075:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2079:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2359:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2472:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1996:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1984:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1756:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2024:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1987:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1709:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2020:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2197:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2102:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2317:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2518:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1792:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1798:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2416:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1973:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2147:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2866:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1464:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2854:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1858:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1712:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2017:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2714:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2322:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.2313:  75%|███████▍  | 299/401 [03:43<00:42,  2.41it/s]training loss: 0.1987:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2715:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2184:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2017:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2776:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2400:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2086:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2138:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2093:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.1844:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2249:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.1638:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2358:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2377:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2084:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2479:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2103:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2092:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2153:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2421:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2010:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2084:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2128:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2170:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2536:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.1875:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.1903:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2584:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2218:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2193:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2116:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2155:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2186:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2347:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2327:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.2627:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.1895:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.5002:  75%|███████▍  | 299/401 [03:44<00:42,  2.41it/s]training loss: 0.5002:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1828:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2585:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1999:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2450:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1996:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2199:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2123:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2508:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2680:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2252:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2620:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1970:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2126:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1917:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1678:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1669:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1803:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2148:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2549:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1829:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2278:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2268:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1430:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2234:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.3005:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1841:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2200:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2740:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1432:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2253:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2084:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1421:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2003:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1633:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2621:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1736:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2363:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2366:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2142:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1802:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2030:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2175:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2050:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2023:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2055:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2274:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2032:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2220:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1665:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2145:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1977:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2492:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1774:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2092:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2056:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2130:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1795:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2221:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2864:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2297:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2086:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2297:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1884:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1644:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2402:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1798:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1628:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2383:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1779:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2033:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2276:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2168:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2074:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2371:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2249:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.2042:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1784:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.1882:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.0961:  75%|███████▍  | 300/401 [03:44<00:39,  2.55it/s]training loss: 0.0961:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2238:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1801:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1784:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1858:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1788:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2966:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1565:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1985:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2084:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1695:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1760:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1846:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2858:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2364:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2474:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2114:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2616:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2910:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2749:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1743:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2539:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2223:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2224:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2121:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1908:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2086:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1681:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1906:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2499:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1671:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2117:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2757:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2161:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1606:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2170:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1904:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1937:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2310:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2101:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1741:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2515:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1791:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2218:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1973:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2551:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2319:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2273:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.3075:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2017:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2431:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2087:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1998:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2828:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2341:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2191:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1870:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1820:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2548:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.3177:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2218:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2088:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2018:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.3358:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1893:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1994:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2351:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1963:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2734:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1842:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1972:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2266:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2248:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2015:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1905:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2384:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2172:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2002:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.2639:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1552:  75%|███████▌  | 301/401 [03:47<01:54,  1.14s/it]training loss: 0.1552:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2700:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2167:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2216:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1834:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2029:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1558:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2607:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1792:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2642:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2148:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2123:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2397:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2372:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1809:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1929:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2002:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2329:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2190:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1783:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2152:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2191:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2144:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2028:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.3212:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2023:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1930:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2223:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1949:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2100:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2638:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2010:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2296:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2609:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2328:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2282:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2350:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2417:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.3055:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1852:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1945:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2060:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2242:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1960:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2134:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1829:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1836:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2045:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1929:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2036:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2215:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2209:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1825:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2678:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1850:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1979:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2919:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2205:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2695:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1598:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2196:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2143:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2006:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2230:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2193:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1804:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2035:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1754:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.1611:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2751:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2150:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2085:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2116:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2081:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2292:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2178:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2596:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2051:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.2960:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.4590:  75%|███████▌  | 302/401 [03:47<01:31,  1.09it/s]training loss: 0.4590:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1917:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2179:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1661:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1927:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.3029:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1885:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2044:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2272:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1675:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2144:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1651:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2168:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1893:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2283:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1712:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2084:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1748:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1879:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2134:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2545:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2348:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2145:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1678:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2065:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1731:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2217:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1836:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2418:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.2249:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1837:  76%|███████▌  | 303/401 [03:47<01:15,  1.30it/s]training loss: 0.1807:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2032:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2485:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2120:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2088:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1870:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1806:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2322:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2595:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2781:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2203:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2742:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2558:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2366:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1897:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2063:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1828:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2275:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2197:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1978:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1903:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1955:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2294:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1963:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2135:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1940:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2285:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1416:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1807:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1732:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1909:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2876:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2764:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2076:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1646:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2041:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2353:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2407:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2361:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2153:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2036:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2422:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2530:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2160:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1969:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2482:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2529:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.1817:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2991:  76%|███████▌  | 303/401 [03:48<01:15,  1.30it/s]training loss: 0.2991:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1971:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2780:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2007:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2235:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1902:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2014:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2048:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2201:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1883:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2180:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2382:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1553:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2015:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2340:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2341:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1965:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2280:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2484:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2308:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2198:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2332:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1767:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2779:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1835:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1986:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2039:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2214:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2732:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2143:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2771:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1746:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2298:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2194:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2293:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2041:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1876:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1983:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2450:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2627:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2163:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1896:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2284:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1866:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2523:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2169:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2668:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1983:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1984:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2120:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2021:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2458:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1638:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1745:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1965:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1929:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2315:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2291:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1998:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2011:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2322:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2785:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2198:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.3239:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2417:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1778:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1900:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2495:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2798:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1818:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2806:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1768:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2411:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2909:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2463:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2392:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.1960:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2602:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2362:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2174:  76%|███████▌  | 304/401 [03:48<01:09,  1.40it/s]training loss: 0.2174:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.1927:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.1616:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2584:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.1480:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2454:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.1960:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.1704:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2113:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.1848:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2308:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2422:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.1784:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2451:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2486:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2137:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2684:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2177:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2586:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2211:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2798:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2026:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2740:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2825:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2395:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2635:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2008:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2098:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2064:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2453:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2564:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2083:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.3192:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2354:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2561:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2416:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.2238:  76%|███████▌  | 305/401 [03:48<00:58,  1.64it/s]training loss: 0.1995:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2411:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1942:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2396:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1764:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2077:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2338:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1974:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2008:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1932:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1736:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2411:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2097:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2653:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2312:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2085:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1893:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1772:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2233:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1748:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1910:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1871:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2274:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2270:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1737:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2324:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2472:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2519:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1886:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.3061:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1897:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1929:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2589:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1795:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1781:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2504:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2469:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2487:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2100:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1758:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.2038:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1819:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1243:  76%|███████▌  | 305/401 [03:49<00:58,  1.64it/s]training loss: 0.1243:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2078:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2129:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2600:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2248:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1642:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2024:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1972:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2354:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1877:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1892:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2478:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2027:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2429:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2609:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1953:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1563:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1940:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2036:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2068:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1974:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1711:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2911:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2597:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1945:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2413:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2521:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2527:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2466:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2080:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2532:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2009:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2623:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2166:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2519:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2647:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2140:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1800:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2481:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1497:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2276:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2188:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1634:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2409:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1914:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2339:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2144:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1956:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2668:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2125:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2227:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2294:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1797:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2693:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1844:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1745:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2665:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1860:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2061:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1996:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2628:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2236:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2149:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2211:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2074:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1580:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1967:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1914:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1881:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2102:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1680:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1703:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2133:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2056:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1921:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1669:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1599:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2521:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.1606:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2654:  76%|███████▋  | 306/401 [03:49<00:52,  1.82it/s]training loss: 0.2654:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2030:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1942:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2238:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1784:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2105:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1930:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2130:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2350:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1766:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2305:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1716:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1989:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1967:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1824:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2145:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2425:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1672:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1738:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2012:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2094:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2399:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2157:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2095:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2045:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2332:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2026:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2355:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2985:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2435:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2241:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2541:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2278:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2065:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2197:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1488:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2061:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2538:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2364:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2048:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1894:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2973:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1805:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2473:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1821:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2260:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1678:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2832:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2581:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1971:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2335:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2114:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2140:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2128:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2216:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1809:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2188:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2258:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2055:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2162:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2099:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2318:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2270:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2233:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2289:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1770:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2714:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1832:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2278:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2136:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2492:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2747:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1974:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1983:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2207:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1706:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.1832:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2608:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2445:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2086:  77%|███████▋  | 307/401 [03:49<00:47,  1.99it/s]training loss: 0.2086:  77%|███████▋  | 308/401 [03:49<00:43,  2.15it/s]training loss: 0.2243:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2002:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2590:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2189:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2045:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2199:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1841:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1868:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2661:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2245:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2047:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2462:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2373:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1928:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1704:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2079:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2240:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2161:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2440:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1815:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.3156:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1977:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2219:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2018:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2364:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2125:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1615:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2785:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1955:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2533:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1971:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2287:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2023:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2200:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2160:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1497:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2649:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2167:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1944:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2367:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2450:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2684:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1733:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2038:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1844:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2103:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2061:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1648:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2056:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2131:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2175:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2376:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2143:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1943:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2002:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2447:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2786:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2513:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1944:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2162:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1644:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1890:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2032:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2717:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2185:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2072:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1873:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1443:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2089:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1998:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2237:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2246:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1877:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2023:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.1631:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2403:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2121:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.2372:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.3154:  77%|███████▋  | 308/401 [03:50<00:43,  2.15it/s]training loss: 0.3154:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1719:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1986:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2004:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2237:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2250:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2038:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2162:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2258:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1781:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2094:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2670:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2172:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2241:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1820:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2045:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1958:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2062:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2856:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2438:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1764:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2009:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2293:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2170:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1839:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1955:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1639:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1938:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2116:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2444:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1642:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1896:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2613:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2480:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1471:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2851:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2496:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2067:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1729:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1935:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2260:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1600:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1879:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2255:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2274:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1807:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1951:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1793:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1672:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2044:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2278:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2130:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1926:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1660:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2209:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1922:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2391:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1645:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2097:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2244:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2577:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2172:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2028:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2239:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2025:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2124:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1852:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.3122:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1967:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1812:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2334:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.3099:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1991:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2525:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2921:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1925:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2428:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.1681:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.2506:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.3527:  77%|███████▋  | 309/401 [03:50<00:40,  2.29it/s]training loss: 0.3527:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2119:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2006:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2125:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2303:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2185:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2063:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2511:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2281:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1762:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1733:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2036:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2141:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1944:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2819:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1655:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1656:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2950:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1937:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1571:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1624:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1727:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1835:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1928:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2135:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2402:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1977:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2273:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2186:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2017:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2349:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2348:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2658:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2072:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.3066:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2655:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1699:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2676:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2105:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2016:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1894:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1973:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2107:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2069:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2729:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1940:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2456:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2629:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2645:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2234:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2781:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2257:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1868:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2180:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.1828:  77%|███████▋  | 310/401 [03:50<00:37,  2.41it/s]training loss: 0.2114:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1325:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2504:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2677:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2263:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1352:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1771:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2231:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2168:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2056:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1610:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1560:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2647:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2282:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2227:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2283:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1982:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2592:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2475:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1952:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1881:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2661:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2035:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.2764:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1224:  77%|███████▋  | 310/401 [03:51<00:37,  2.41it/s]training loss: 0.1224:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2787:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2211:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1722:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1924:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2123:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2129:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2124:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2055:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2363:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1522:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2353:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1993:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2193:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2865:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2425:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1996:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2156:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2283:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1960:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1972:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1814:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2293:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2090:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2277:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2419:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2678:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1732:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1965:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1652:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1731:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2354:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2573:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1647:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2040:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2099:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2040:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2094:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1929:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1658:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2194:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1710:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1987:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.2854:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1947:  78%|███████▊  | 311/401 [03:53<01:48,  1.21s/it]training loss: 0.1867:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2016:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2090:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2341:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2623:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1878:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2108:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2361:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1858:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2590:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1821:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1864:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2154:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2230:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1872:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1944:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1921:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1505:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2248:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1931:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1399:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1507:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1951:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1610:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2202:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1706:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1943:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2610:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2162:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2398:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1976:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1990:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.2354:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1604:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1658:  78%|███████▊  | 311/401 [03:54<01:48,  1.21s/it]training loss: 0.1658:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1897:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1886:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1920:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2164:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2270:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2405:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1723:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2069:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2102:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1949:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2205:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2221:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1794:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2038:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2165:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2675:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2850:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1959:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1585:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2112:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2022:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2733:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2175:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2704:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2123:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2346:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1821:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2021:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1617:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2731:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2843:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1862:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2437:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1948:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2243:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2690:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2037:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1349:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1969:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2662:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2137:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1872:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2143:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2207:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2119:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2352:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1997:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2252:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2655:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2367:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1686:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1743:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1641:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1524:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2554:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1832:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1706:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2063:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2343:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2373:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2447:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1960:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2796:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1841:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.3022:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1668:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2627:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2558:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2880:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2394:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.3114:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2116:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2445:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2059:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2173:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2722:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2385:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.2065:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1173:  78%|███████▊  | 312/401 [03:54<01:25,  1.04it/s]training loss: 0.1173:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.3042:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2512:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1911:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2508:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2784:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2471:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2765:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1997:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2376:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2426:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1944:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2012:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1638:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.3388:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2418:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1731:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2137:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2251:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2672:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1839:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2397:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2083:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1836:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2003:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2641:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1978:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2279:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1924:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2228:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2070:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1969:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2051:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2423:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2070:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1891:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2063:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2354:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2427:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2438:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2224:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2994:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2412:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2420:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1654:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2154:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2359:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2038:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1817:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2500:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2102:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2390:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1590:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2155:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.3215:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1684:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1410:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2079:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1937:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2037:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2863:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1788:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1700:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1799:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1969:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1971:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1910:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2344:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2275:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2097:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2430:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1904:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2276:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1883:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2206:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2847:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1916:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2266:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.2366:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1822:  78%|███████▊  | 313/401 [03:54<01:09,  1.26it/s]training loss: 0.1822:  78%|███████▊  | 314/401 [03:54<00:58,  1.48it/s]training loss: 0.2864:  78%|███████▊  | 314/401 [03:54<00:58,  1.48it/s]training loss: 0.1697:  78%|███████▊  | 314/401 [03:54<00:58,  1.48it/s]training loss: 0.1568:  78%|███████▊  | 314/401 [03:54<00:58,  1.48it/s]training loss: 0.2470:  78%|███████▊  | 314/401 [03:54<00:58,  1.48it/s]training loss: 0.2036:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1881:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1892:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1999:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2049:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2092:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2334:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2050:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2380:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1911:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2609:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1830:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1768:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1836:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2487:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2666:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2486:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.3045:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2277:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2067:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2385:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2091:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2244:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2322:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2369:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2318:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2432:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2077:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2208:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2271:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1999:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2088:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2253:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1875:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2434:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2182:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2022:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1563:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2350:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1990:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2048:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2801:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1991:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1744:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2009:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2159:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2722:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1925:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2257:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1494:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1970:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2038:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1772:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2041:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1677:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1826:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1958:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2130:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1897:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2468:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1961:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1816:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1923:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1799:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1938:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2778:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2489:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2839:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2422:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2014:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1734:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.2736:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1519:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.1833:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.4862:  78%|███████▊  | 314/401 [03:55<00:58,  1.48it/s]training loss: 0.4862:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2623:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1925:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2694:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2055:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1472:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2452:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2200:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2581:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1721:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1886:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1667:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1575:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1940:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1857:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2178:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2082:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1753:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2114:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2595:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2252:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1900:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2408:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2715:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2159:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1328:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2555:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2184:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1891:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2566:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1888:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1836:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2708:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2353:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2189:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2294:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1595:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1862:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2069:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2434:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2840:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1673:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2124:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2122:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2058:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2092:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1541:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2246:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2161:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2170:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1646:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2494:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1922:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2496:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2581:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2346:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2056:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2723:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.3017:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2798:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2889:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1999:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2037:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2957:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1785:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2194:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2487:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2303:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2326:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2219:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2361:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2686:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2189:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2192:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1725:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2196:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2074:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1780:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.2552:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1525:  79%|███████▊  | 315/401 [03:55<00:51,  1.68it/s]training loss: 0.1525:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2306:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2732:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2122:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1568:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2571:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2107:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2595:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2394:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2103:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1759:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2447:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2093:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2562:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1954:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1853:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2319:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1799:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2311:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2163:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2204:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2010:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2153:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2336:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2275:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2282:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1875:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1959:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2262:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2271:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2060:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1583:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2257:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2494:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2300:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1852:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1987:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2208:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2596:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1813:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2613:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.1780:  79%|███████▉  | 316/401 [03:55<00:45,  1.86it/s]training loss: 0.2269:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2050:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2169:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2129:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2027:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1896:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1912:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2379:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1878:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2265:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1668:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2114:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2095:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1838:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2179:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1941:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2076:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2137:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1911:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2039:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2238:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2287:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1922:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1763:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2597:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2220:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2311:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2291:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2012:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.3023:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2249:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2378:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2345:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2077:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2015:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.2132:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1939:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1735:  79%|███████▉  | 316/401 [03:56<00:45,  1.86it/s]training loss: 0.1735:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1833:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2194:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1551:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2172:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2091:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1779:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2323:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2435:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2232:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1973:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2229:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2259:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1974:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2684:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2133:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1600:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2247:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1952:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1950:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2084:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1939:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1482:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2003:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2162:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2353:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1996:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2483:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2043:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2493:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1379:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2488:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1681:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1815:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2321:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2568:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2145:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2305:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2321:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2343:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2357:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1610:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1993:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1966:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1865:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1941:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2449:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2033:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1999:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2528:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1867:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2280:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2107:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2019:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2466:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1924:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2017:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2180:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1581:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2233:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1886:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2544:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1775:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2355:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2355:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1984:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2443:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2291:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2262:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2193:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1571:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1893:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2103:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1962:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1899:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2380:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2199:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.2674:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1763:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1934:  79%|███████▉  | 317/401 [03:56<00:41,  2.01it/s]training loss: 0.1934:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1971:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1683:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2271:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1792:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1473:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1515:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1889:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1891:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1950:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1925:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2291:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2568:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2628:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2736:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2110:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2103:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2071:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2150:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2030:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2952:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2049:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2355:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2250:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2354:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1831:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2584:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2276:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1853:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2442:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1576:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2273:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2392:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1637:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1608:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2266:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1511:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2209:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1753:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2049:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1605:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1777:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2142:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2006:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2187:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2171:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2498:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1754:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2684:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2133:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2077:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2230:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2336:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2086:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2351:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2464:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1761:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2106:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1975:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2349:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2196:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1639:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1657:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1873:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2281:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2247:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2342:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2203:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2139:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2113:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2149:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2120:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1674:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2434:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1965:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2676:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.2189:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1955:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1798:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1247:  79%|███████▉  | 318/401 [03:56<00:38,  2.16it/s]training loss: 0.1247:  80%|███████▉  | 319/401 [03:56<00:36,  2.22it/s]training loss: 0.2943:  80%|███████▉  | 319/401 [03:56<00:36,  2.22it/s]training loss: 0.1773:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2439:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2703:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1503:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1684:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2164:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1703:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2169:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2697:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2028:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2259:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2734:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2583:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2407:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2252:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1720:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1808:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1883:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2455:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2270:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2189:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2229:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2142:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1946:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1916:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2027:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2199:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2229:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2140:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1804:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2352:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1920:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2285:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1996:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2269:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2272:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1890:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2057:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2168:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2459:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2302:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1877:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2230:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2415:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1738:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1764:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1953:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2431:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2677:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2226:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2400:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1897:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2583:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2537:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2133:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1528:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1879:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1475:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1954:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2210:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2163:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2248:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2070:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1995:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1968:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2440:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2257:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1827:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2239:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2435:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2322:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.1992:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2001:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2169:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2510:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2261:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.2512:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.4221:  80%|███████▉  | 319/401 [03:57<00:36,  2.22it/s]training loss: 0.4221:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2048:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1715:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1992:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2220:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1798:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2298:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1965:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2245:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1930:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2086:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2318:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2056:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1940:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1930:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2184:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1757:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1694:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1884:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2304:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1909:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2374:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1713:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1783:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2106:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2084:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2579:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2127:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1943:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2341:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1933:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2215:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2165:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2462:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1994:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2215:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1715:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2143:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2417:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2184:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1953:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1559:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2076:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2151:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2282:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2265:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2450:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2345:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1860:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2452:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2262:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1915:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2904:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2219:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2186:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1692:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1999:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2317:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2208:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2403:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1892:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1831:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2419:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2327:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2340:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2664:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1942:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2482:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1978:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2513:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2801:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2227:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1926:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2615:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1806:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2420:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1734:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1608:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.1899:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2027:  80%|███████▉  | 320/401 [03:57<00:36,  2.21it/s]training loss: 0.2027:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2018:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2611:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2373:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1857:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1984:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2045:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2313:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2672:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2230:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2151:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2294:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2196:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1580:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2633:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2885:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2315:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2065:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2203:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1993:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2415:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2137:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1712:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2082:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.3014:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1748:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1912:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2840:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1888:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2893:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2417:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.3048:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1536:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2088:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1943:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1744:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1895:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2117:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2325:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1976:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1776:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1855:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2171:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2121:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1870:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2039:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1777:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.3052:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1836:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2291:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2094:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1797:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2071:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1878:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1934:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1792:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2845:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2057:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2875:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2651:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2424:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1819:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2339:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2152:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2467:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1777:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2128:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2290:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2264:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1908:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1966:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2625:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2419:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1956:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1946:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1992:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.1645:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2163:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.2220:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.3045:  80%|████████  | 321/401 [04:00<01:40,  1.25s/it]training loss: 0.3045:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.1714:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.2052:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.2134:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.2587:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.1291:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.2101:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.1720:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.2675:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.1496:  80%|████████  | 322/401 [04:00<01:18,  1.01it/s]training loss: 0.1947:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1839:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2327:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2674:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1836:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1670:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2346:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2305:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1695:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2369:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1929:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2113:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2417:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2168:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1847:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1947:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1893:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1691:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1842:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1736:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1625:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1848:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2049:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2593:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1807:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2571:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2010:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2007:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1522:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2039:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1538:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1861:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2368:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2147:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2042:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2070:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1486:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2168:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2302:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2250:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2013:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2112:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2019:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2263:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2227:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2384:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1955:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2152:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2100:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2607:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2445:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2598:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1814:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2409:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2437:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1687:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1969:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2537:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2465:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2183:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2016:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2485:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2076:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2272:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2194:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2335:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2372:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2294:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.2000:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1811:  80%|████████  | 322/401 [04:01<01:18,  1.01it/s]training loss: 0.1811:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2603:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1623:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2205:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2461:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2720:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2105:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2375:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1926:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2248:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2287:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2076:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1462:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2272:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2094:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1996:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2151:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2068:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2744:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2679:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2024:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2535:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2006:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2104:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2613:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2388:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2059:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1899:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1858:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.3145:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2083:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1907:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1535:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1655:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1787:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2024:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2211:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2314:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1874:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2316:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1973:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1913:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2291:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2195:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2163:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2074:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2307:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2477:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1986:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2299:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1808:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2354:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2007:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2459:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1887:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2004:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2658:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1726:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1677:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1981:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2581:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2724:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2149:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1896:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1910:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1805:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1904:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2148:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1672:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1940:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2092:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2177:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2250:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1934:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2418:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2214:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2584:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2581:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.2205:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1319:  81%|████████  | 323/401 [04:01<01:03,  1.23it/s]training loss: 0.1319:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1785:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2590:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1514:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1888:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1902:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2286:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2165:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2002:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2296:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2525:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1985:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1886:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2060:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2274:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1628:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2025:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1863:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2253:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1939:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2546:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1733:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2413:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2009:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1795:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2414:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1847:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1770:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2215:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2132:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1881:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1715:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1992:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2498:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2589:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2347:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1926:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2451:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1788:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1574:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1922:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2577:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2229:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2263:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2114:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1505:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2165:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2054:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1807:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2089:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2026:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2765:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1756:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2942:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1904:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1423:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2273:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2321:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1773:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2193:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1964:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.1875:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2799:  81%|████████  | 324/401 [04:01<00:52,  1.47it/s]training loss: 0.2293:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.1748:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2491:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2239:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2256:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2117:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2139:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2161:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.1905:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2153:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.1987:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2137:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.1497:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2038:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2155:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2287:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2445:  81%|████████  | 324/401 [04:02<00:52,  1.47it/s]training loss: 0.2445:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2475:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1873:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1841:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1971:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1700:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2306:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2113:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2452:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1720:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2283:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2142:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2129:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2893:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2315:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2281:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2134:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1913:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1704:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2121:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2739:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2350:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1643:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2319:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1992:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1551:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1617:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2003:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2378:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1814:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2735:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2033:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2301:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2202:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2682:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1959:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2741:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1929:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2825:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2388:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1863:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1393:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2218:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1878:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2160:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1440:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1699:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2720:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1786:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2188:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2838:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2282:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1826:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2305:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1734:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1777:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2062:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1795:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2487:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2006:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2690:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1701:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2426:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1835:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2803:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2548:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1869:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1954:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2069:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2742:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1689:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2150:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2525:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2683:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2142:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1845:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2555:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.1920:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2138:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2093:  81%|████████  | 325/401 [04:02<00:44,  1.71it/s]training loss: 0.2093:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1985:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2128:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2992:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1898:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2625:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2276:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1494:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2616:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2065:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2313:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1778:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2272:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1658:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1968:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2625:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1812:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2665:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2080:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2132:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2161:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1722:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2444:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2143:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2324:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2046:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2284:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2465:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2205:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1792:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1952:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2149:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1586:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2487:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1472:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2165:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2025:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2100:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1823:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2355:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2348:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2273:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2326:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2083:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1607:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1643:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2193:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2316:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1880:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2103:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2155:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2962:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2130:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2046:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1778:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1963:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1636:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1842:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1674:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2602:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1998:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2188:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2728:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2231:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2573:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2921:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1729:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1820:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2591:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2328:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1632:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2418:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2355:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2033:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2047:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2009:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1679:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2156:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.2117:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1277:  81%|████████▏ | 326/401 [04:02<00:39,  1.89it/s]training loss: 0.1277:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2326:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2282:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2025:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2133:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1444:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2169:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1985:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2722:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1951:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1914:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2626:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2129:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1828:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1899:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2302:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1963:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1994:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2194:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2075:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2850:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.1919:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.3232:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2069:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2563:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2195:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2430:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2306:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2056:  82%|████████▏ | 327/401 [04:02<00:35,  2.06it/s]training loss: 0.2386:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1501:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2200:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2439:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2553:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1824:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1950:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2452:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2216:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1995:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2273:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2098:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2307:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2066:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1885:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1583:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2964:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2660:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2042:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2066:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2247:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2621:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1390:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2475:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1874:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2082:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1954:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2528:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2212:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1987:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2092:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2752:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2320:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1967:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2105:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2297:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2329:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2134:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1929:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2425:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1936:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2456:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1758:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1997:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2117:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1908:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2032:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.2271:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1866:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1644:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1722:  82%|████████▏ | 327/401 [04:03<00:35,  2.06it/s]training loss: 0.1722:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2564:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2079:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1748:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2076:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1770:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2589:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1682:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2988:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2098:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2466:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2116:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1604:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1989:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2196:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2139:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1795:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2175:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2325:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2419:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2210:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2308:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2112:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2299:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2031:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2370:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2226:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2697:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1677:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2039:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1997:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2033:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1824:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2745:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2434:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1977:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1869:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2162:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2348:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1815:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1944:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2521:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2357:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2762:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2256:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2165:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1814:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2291:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2340:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1630:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2652:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2225:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1877:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2043:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2433:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1791:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2572:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2853:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2006:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2283:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1425:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1858:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2552:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1735:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2123:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2396:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2756:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2039:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2816:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1894:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2202:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2945:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2092:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2375:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2848:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2835:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2602:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.1534:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.2293:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.0795:  82%|████████▏ | 328/401 [04:03<00:33,  2.19it/s]training loss: 0.0795:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2215:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1977:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2004:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2528:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2105:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2579:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2171:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2190:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2121:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2390:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1771:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1958:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1568:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1889:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2648:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1985:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1891:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2296:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2577:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1895:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1996:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2019:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1939:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2033:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2266:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2488:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2935:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2380:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2364:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1830:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1798:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2548:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1760:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2089:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2167:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1715:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2139:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2177:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2598:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2359:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2272:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2104:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1741:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2297:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2739:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2014:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2322:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2487:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2141:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2398:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1870:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2138:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2189:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2739:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2309:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1907:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2139:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2375:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2594:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2074:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1948:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1778:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1960:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2185:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2322:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1875:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2150:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2492:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2257:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2673:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2570:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2024:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2805:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1983:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2441:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2001:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.2637:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1645:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1392:  82%|████████▏ | 329/401 [04:03<00:31,  2.31it/s]training loss: 0.1392:  82%|████████▏ | 330/401 [04:03<00:29,  2.43it/s]training loss: 0.2305:  82%|████████▏ | 330/401 [04:03<00:29,  2.43it/s]training loss: 0.1882:  82%|████████▏ | 330/401 [04:03<00:29,  2.43it/s]training loss: 0.2091:  82%|████████▏ | 330/401 [04:03<00:29,  2.43it/s]training loss: 0.2072:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2199:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1982:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2643:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2119:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2109:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2345:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2364:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1760:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1816:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1717:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2012:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1832:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2640:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2214:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1748:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2060:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2366:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1588:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2095:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2125:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1627:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1917:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2024:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2429:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1573:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2176:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2457:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2028:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2167:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2932:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2291:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2801:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2178:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2496:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2257:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2060:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2062:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1854:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2107:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1754:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1961:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2284:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2319:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2842:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1929:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1895:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1651:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1667:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2320:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2214:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2486:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1906:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1829:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2785:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2139:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1681:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2027:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2283:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2103:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2247:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1772:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2319:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2509:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2169:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2085:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2066:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2098:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2920:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2154:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2485:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2549:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.1708:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2033:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.2478:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.3066:  82%|████████▏ | 330/401 [04:04<00:29,  2.43it/s]training loss: 0.3066:  83%|████████▎ | 331/401 [04:06<01:21,  1.16s/it]training loss: 0.1782:  83%|████████▎ | 331/401 [04:06<01:21,  1.16s/it]training loss: 0.2575:  83%|████████▎ | 331/401 [04:06<01:21,  1.16s/it]training loss: 0.2258:  83%|████████▎ | 331/401 [04:06<01:21,  1.16s/it]training loss: 0.2002:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2601:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2023:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2319:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1738:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1919:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2133:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1642:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2887:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.3105:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2014:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2183:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2427:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1538:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2557:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2028:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1974:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2653:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1854:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1913:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2029:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2577:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1978:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2063:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2730:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2444:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2631:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2263:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2120:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2014:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2241:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2258:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1945:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2254:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2545:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2247:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1974:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2006:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2226:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1619:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1552:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2667:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2187:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2340:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2114:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2774:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1773:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1959:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2535:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2710:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1700:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1850:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1859:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1765:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2137:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1645:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1874:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2567:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1995:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2245:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2338:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2891:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1923:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2009:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2077:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2380:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2331:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2664:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2090:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2345:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1963:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1802:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2376:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2263:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.2156:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1705:  83%|████████▎ | 331/401 [04:07<01:21,  1.16s/it]training loss: 0.1705:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2594:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2463:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2111:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2268:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2865:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2654:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1830:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2271:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2759:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2224:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2567:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1880:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2452:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2452:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1751:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1797:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2221:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1862:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2158:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2263:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2043:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2419:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1883:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2189:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2685:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1796:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2319:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2059:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2756:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2265:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1510:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2340:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1815:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2058:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2232:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2281:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1590:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2402:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1990:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1796:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2434:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2163:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2061:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2195:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1473:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1920:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2647:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2282:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2100:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2953:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2255:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2078:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2530:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2241:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1938:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2908:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2251:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2270:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1932:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1963:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2353:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2267:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2286:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2636:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2032:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1914:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2344:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1791:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2623:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1826:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1945:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1738:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2197:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1680:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1610:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2031:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2299:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.2294:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1812:  83%|████████▎ | 332/401 [04:07<01:09,  1.00s/it]training loss: 0.1812:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2572:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2379:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2181:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2049:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2752:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2539:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.1854:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2284:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2550:  83%|████████▎ | 333/401 [04:07<00:55,  1.23it/s]training loss: 0.2166:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2234:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1766:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2347:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2514:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1698:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1900:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2082:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2853:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1870:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2001:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1925:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1657:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2458:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2090:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1995:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2080:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2066:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1944:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2107:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1980:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2225:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2354:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1754:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2444:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1893:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1886:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2237:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2197:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2120:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1964:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2096:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1578:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2913:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1978:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2140:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2134:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2861:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2572:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2431:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1932:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2119:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2420:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1789:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1855:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2356:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1832:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2088:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1695:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1587:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2203:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2170:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2165:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2324:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1889:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2223:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1458:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1949:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2785:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2264:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1663:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2108:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1795:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1708:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2104:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2678:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1758:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.1862:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.2164:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.3020:  83%|████████▎ | 333/401 [04:08<00:55,  1.23it/s]training loss: 0.3020:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1967:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2137:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1608:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2378:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1740:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2883:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2427:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2654:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1742:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1871:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2500:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2177:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1479:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2071:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2602:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2243:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.3074:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2267:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2213:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1752:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1985:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2358:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1700:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2602:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2013:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2567:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2530:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2350:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1799:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1816:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2099:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1999:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1994:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2036:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2003:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2564:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2506:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2106:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1718:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2170:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1880:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1934:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2384:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2117:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2588:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1925:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2586:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1977:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2107:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2316:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2509:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2438:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2200:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1838:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2375:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2514:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1831:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2222:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2026:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1555:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1870:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2078:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1951:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2027:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1705:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2002:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2491:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2193:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2538:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1865:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2530:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2185:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2400:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1917:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1650:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2190:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2209:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.1816:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2046:  83%|████████▎ | 334/401 [04:08<00:47,  1.40it/s]training loss: 0.2046:  84%|████████▎ | 335/401 [04:08<00:44,  1.47it/s]training loss: 0.1981:  84%|████████▎ | 335/401 [04:08<00:44,  1.47it/s]training loss: 0.2101:  84%|████████▎ | 335/401 [04:08<00:44,  1.47it/s]training loss: 0.2487:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2310:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2536:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1660:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.3181:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2174:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2019:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2043:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1924:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2460:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2318:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2406:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1900:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1873:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1879:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2560:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2079:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1545:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2462:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1647:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2063:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2603:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1750:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2659:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1712:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1744:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2407:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2463:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2008:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2231:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2880:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2003:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2499:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2000:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2172:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1928:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2081:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2266:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1542:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1830:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2296:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2282:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1638:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2123:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1848:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2236:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2293:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2012:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2723:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1809:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1933:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2111:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2528:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2095:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2138:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2524:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2152:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1979:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1977:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1984:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2297:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2610:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2128:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2714:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1645:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1885:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2781:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1930:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2295:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2580:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2036:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1949:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2022:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2664:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.2043:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1900:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1542:  84%|████████▎ | 335/401 [04:09<00:44,  1.47it/s]training loss: 0.1542:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2208:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1851:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2061:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2475:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2216:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1979:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2297:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2939:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2648:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2522:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1986:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2205:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2450:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1957:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1321:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2607:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2096:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1862:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2471:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2616:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2001:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2423:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2015:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2164:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2002:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1659:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2194:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2990:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1960:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1807:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2234:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2289:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2266:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2133:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1752:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2515:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2286:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2356:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2041:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2079:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1772:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1654:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2465:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2637:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2339:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2085:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2328:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2214:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2651:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1786:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2044:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2196:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2623:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1947:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1645:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2164:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2639:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2307:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2136:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1810:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2615:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1679:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2674:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2114:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2022:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2766:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1778:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2261:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2237:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2137:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1874:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2425:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2996:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2271:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2271:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1801:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.1724:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2294:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2203:  84%|████████▍ | 336/401 [04:09<00:37,  1.71it/s]training loss: 0.2203:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2190:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2087:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2467:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2395:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2075:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1828:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2055:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2469:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2287:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1988:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2173:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2031:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2291:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2129:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1703:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2592:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2275:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2253:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2312:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2544:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2376:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2377:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2609:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2705:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2034:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1792:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1565:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.3182:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2076:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2294:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1718:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2981:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1947:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1907:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1747:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2227:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2433:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1751:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1958:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2054:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2341:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2190:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2336:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1708:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1846:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2241:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1549:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1946:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1662:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2146:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2360:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1798:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2474:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2498:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1898:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1837:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1960:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2239:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2288:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2916:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2819:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1807:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2860:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2298:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2906:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1836:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2590:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1900:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2085:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.1840:  84%|████████▍ | 337/401 [04:09<00:32,  1.95it/s]training loss: 0.2474:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.1777:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.2741:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.2314:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.2460:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.2400:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.2265:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.1345:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.1462:  84%|████████▍ | 337/401 [04:10<00:32,  1.95it/s]training loss: 0.1462:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2726:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1752:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2259:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1780:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2298:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2276:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1785:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2362:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2499:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2445:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1971:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2515:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2261:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2055:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1902:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2525:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2036:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2566:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1966:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2213:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2385:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2557:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2852:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2045:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1811:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1877:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2066:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2377:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1777:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2657:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2346:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1585:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2070:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.3346:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2902:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2461:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2112:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1587:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2566:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2636:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2460:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2175:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2007:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1611:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1729:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2251:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2007:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1685:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2681:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2155:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2207:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1823:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2325:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2378:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1765:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2449:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2602:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2079:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2587:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2457:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2786:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1654:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2200:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2066:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2224:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2144:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2079:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2313:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1720:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2033:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1965:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2153:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2234:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1573:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2161:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1986:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2181:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.2299:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1651:  84%|████████▍ | 338/401 [04:10<00:29,  2.16it/s]training loss: 0.1651:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2152:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2382:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2111:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2087:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2704:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2460:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2244:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2054:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1926:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2550:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2319:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2011:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2860:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2507:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1663:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2060:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1718:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2157:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2048:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2150:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1948:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1879:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2921:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1615:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1764:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2260:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2268:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1792:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2492:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2514:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2343:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2361:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1603:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1915:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2490:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1942:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2213:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1809:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1981:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2295:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2568:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1951:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2172:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1565:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1981:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2299:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1973:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1857:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1886:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2200:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2406:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2352:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1714:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2417:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2082:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1956:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2906:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2054:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2579:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2926:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1790:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2907:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1650:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2135:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1647:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1541:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1906:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.3259:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2073:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2221:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1807:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2775:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2769:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2377:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1981:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2422:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2139:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.2690:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1909:  85%|████████▍ | 339/401 [04:10<00:26,  2.33it/s]training loss: 0.1909:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1944:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2055:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2417:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2140:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2132:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2148:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1841:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2519:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2901:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1567:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1958:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2144:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2172:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1699:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2359:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2093:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1926:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2022:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2013:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1738:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.3170:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2198:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1951:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2125:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2261:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1868:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2529:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2281:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2107:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2877:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1794:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1952:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1689:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2069:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2495:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2338:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2032:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2302:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2546:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2520:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2580:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1825:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1986:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2314:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2567:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2110:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2150:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2327:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2255:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2117:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1730:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2397:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1664:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2332:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2414:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2522:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.1859:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2152:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2223:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2200:  85%|████████▍ | 340/401 [04:10<00:24,  2.48it/s]training loss: 0.2075:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.1978:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2583:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2263:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2061:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2431:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.1981:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2176:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2519:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2410:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2186:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2147:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2543:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2387:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2116:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2062:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2272:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.1584:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2417:  85%|████████▍ | 340/401 [04:11<00:24,  2.48it/s]training loss: 0.2417:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1919:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2284:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2323:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1980:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2002:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2561:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1587:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2331:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1689:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2248:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2274:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2077:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2629:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2286:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2115:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2258:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2169:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2305:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2020:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2330:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2164:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2250:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1842:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2552:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2329:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2126:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2039:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1607:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1978:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2250:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2539:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2154:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2105:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2444:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1997:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2156:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2513:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1822:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2363:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1735:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1768:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2109:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2922:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2219:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2304:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1874:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1851:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2169:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2044:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1942:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2371:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1843:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1989:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2279:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2039:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1617:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2231:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2158:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1958:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2356:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2620:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1911:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2717:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2263:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2226:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1821:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2715:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1396:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1658:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2346:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1768:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2611:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1841:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2408:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1633:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2188:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.1642:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2406:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2917:  85%|████████▌ | 341/401 [04:13<01:08,  1.14s/it]training loss: 0.2917:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.1983:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2839:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2088:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2146:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2144:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.1745:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.1889:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2691:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2060:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.1953:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2564:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2456:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2256:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2159:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2597:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.1798:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.1964:  85%|████████▌ | 342/401 [04:13<00:53,  1.11it/s]training loss: 0.2666:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2119:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2229:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2387:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1786:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2917:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2321:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2351:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1660:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1955:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2031:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1920:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2211:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2408:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2643:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2150:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2320:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1703:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1994:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1874:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1925:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2420:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2343:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2101:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1835:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1948:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2110:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1877:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1808:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1998:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2075:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2162:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1779:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2237:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2145:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2304:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2631:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2097:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1783:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2452:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2430:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2223:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1952:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2485:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1653:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2050:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2044:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1710:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2264:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1505:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1709:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2055:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2198:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2643:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1869:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2142:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2618:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1766:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2674:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2978:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.2387:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1509:  85%|████████▌ | 342/401 [04:14<00:53,  1.11it/s]training loss: 0.1509:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2553:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1865:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2300:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1926:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2100:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1898:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2149:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1942:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2755:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2327:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2250:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2029:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1585:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2332:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1600:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1864:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2652:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.3031:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2272:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2915:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2461:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2868:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2005:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1633:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1594:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2365:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2501:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2429:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2676:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2289:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1474:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1553:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2107:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2085:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2207:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2440:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2790:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2061:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2289:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1951:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2205:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2075:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2220:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2210:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1782:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2341:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1544:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1977:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2107:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2519:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2564:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2054:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2254:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2788:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2135:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2005:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2619:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2062:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2411:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2099:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2152:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2424:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2212:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2241:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2354:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1995:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1944:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2153:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2457:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2454:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1824:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2055:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2507:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1957:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.1811:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2051:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2071:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2040:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2463:  86%|████████▌ | 343/401 [04:14<00:42,  1.37it/s]training loss: 0.2463:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2506:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2475:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1985:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1712:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1623:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2247:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1887:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.3122:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1773:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2039:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2117:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1762:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1823:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2077:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1706:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2211:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1927:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2818:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2230:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1951:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2659:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2139:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2676:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2165:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2320:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2349:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2332:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1388:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1829:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1632:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1963:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2456:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1990:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2038:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2116:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2015:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2017:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2324:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2518:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1754:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2560:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1699:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1954:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2708:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1745:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2028:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2455:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2717:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2513:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1939:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1789:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2386:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2755:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2299:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2070:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1877:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1722:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1510:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.3001:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2270:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2419:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2000:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1562:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1830:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1910:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2993:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1636:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1612:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2631:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2552:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1451:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1567:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2153:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2851:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1850:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.1889:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2320:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.2060:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.3114:  86%|████████▌ | 344/401 [04:14<00:35,  1.62it/s]training loss: 0.3114:  86%|████████▌ | 345/401 [04:14<00:30,  1.83it/s]training loss: 0.2443:  86%|████████▌ | 345/401 [04:14<00:30,  1.83it/s]training loss: 0.1828:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2221:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2216:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2040:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1927:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2704:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2272:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1862:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2053:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2905:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2298:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2094:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1857:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2104:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2243:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1596:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2340:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2728:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2121:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2142:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2255:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2063:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1915:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2121:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1985:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1664:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2414:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2473:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2041:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2021:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1992:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2211:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2314:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1895:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2055:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2821:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2008:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2564:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2274:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2660:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1677:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2602:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2854:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2838:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1556:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1980:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2411:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.3120:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2429:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2014:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2223:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2158:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2157:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2297:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2244:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1864:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1812:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2616:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1943:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2244:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2522:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2139:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1720:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2263:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1372:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1881:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1854:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1850:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2028:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1799:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2104:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2446:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2425:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2556:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2052:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.2169:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.1894:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.3445:  86%|████████▌ | 345/401 [04:15<00:30,  1.83it/s]training loss: 0.3445:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1977:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1740:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2208:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2196:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.3145:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2418:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.3125:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2202:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2335:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2017:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2236:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2169:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2311:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2320:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1924:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2324:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.3017:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2466:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2322:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1487:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1777:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1923:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2134:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2606:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2322:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2548:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2205:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1992:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2180:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2129:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2673:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2338:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1918:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2146:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2173:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1721:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1897:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1925:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2319:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2208:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2333:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1763:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2069:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2123:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2094:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1930:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2821:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2102:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1981:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2447:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2280:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2168:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2114:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2633:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2278:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1689:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2264:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1761:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1738:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2301:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2695:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1925:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2986:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2225:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2677:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1682:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2892:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2418:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2289:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2342:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1888:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1851:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2114:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2226:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2399:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1993:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.1967:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.2165:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.3119:  86%|████████▋ | 346/401 [04:15<00:27,  1.97it/s]training loss: 0.3119:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2009:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2392:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2829:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1700:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2212:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2186:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1823:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2352:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2098:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2516:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2218:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1806:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2120:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2156:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1845:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2027:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2400:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2512:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1834:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2423:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.3274:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2104:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2182:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1992:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2344:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1746:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1795:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2172:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1877:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2565:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1933:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2058:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2298:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2012:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1679:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2348:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1909:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2459:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2341:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2205:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1943:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2128:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1106:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1682:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1574:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2194:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1993:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.1916:  87%|████████▋ | 347/401 [04:15<00:25,  2.15it/s]training loss: 0.2326:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2085:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1810:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1837:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2190:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2332:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1561:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2946:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2561:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2160:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1733:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2286:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1940:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2084:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2283:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2228:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2080:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2256:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1820:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2470:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1551:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1585:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2260:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1789:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1625:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1945:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1898:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1573:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2284:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.2031:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1145:  87%|████████▋ | 347/401 [04:16<00:25,  2.15it/s]training loss: 0.1145:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2249:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2405:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1998:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2067:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1739:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2016:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2252:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2093:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2154:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2333:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1656:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2417:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2143:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2426:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2112:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2110:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2232:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2194:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2383:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2702:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2037:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2268:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1674:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2244:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1989:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1816:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1950:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2153:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1963:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1868:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2020:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1874:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2571:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2376:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1993:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2218:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2073:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2673:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2275:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2110:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2208:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2080:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2214:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1748:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1594:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1976:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2577:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2559:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1996:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1730:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2071:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2055:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2232:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2205:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2131:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1890:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2016:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2203:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2547:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2296:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2158:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2001:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2589:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2316:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2192:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2008:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1980:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2191:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2147:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1996:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2001:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2019:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1949:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2921:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2210:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1643:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1952:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.2196:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1683:  87%|████████▋ | 348/401 [04:16<00:22,  2.32it/s]training loss: 0.1683:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2450:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2092:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2454:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1948:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2615:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1993:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2560:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2201:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1598:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1566:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2381:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1840:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1940:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2383:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1742:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1510:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1705:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2001:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2043:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2700:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1916:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1983:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1610:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1542:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2135:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2168:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2203:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1630:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1977:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1684:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2024:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2242:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2160:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1703:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2015:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2432:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2041:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1989:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2640:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2231:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2557:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1787:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1894:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1770:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2144:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2005:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2008:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2513:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2437:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1934:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1997:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2768:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2302:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2021:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2587:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2002:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1985:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1999:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2320:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2084:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2433:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1306:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2617:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1912:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1600:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2211:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2186:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2434:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1999:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2243:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1538:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2210:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2209:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2117:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.1720:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2465:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2582:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.2078:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.3431:  87%|████████▋ | 349/401 [04:16<00:21,  2.44it/s]training loss: 0.3431:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.2172:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.1876:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.2616:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.1883:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.1978:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.1571:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.2132:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.2261:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.2518:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.2493:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.1801:  87%|████████▋ | 350/401 [04:16<00:20,  2.53it/s]training loss: 0.2228:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2311:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2643:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2155:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1996:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2261:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2302:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2567:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1906:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1639:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2144:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1675:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1715:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2711:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1734:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2265:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1980:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2259:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1488:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1836:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1713:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2219:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2493:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2345:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2366:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2430:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1822:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2535:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2886:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1742:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2134:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1788:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2357:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1928:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2401:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2151:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2537:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2393:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1933:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1843:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2561:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2390:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2197:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2423:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1614:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1759:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1604:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.3103:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2216:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2042:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2555:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2555:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1621:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2054:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2226:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.3195:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2197:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2754:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2291:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2246:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2236:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1692:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1905:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2579:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2376:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2924:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.2209:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1723:  87%|████████▋ | 350/401 [04:17<00:20,  2.53it/s]training loss: 0.1723:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1989:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2066:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2032:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1781:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2072:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2260:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1635:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2268:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2300:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2193:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2172:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2109:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1605:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2371:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1820:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2444:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2122:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1878:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2277:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1969:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2458:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2015:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1779:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1781:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1950:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1720:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2134:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2056:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2308:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1617:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2425:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2074:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1980:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1947:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2607:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2112:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1890:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1992:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2070:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2046:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2369:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2163:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2329:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2328:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2817:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2631:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1973:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2055:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2071:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.3021:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1440:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.1852:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2310:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2158:  88%|████████▊ | 351/401 [04:19<00:57,  1.15s/it]training loss: 0.2027:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1918:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2148:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1809:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2289:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2062:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2144:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2525:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2410:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2046:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1296:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1889:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2090:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2455:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1478:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1731:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2146:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1905:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1746:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2575:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2591:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2065:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.1863:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.2900:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.3909:  88%|████████▊ | 351/401 [04:20<00:57,  1.15s/it]training loss: 0.3909:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2164:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1820:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2125:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2364:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2771:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1359:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1871:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2201:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2043:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2424:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2034:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1751:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2131:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2198:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1898:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2703:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2201:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2300:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1910:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2291:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2875:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1841:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2390:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1996:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1981:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2208:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1642:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2653:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2596:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2563:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1507:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2332:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1564:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2097:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2613:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1903:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1968:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2073:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1680:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2218:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2436:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2157:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2575:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2078:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2394:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1898:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2110:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2070:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1792:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2010:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2334:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2138:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1823:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1994:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1883:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2549:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2110:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2429:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2101:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2704:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2034:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2498:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1595:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1491:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1381:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1970:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1599:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1845:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2101:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2131:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1921:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2105:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2118:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2057:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2341:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1822:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2024:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.1768:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2066:  88%|████████▊ | 352/401 [04:20<00:44,  1.10it/s]training loss: 0.2066:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2348:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1891:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1976:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2834:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1363:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2142:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2635:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1923:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1964:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2128:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2180:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2215:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2381:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1656:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1784:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1908:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2379:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2310:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1668:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2588:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2038:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1850:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2271:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1316:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2368:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1952:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1978:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2072:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2221:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2526:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1943:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2384:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2168:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2206:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2037:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2240:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2478:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2109:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1856:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2013:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2164:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2154:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1852:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2558:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2492:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1879:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2476:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2163:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2100:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2187:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1841:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1589:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2190:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1686:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2066:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1777:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2099:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1962:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2499:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2467:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2206:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2748:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2429:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1758:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2545:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2369:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2130:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1935:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1784:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2249:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2703:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2397:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1948:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1657:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2460:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2368:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.2292:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1681:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1408:  88%|████████▊ | 353/401 [04:20<00:35,  1.34it/s]training loss: 0.1408:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.1825:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.1776:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2244:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2344:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2145:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2824:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2113:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2198:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2082:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.1973:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2261:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2415:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.1892:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2174:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2075:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2313:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2061:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2382:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2307:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2446:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2422:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2502:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2039:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2531:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.2543:  88%|████████▊ | 354/401 [04:20<00:30,  1.55it/s]training loss: 0.1952:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2270:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2320:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1719:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1789:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2257:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1811:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2481:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2287:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2708:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2693:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1434:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2027:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2079:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2024:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2304:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2383:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2403:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2497:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1820:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2145:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2027:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1957:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2288:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2141:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1674:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2072:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1894:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1902:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2587:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2223:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1703:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2147:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1945:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2368:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1732:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2027:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2347:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2055:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2542:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2281:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2175:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2721:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2316:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2162:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2151:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2009:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1356:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1954:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2642:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2168:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.2163:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1807:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1052:  88%|████████▊ | 354/401 [04:21<00:30,  1.55it/s]training loss: 0.1052:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2329:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1862:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2176:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1529:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1985:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1758:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2389:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1833:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1484:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2310:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2503:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2678:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1784:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2115:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2297:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1847:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1900:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2492:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2352:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2610:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2007:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1974:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2063:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2554:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2479:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2432:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2135:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1839:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2364:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1822:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2147:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2126:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2156:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2402:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1902:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2003:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1820:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1790:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1654:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1882:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1207:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2235:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2346:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2148:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1833:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1930:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1857:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2018:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2052:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1748:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1303:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2067:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2569:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2601:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1781:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2070:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2224:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2134:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2961:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2114:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2441:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2143:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1891:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2028:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2001:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2242:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2298:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1811:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1594:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2503:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1895:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2105:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2123:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2424:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2105:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2454:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.2004:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.1732:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.3706:  89%|████████▊ | 355/401 [04:21<00:25,  1.78it/s]training loss: 0.3706:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1981:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2111:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2210:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2194:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1762:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1952:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2305:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1830:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2037:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2641:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2331:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.3075:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2519:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1861:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2241:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2305:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1840:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2338:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1596:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1961:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1860:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2138:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2182:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1917:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1832:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1860:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2162:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2193:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2332:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2429:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2498:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2394:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1988:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2182:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2478:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2338:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1799:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1877:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1956:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2156:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1828:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1772:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2102:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.3287:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2242:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2263:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2746:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2126:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2295:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1416:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2482:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1840:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1332:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2025:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2799:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1966:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2391:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2886:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2291:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2417:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2279:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1831:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2289:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.3013:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2094:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1907:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2706:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2095:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1822:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2021:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2028:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2254:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1699:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2324:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.1769:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2257:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2087:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2018:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2386:  89%|████████▉ | 356/401 [04:21<00:22,  1.98it/s]training loss: 0.2386:  89%|████████▉ | 357/401 [04:21<00:20,  2.14it/s]training loss: 0.2063:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1880:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2116:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1918:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1758:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1475:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1757:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2076:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2422:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1915:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2380:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2493:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2681:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1754:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1738:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2302:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1924:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1555:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2664:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1970:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2344:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2186:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1731:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2166:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2109:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2098:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1757:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2247:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2161:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1806:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1977:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2205:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2266:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2406:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2370:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2105:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1885:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2506:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2469:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1997:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2311:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1612:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2105:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1994:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2255:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2330:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1767:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2990:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1931:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2351:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2195:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1846:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2138:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1937:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2595:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2083:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2396:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2672:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2452:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2501:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2098:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2481:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2805:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1948:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1679:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1838:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1956:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2068:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2253:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2425:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2022:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2341:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1716:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1684:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1630:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1799:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2055:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.2520:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1506:  89%|████████▉ | 357/401 [04:22<00:20,  2.14it/s]training loss: 0.1506:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2413:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1864:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1719:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1743:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2114:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2392:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1992:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2189:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1840:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1920:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2244:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2360:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1399:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2193:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2097:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2217:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2656:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2377:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1767:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1949:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1867:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1893:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1971:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1749:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2549:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2259:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1902:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1675:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2100:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2126:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2417:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1912:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1819:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1636:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2530:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1897:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2124:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1725:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1675:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2068:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2611:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1902:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2212:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1785:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1875:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2685:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1888:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2404:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2448:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1730:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2402:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2163:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1793:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2664:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2293:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2067:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1616:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2294:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2128:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2586:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1842:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1827:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2641:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2361:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2293:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2529:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2839:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1771:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2525:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1599:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2355:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1723:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2394:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.1728:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2046:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2643:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2125:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2175:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2006:  89%|████████▉ | 358/401 [04:22<00:18,  2.26it/s]training loss: 0.2006:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1736:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1929:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2453:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2811:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1759:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2848:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1714:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1684:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1943:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1882:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2000:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2381:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1812:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2758:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2346:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2055:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2612:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1953:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2173:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2104:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2257:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1965:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1967:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2091:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2017:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2623:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2142:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2097:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2060:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.3283:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1510:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2405:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.1932:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2270:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2499:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2067:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2072:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2416:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2832:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2362:  90%|████████▉ | 359/401 [04:22<00:17,  2.35it/s]training loss: 0.2394:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2106:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2191:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2044:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2307:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1864:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1992:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2153:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1504:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1932:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2178:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1781:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2376:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2043:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1549:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1693:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1695:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2182:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1724:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2737:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1970:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2021:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2112:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2069:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1706:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1474:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2099:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2023:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1850:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1878:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2341:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1601:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2193:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2420:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1858:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.2122:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1227:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1584:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1528:  90%|████████▉ | 359/401 [04:23<00:17,  2.35it/s]training loss: 0.1528:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1958:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2214:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1781:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2423:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1807:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2469:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1823:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1977:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1955:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1660:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2118:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2414:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2422:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2050:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2218:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2621:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1943:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2662:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2194:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1869:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2672:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1933:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2129:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1810:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2600:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1716:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2427:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2935:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2123:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2002:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1870:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2183:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2633:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2436:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2232:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2828:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2031:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2254:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1782:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2204:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2329:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2014:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2375:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2194:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2218:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1785:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1873:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2796:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1655:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2036:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2265:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2424:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2205:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1957:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2380:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1713:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.3081:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2167:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2903:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2972:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2626:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1903:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1887:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2767:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2042:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1913:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2115:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1755:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1919:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2624:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1978:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1937:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2370:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2076:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2122:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2026:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1772:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.2381:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1978:  90%|████████▉ | 360/401 [04:23<00:17,  2.31it/s]training loss: 0.1978:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1624:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2142:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2171:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1844:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1866:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2258:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2059:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2352:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1923:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2184:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1357:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1877:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1702:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1977:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2597:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2076:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2700:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2023:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2169:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2283:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1764:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2649:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1822:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2131:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1811:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1827:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2628:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1820:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2200:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1734:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1969:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2623:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2902:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2265:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2538:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1817:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2148:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2178:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1759:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1960:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2363:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2310:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1956:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2289:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2943:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2350:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2166:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2781:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1987:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2408:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2308:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2415:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2244:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1754:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2245:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1781:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1958:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2024:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2183:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2822:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2397:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2571:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1665:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1847:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1978:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2187:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1813:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2240:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2047:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2457:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2156:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2109:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2642:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2038:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2004:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1969:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.2123:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1962:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1621:  90%|█████████ | 361/401 [04:26<00:45,  1.15s/it]training loss: 0.1621:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2308:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2065:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2077:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2579:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2148:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2166:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2017:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2193:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2031:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2137:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1827:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2444:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2175:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2195:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2384:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2537:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2207:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1684:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2922:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2181:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2005:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1974:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1749:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1719:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2229:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2558:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2219:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1847:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2314:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2179:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2569:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1734:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2266:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2059:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1530:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2350:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2124:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2293:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2133:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2940:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1738:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1692:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2256:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1765:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2935:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1926:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2376:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2163:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2519:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2169:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1792:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2007:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2236:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2152:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2616:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1971:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2341:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2204:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2056:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2494:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1326:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1997:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2271:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2008:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2227:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2291:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2118:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1724:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1974:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2076:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2485:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2087:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2072:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1851:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.1774:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2582:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2228:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2536:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2106:  90%|█████████ | 362/401 [04:26<00:35,  1.11it/s]training loss: 0.2106:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1818:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1991:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2119:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1930:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2070:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1792:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2176:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2979:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2004:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1790:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2614:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2447:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2567:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2440:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2065:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1614:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2477:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2236:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2432:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2328:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2745:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2462:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2375:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2180:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1855:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1524:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2056:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2421:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2526:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1984:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2221:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2896:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2309:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2075:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2504:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2601:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1837:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1614:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1949:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2405:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1740:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1976:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1918:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2024:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2531:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2712:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2316:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1661:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1847:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2014:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2235:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1913:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1962:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1951:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1642:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2121:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2361:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2185:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2227:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2846:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1733:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1951:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.3046:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2069:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.2134:  91%|█████████ | 363/401 [04:26<00:27,  1.36it/s]training loss: 0.1820:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2672:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2419:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2529:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.1465:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2168:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2300:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.1972:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2143:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2121:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2038:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.2649:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.1737:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.1098:  91%|█████████ | 363/401 [04:27<00:27,  1.36it/s]training loss: 0.1098:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2201:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2118:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2068:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2221:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2322:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2113:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2167:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2537:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2603:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1882:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1730:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2130:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2345:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2310:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2447:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2115:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2572:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1774:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2094:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1820:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1771:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2908:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1818:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1906:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2426:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2147:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1955:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2506:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2196:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.3033:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2505:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2285:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2618:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2007:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2046:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1992:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2296:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2832:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2426:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2737:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2099:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2206:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2199:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2104:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2462:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2701:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2202:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2025:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1818:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1694:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2184:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1999:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1413:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1703:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1781:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1934:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2075:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2236:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2225:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2491:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2308:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2169:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1983:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2222:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2257:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2076:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2747:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1900:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2133:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2070:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2381:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2580:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2356:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1969:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2185:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.2010:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1830:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1829:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1542:  91%|█████████ | 364/401 [04:27<00:23,  1.61it/s]training loss: 0.1542:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2122:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2393:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1968:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1591:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1666:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2392:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1897:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1647:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1700:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2235:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1907:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2278:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2708:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1997:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2226:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1763:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1766:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2865:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1681:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1959:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2153:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2350:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2134:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1833:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1771:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1921:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2255:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1999:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1787:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2117:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2537:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1793:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1891:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1740:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1945:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1794:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2506:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2219:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1950:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2074:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2161:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1967:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2401:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2077:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2267:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1846:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2522:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2637:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1934:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1941:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2177:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1909:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2139:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2911:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2024:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2111:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2609:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2199:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2426:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1688:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1993:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2535:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2701:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2478:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1697:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1661:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2162:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1836:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1844:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1974:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2009:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2325:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1326:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2050:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.1584:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2706:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2007:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.2668:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.0899:  91%|█████████ | 365/401 [04:27<00:20,  1.72it/s]training loss: 0.0899:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.1933:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2071:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2364:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2262:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.1961:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2104:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2557:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.1804:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2410:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2494:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2117:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.1754:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.1547:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.1774:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2113:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2526:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2548:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2272:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2224:  91%|█████████▏| 366/401 [04:27<00:17,  1.95it/s]training loss: 0.2038:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2033:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2106:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2203:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1514:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2018:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2575:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2110:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1950:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2242:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2395:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1617:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2180:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2268:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1874:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2378:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2167:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1623:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2692:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2190:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2291:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1771:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2257:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2183:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2088:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1698:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2159:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1694:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2278:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2123:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1528:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1847:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2607:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1520:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2005:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2269:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2180:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.3069:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2466:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2762:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2232:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.3047:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2320:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2111:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2593:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1947:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2840:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2456:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2483:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2160:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2038:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1931:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2748:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1704:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2098:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2068:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2318:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2125:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.2352:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1999:  91%|█████████▏| 366/401 [04:28<00:17,  1.95it/s]training loss: 0.1999:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2244:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2517:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1817:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2672:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2268:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2211:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1732:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2714:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2087:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1709:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2535:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2815:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1720:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1911:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2534:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1750:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1968:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1950:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1948:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2814:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1975:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1525:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1995:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2847:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1955:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1907:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2477:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2039:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2717:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2479:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2493:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2150:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1951:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2372:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2016:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2259:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1923:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2512:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2221:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1887:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2295:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2090:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2640:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1932:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2334:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2333:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2124:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1913:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1944:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1889:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2066:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2065:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2230:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1679:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1701:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1814:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1870:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2517:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1745:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2260:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1908:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2140:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1801:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2332:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1839:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1865:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2522:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2140:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1832:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2000:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2619:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2472:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2052:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1761:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2216:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2175:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2360:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.1849:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2467:  92%|█████████▏| 367/401 [04:28<00:15,  2.14it/s]training loss: 0.2467:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2127:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2726:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2435:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2142:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2324:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2620:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1932:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2013:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2087:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2127:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2105:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1594:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2248:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2459:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1776:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2379:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2009:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1914:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2030:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1757:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1551:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2597:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2115:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2193:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.3319:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2517:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2706:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2236:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.3921:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2144:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2628:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1542:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1750:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2621:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1976:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1943:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2003:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2150:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2196:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2302:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2392:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2403:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2764:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2492:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1959:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1934:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2473:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2467:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2112:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1856:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2438:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1822:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1891:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1489:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1579:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2328:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1853:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2177:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2418:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1750:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1442:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1867:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2842:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2256:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2247:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1759:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2075:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1846:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1800:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1949:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1875:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2287:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2169:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1702:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.2127:  92%|█████████▏| 368/401 [04:28<00:14,  2.32it/s]training loss: 0.1929:  92%|█████████▏| 368/401 [04:29<00:14,  2.32it/s]training loss: 0.1979:  92%|█████████▏| 368/401 [04:29<00:14,  2.32it/s]training loss: 0.1670:  92%|█████████▏| 368/401 [04:29<00:14,  2.32it/s]training loss: 0.1776:  92%|█████████▏| 368/401 [04:29<00:14,  2.32it/s]training loss: 0.1776:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2497:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1718:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2733:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2099:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2009:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2020:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2287:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2022:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2345:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2138:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2500:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1893:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1979:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1925:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1851:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1706:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2040:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2150:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2247:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2267:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2507:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1889:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2022:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1840:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2278:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2226:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1807:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1836:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2865:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2237:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2123:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1891:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2478:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1805:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2117:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2058:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2331:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1705:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1550:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1594:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2627:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2055:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2079:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2952:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2011:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1995:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1939:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2555:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1868:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2474:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2079:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1929:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2423:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1589:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1758:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2232:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2263:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2265:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1322:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1918:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2306:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1804:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1917:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2166:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2311:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2445:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2295:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2631:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2291:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1995:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1780:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2502:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1849:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1830:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1954:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2116:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2342:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.1961:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2694:  92%|█████████▏| 369/401 [04:29<00:13,  2.37it/s]training loss: 0.2694:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2163:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2155:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2223:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1947:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2153:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2167:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1999:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1902:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1873:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2443:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2098:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2723:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2560:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1834:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1914:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1636:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2537:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2395:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2193:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2185:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2257:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2030:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1491:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1943:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2495:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2654:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1710:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2054:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2543:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2552:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2404:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2244:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2190:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1555:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2439:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2525:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2284:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2291:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2271:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2054:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1934:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2448:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1975:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2481:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2542:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1985:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2977:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2638:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1960:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2591:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2032:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2179:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1788:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2096:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1745:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1787:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1801:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1814:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1962:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1862:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2775:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2308:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1789:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2239:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2012:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1835:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2480:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1940:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2532:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2119:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1506:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1895:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2054:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2543:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.1825:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2657:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2324:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2965:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2376:  92%|█████████▏| 370/401 [04:29<00:12,  2.52it/s]training loss: 0.2376:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1518:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2514:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1816:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2042:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2084:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2385:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2188:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2588:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1941:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1725:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2014:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.3107:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1940:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2064:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2345:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2382:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2647:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2599:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2288:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2370:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2180:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2213:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2426:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2586:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2029:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2424:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1995:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1662:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2378:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2517:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2324:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1926:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2597:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2166:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1634:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2434:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2243:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1910:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2583:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2697:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2559:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2512:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2332:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2080:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1322:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2417:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2242:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1687:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2023:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1735:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2922:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2413:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2155:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1760:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1876:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1773:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2297:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1795:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1865:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2074:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1960:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1600:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2040:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1930:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2150:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1738:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1847:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2174:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2504:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2442:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1994:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2557:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2433:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1898:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1710:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1978:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.1972:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.2203:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.6324:  93%|█████████▎| 371/401 [04:32<00:32,  1.09s/it]training loss: 0.6324:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1661:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2832:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2671:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2264:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2602:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2102:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2167:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2156:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2213:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2118:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1533:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1688:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1785:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2395:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1684:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2412:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1897:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2021:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2267:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2359:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2497:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1849:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.3115:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1790:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1680:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2146:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2427:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2488:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2383:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1858:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2541:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2612:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2340:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1699:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2515:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2132:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2086:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.3002:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1899:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2157:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2008:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2690:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1969:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2366:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2858:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2196:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2652:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1936:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.3053:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1832:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1885:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1445:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1913:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2086:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2144:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2594:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2306:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2034:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1583:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2289:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2142:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2359:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2224:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2727:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2037:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1811:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2169:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.2303:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1818:  93%|█████████▎| 372/401 [04:32<00:27,  1.05it/s]training loss: 0.1942:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2270:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2032:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2418:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2460:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2251:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.1970:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2205:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2013:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2790:  93%|█████████▎| 372/401 [04:33<00:27,  1.05it/s]training loss: 0.2790:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2308:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1947:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2610:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2979:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1784:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2635:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1695:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1473:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1441:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1975:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1954:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1670:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2525:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2389:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1689:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2205:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1915:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2508:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1665:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2196:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2120:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2063:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1983:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1954:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1951:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2571:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1433:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2209:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2375:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2251:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2430:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1910:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1903:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1863:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2003:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1592:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2303:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2112:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1987:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2077:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2489:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1923:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1888:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2825:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2359:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2559:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2424:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2163:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2070:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2527:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2551:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2616:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2086:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2403:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2285:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2231:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1967:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1904:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2405:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1828:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1853:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2366:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2051:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2074:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1999:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2173:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1964:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2175:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2168:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1845:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2396:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2313:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2032:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2136:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1871:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.1974:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.3049:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.2003:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.4360:  93%|█████████▎| 373/401 [04:33<00:21,  1.30it/s]training loss: 0.4360:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2239:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1771:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2079:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1667:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2815:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.3386:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1898:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2172:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2959:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2220:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2309:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1561:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2026:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1868:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2107:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2270:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1473:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2369:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1871:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1976:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1899:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2825:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2285:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2246:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2025:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1911:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2698:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2955:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1650:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1624:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2168:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2031:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2086:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2766:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1957:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2504:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2455:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1913:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2180:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2179:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1797:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1997:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2449:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1773:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1869:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2256:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2213:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2397:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1947:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2141:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2394:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1787:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2135:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1898:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2666:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2180:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2029:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2236:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2010:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2597:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1747:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2062:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2374:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2417:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1903:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2153:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2263:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2334:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1599:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2393:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1607:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2741:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1873:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2548:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1899:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2177:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.1941:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2954:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2155:  93%|█████████▎| 374/401 [04:33<00:17,  1.54it/s]training loss: 0.2155:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2567:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2140:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1802:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1996:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2342:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2512:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2011:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1822:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1559:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1911:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1811:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2136:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1885:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2013:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2518:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2117:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2670:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2432:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2055:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1985:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2453:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2665:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2431:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2208:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2662:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2224:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2721:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2103:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2169:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2598:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2440:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2086:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1523:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2480:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2647:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2777:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2378:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2274:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2890:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2126:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2179:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2283:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1949:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2247:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1697:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2609:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1821:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2374:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2443:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2123:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1893:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2170:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1802:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2304:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1571:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1815:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2238:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2227:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2261:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.1623:  94%|█████████▎| 375/401 [04:33<00:14,  1.80it/s]training loss: 0.2173:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2705:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.1840:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.1629:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2961:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2012:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2230:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.1987:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.1862:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2285:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.1677:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2273:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.1941:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.1677:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.1929:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2196:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2047:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.2760:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.6970:  94%|█████████▎| 375/401 [04:34<00:14,  1.80it/s]training loss: 0.6970:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1856:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2348:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2014:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2043:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2457:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1609:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2231:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1856:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2353:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2878:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1866:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2190:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2799:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1953:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2096:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1630:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2830:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2085:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1879:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2241:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2055:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2665:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2283:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2277:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2516:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1868:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2697:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2001:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2081:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1844:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1923:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1790:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1985:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2434:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2457:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1772:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2628:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2338:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2394:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1845:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2260:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1793:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2001:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2412:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1865:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2102:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2542:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2959:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2151:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2285:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2258:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1983:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2279:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2006:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2021:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1877:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2180:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2301:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2063:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2129:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2482:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1813:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2003:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2006:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2211:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1810:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1960:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1387:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1953:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1705:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2236:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2173:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2422:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2031:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2127:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2284:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.2052:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1780:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1542:  94%|█████████▍| 376/401 [04:34<00:12,  2.04it/s]training loss: 0.1542:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2205:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1922:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2632:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2370:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1724:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2272:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1951:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2265:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1663:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.3089:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2005:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2345:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1681:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2483:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2697:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2285:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2375:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2361:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2513:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1646:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2290:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1843:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2846:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2518:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2042:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1924:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2005:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1891:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1775:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2360:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2290:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1739:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2517:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1607:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2061:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2309:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1466:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2235:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2116:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1717:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1956:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2685:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1772:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2029:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1505:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2109:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1853:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1700:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2355:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1838:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2102:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1668:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1810:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2828:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2382:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2580:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1953:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1973:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1941:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1899:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2085:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1709:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1486:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2194:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2537:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1967:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2039:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1765:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2646:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2027:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.3080:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1686:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.1562:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2143:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2165:  94%|█████████▍| 377/401 [04:34<00:11,  2.10it/s]training loss: 0.2023:  94%|█████████▍| 377/401 [04:35<00:11,  2.10it/s]training loss: 0.2458:  94%|█████████▍| 377/401 [04:35<00:11,  2.10it/s]training loss: 0.2063:  94%|█████████▍| 377/401 [04:35<00:11,  2.10it/s]training loss: 0.2467:  94%|█████████▍| 377/401 [04:35<00:11,  2.10it/s]training loss: 0.2467:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2169:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2542:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1666:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2274:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1848:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2374:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2344:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2284:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2089:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2060:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1532:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1972:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1908:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2052:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.3024:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2176:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2044:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2002:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2846:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2138:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2423:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2318:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1664:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1770:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2370:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2147:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2370:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1994:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2697:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2296:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1846:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1651:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1950:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2174:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1810:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1787:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2289:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2519:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2677:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2251:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1739:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2347:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2205:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2077:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1465:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2142:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2017:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2607:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1863:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1461:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2341:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2276:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2072:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1684:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1590:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2634:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2210:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2096:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2351:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2573:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2686:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1761:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2206:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2045:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1747:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2014:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2542:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2064:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1955:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1311:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1894:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2167:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2376:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1760:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.2336:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1953:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1566:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.3009:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1858:  94%|█████████▍| 378/401 [04:35<00:11,  2.09it/s]training loss: 0.1858:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2156:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2099:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2703:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2468:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2399:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2096:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1947:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1574:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2122:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1698:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2490:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1846:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1855:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2140:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1687:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2313:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2106:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2331:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2166:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1694:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1912:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2433:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1917:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2492:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2062:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2553:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2140:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2029:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2832:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2306:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1966:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1471:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2137:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2814:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1949:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1745:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2298:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1983:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2119:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1813:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1615:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1706:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2469:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2369:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2671:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2209:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1725:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2274:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2329:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2412:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2030:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2534:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2219:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2377:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2235:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2325:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2164:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2088:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1886:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1860:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2709:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2366:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2597:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2742:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2112:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2958:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2212:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2134:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2071:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1952:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1429:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1990:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2520:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1754:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2648:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2320:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.2198:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.1781:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.3279:  95%|█████████▍| 379/401 [04:35<00:09,  2.29it/s]training loss: 0.3279:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1843:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2435:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2251:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2440:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1928:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1646:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2466:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2412:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2498:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1995:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2078:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2298:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1697:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2722:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2255:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2252:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2275:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2026:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2298:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2512:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2026:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2333:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2173:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2335:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2336:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2008:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1872:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2321:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2424:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2323:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2277:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2436:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1846:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2279:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1696:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2359:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2167:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1293:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1860:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2544:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2243:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2605:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2359:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2131:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2350:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2059:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2347:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1674:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2286:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1917:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2233:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2040:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2975:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2232:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1774:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2435:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2084:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1696:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2020:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2136:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2324:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1568:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2509:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.3075:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.1919:  95%|█████████▍| 380/401 [04:35<00:08,  2.40it/s]training loss: 0.2151:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.2133:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.2429:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.1750:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.1899:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.1883:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.2070:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.2977:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.2207:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.1978:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.2192:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.1855:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.1865:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.2895:  95%|█████████▍| 380/401 [04:36<00:08,  2.40it/s]training loss: 0.2895:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2013:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1693:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2195:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2764:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2770:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2069:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2080:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2311:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2064:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2420:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2290:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1759:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2688:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2423:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1600:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2019:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2119:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1932:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2570:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2168:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2084:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2158:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2464:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2324:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.3077:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2521:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2342:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1689:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2296:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1906:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1874:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1921:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1959:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1748:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2981:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2566:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2823:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2063:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2097:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2700:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1987:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1360:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2119:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1423:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2640:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2128:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2478:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2408:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2214:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2259:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2403:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1886:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2365:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2285:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.2170:  95%|█████████▌| 381/401 [04:38<00:22,  1.15s/it]training loss: 0.1960:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1924:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1845:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2018:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2095:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1734:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2305:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1985:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2865:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2420:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2209:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1619:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2209:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1869:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2070:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1857:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2466:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1816:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2334:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1833:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2387:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.1776:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.2376:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.3740:  95%|█████████▌| 381/401 [04:39<00:22,  1.15s/it]training loss: 0.3740:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1962:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2010:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1814:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2399:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2647:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1980:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1814:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1903:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2474:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2354:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1761:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2641:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1818:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2038:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1827:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1647:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2126:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2024:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2833:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2544:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2137:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2119:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2481:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2094:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2388:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2055:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2170:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2194:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2068:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2082:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2376:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1950:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2620:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2889:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1800:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2045:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1919:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2116:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1887:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1945:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2850:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1893:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1857:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1997:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1622:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2520:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1590:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1957:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2106:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2544:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1405:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2690:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2455:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1805:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2443:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2662:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1773:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2585:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1566:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2840:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2478:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2081:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2353:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2137:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2743:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1541:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1882:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2114:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2682:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1692:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2413:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1665:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2077:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2008:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2180:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.2296:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1831:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1823:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1824:  95%|█████████▌| 382/401 [04:39<00:18,  1.04it/s]training loss: 0.1824:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2168:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2160:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1560:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1939:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2035:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1856:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2654:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1984:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2088:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2349:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2150:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2333:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2590:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1927:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2547:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2309:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1966:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2135:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2327:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2262:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2903:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1941:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2112:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1774:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2181:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.3092:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2833:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2177:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2297:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1656:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2082:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1942:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1886:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1893:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2116:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2280:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2328:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2302:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1910:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2138:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2103:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2250:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1841:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2346:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1907:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2465:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2365:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1972:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1898:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1847:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1775:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2269:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2370:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1658:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2425:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2285:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2198:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2240:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2033:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1605:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2212:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2048:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1808:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2060:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2543:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2240:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2858:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2454:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1759:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2167:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2386:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1974:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2529:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2085:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2917:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1943:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1945:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.1636:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2732:  96%|█████████▌| 383/401 [04:39<00:13,  1.29it/s]training loss: 0.2732:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.2305:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.1920:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.2030:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.2120:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.2125:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.1979:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.2546:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.2634:  96%|█████████▌| 384/401 [04:39<00:11,  1.52it/s]training loss: 0.2742:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2209:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1897:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1969:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1876:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2022:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1911:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2594:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2218:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1964:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1859:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2209:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2641:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2044:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2079:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2027:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2230:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1462:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1978:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1964:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1706:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1670:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2429:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1747:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1867:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2331:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2599:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1886:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2163:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2255:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1988:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1799:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2121:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2541:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2019:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1780:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2406:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2559:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2086:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1957:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1822:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2411:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2053:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2397:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1582:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2163:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2160:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1793:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2489:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1687:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2019:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2187:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2165:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2269:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2178:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1957:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1496:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2130:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2128:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2381:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2259:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2831:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2155:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2686:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1989:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2786:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2517:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.2231:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1714:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.1773:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.0720:  96%|█████████▌| 384/401 [04:40<00:11,  1.52it/s]training loss: 0.0720:  96%|█████████▌| 385/401 [04:40<00:11,  1.43it/s]training loss: 0.1654:  96%|█████████▌| 385/401 [04:40<00:11,  1.43it/s]training loss: 0.2774:  96%|█████████▌| 385/401 [04:40<00:11,  1.43it/s]training loss: 0.2056:  96%|█████████▌| 385/401 [04:40<00:11,  1.43it/s]training loss: 0.1796:  96%|█████████▌| 385/401 [04:40<00:11,  1.43it/s]training loss: 0.1803:  96%|█████████▌| 385/401 [04:40<00:11,  1.43it/s]training loss: 0.2213:  96%|█████████▌| 385/401 [04:40<00:11,  1.43it/s]training loss: 0.2237:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1743:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1737:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2237:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1653:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2066:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2182:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2302:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2139:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2193:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1952:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1689:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2021:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.3057:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1939:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2141:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1908:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2257:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2014:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2256:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1893:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2007:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1516:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1909:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2727:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1543:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1608:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2325:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2488:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1878:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2356:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2826:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2596:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1999:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2245:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1775:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2294:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1853:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1995:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2200:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1526:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2408:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2372:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2004:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2264:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2105:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2282:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2505:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2011:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.3230:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2473:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2135:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.1807:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2529:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2320:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.2253:  96%|█████████▌| 385/401 [04:41<00:11,  1.43it/s]training loss: 0.3093:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.1964:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2544:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2370:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.1809:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2132:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.1804:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2188:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2315:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2784:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2526:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.1994:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2221:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2227:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2011:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.2366:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.1863:  96%|█████████▌| 385/401 [04:42<00:11,  1.43it/s]training loss: 0.1863:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1605:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2273:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1918:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2024:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2062:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1989:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1847:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2758:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1783:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2097:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2442:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2352:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1890:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1823:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2764:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2186:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2017:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2075:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2035:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2169:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1927:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2695:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2206:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2079:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1600:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2713:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1957:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2661:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2130:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1909:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2352:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2052:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1710:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2266:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2646:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1966:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2651:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2550:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2202:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1844:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2163:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1953:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2009:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1808:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2380:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2292:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2491:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2215:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2180:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2661:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1876:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1706:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1943:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2279:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2081:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1649:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2543:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2172:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1682:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2034:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1799:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2123:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2563:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2100:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2129:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1921:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2753:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2149:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2441:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1979:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2076:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2294:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2081:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.1827:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2119:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2272:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2014:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.2507:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.3579:  96%|█████████▋| 386/401 [04:42<00:13,  1.08it/s]training loss: 0.3579:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1935:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1725:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1521:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1871:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2172:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1916:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1667:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1772:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1973:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2243:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2131:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2354:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2392:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1982:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2147:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2147:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2157:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2146:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1899:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2087:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2684:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2334:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1748:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2363:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1737:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1680:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1967:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2384:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2410:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1626:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1835:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2300:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1294:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2436:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1510:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1668:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2190:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2211:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2064:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.3104:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2507:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2054:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2299:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1716:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2267:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1806:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2679:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2007:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1767:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1986:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1738:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1594:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2129:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2300:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2551:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2339:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1904:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2205:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1984:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2191:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2547:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2139:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2070:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2113:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1953:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1656:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2235:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1714:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1677:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1993:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1657:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2344:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2004:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1666:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2162:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2043:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.1981:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2075:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2065:  97%|█████████▋| 387/401 [04:42<00:10,  1.29it/s]training loss: 0.2065:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2617:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2143:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2173:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2531:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2612:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2780:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2852:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2138:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1655:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2296:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2407:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1974:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2276:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2264:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2268:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1873:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1939:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2130:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2193:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2278:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2105:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2765:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2390:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1944:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1709:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2015:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2153:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2093:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1748:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2519:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2049:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2258:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1809:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2201:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2455:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1846:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1990:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2006:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1826:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.1909:  97%|█████████▋| 388/401 [04:42<00:08,  1.56it/s]training loss: 0.2399:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1801:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1963:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2021:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1631:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.3357:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2020:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2056:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2154:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2049:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2146:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2324:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2102:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1658:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1421:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1990:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1671:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2220:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1881:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1713:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2304:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2164:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2913:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2074:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2118:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2319:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2516:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2535:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1556:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1899:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1539:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2009:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1661:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.2233:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1501:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1803:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1832:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.1607:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.0655:  97%|█████████▋| 388/401 [04:43<00:08,  1.56it/s]training loss: 0.0655:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2344:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2291:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2215:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1810:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1926:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2474:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1763:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2214:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1984:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2185:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2489:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2670:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2494:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1628:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2263:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2572:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1934:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1440:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1650:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1764:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2196:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1587:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2356:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2080:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1745:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2121:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2538:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2189:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2546:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2469:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2786:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2150:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2211:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1905:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2523:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1839:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2201:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2258:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2332:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2203:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1672:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2647:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1988:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1931:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2302:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2003:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1976:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2369:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2351:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2559:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2049:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2053:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2321:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1976:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2671:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1291:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1609:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2485:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1963:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1453:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1710:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1876:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2226:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1975:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2280:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1728:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2326:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2187:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1514:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2405:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2229:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2034:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1918:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2342:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2623:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2082:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2111:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.2634:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1801:  97%|█████████▋| 389/401 [04:43<00:06,  1.82it/s]training loss: 0.1801:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1855:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2348:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2723:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2207:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1731:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1791:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2657:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1941:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1672:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1916:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2228:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1665:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2067:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2475:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2422:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1721:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1968:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2256:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2012:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1865:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2420:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2937:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2008:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2222:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2385:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1943:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2134:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1787:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2214:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2034:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1982:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1859:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1941:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2528:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2068:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1869:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1896:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1964:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2008:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1752:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2294:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2079:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2925:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2200:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1744:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1883:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2310:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2183:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2004:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2130:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1975:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2050:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2400:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1968:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1582:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2068:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2942:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2276:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2822:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1857:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2478:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1987:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1775:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1908:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1872:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2314:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2238:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1648:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1779:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1756:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1667:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2554:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1704:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2188:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2038:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1455:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.1739:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2093:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2666:  97%|█████████▋| 390/401 [04:43<00:05,  2.05it/s]training loss: 0.2666:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2208:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1838:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2313:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2062:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1968:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2018:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1983:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2435:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2690:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1605:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1805:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2081:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2064:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2355:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1886:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1743:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2092:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2319:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1798:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2449:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2246:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1993:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2248:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2355:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2031:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2272:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2374:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1579:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2438:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1785:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2246:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2079:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2290:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2068:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2978:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1938:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2417:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2048:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1627:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2380:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2229:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1695:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2828:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2193:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2774:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2118:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2217:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2707:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2416:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2489:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1747:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2357:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1685:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2304:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2579:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2477:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1836:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2177:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2314:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2227:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2274:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2322:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2286:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2021:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2091:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2297:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2225:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2014:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2103:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2104:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1711:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1854:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2040:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1743:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2450:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1906:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1804:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.2275:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1365:  98%|█████████▊| 391/401 [04:46<00:12,  1.21s/it]training loss: 0.1365:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2510:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2048:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2340:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2488:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2265:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2744:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1633:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2785:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1769:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2035:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1718:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1694:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2344:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2309:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1608:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2937:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1694:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1670:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1947:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1963:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2036:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2322:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1777:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2479:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2179:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2409:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2398:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1989:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2051:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2639:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1857:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2260:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2077:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1857:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2220:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2004:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2614:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1945:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1969:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2640:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1822:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2118:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2037:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2549:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.1788:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2731:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2583:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2177:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2436:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2142:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2853:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2447:  98%|█████████▊| 392/401 [04:46<00:08,  1.04it/s]training loss: 0.2226:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2270:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2253:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1955:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1907:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2012:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2025:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2288:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1866:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2601:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2214:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1827:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1999:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2398:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1986:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2508:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1812:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2359:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2444:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1891:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1753:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1637:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2438:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.2565:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1627:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.1646:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.0931:  98%|█████████▊| 392/401 [04:47<00:08,  1.04it/s]training loss: 0.0931:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2335:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1558:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1820:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2041:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2104:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2322:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2486:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2183:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2544:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2242:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2141:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1561:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1969:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1872:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2724:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1930:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1910:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2033:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2371:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1774:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2435:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1946:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2194:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1946:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1963:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1714:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2345:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2359:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1546:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2001:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2306:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1900:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1751:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2022:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1977:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2902:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2226:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2192:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2776:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2150:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2114:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1911:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2013:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2016:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2204:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2187:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2369:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2594:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2037:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2729:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1985:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2294:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1931:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1539:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2243:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2658:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1964:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2294:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1502:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2548:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1998:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2285:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2018:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2805:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1881:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1696:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2172:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1767:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1721:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2311:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1972:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2223:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1979:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1977:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1455:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.3338:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1944:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.2434:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1118:  98%|█████████▊| 393/401 [04:47<00:06,  1.30it/s]training loss: 0.1118:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2785:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2335:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2485:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1920:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2276:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1900:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2076:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2807:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2026:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2284:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.3118:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2098:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1877:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2139:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1922:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2300:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2138:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2348:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2236:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2531:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2773:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1744:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2640:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2106:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1761:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2370:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1974:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2000:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1807:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2516:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2395:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2234:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2018:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2434:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2201:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1585:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2293:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2218:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2192:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1798:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1627:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1849:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2055:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2246:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2394:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1877:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2659:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2330:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2347:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1779:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1820:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1990:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1941:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2186:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2076:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2189:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1588:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2520:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2013:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2047:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2140:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2268:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2169:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2454:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.1838:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2054:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2172:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2551:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2836:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2682:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2395:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2248:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.3487:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2081:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2069:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2107:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2093:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.2140:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.4933:  98%|█████████▊| 394/401 [04:47<00:04,  1.55it/s]training loss: 0.4933:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1812:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1693:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2180:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1968:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2182:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2191:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2682:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1655:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1990:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2578:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1831:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1724:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1658:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2203:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1612:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2035:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1412:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1910:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1828:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2490:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2449:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2547:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2132:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2962:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2461:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2683:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2012:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2245:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2195:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2135:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2261:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2470:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1804:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1914:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2657:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2545:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2411:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2163:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2093:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2349:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1644:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1855:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2367:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1805:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.2437:  99%|█████████▊| 395/401 [04:47<00:03,  1.81it/s]training loss: 0.1476:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2032:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2266:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1883:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2509:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2828:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2430:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1919:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2050:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1997:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2248:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2449:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1936:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2178:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2258:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2426:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1708:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2443:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1657:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1887:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2579:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2359:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1982:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2203:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2280:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1731:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2213:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1961:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2009:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2234:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2576:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.2021:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1924:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1015:  99%|█████████▊| 395/401 [04:48<00:03,  1.81it/s]training loss: 0.1015:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1612:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2396:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1772:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2115:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1878:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2517:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2215:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2836:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2562:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1425:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1795:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1668:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2342:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2389:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1611:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2011:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2366:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2006:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2645:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1589:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1595:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1901:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2391:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2211:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1802:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2347:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2061:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2158:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2450:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2290:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1927:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2025:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2040:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1933:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2156:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2280:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1564:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1758:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1942:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2511:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.3107:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1734:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1833:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2258:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2301:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1973:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2084:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2161:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2147:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2720:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2389:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2534:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.3075:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1696:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2214:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1653:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1965:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1506:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2482:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1792:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2351:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1377:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1768:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2036:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1930:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1896:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1856:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1542:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2443:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2000:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1893:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2209:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1906:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2330:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.2076:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1909:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.3067:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1652:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1466:  99%|█████████▉| 396/401 [04:48<00:02,  2.03it/s]training loss: 0.1466:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1540:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1992:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2148:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2164:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2187:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1722:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2128:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2410:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2548:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2306:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1386:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2832:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1793:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2311:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2393:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1916:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2301:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2211:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1899:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2650:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2063:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1683:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2170:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1877:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2295:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1973:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2270:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2406:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1789:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2375:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1768:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2153:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1924:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2589:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2137:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1885:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1993:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2522:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2451:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1958:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2377:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2174:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1952:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2097:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1848:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2274:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1714:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1735:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1868:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2054:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1672:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1914:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2137:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2723:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2204:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2415:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1765:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2288:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2047:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1922:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2374:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2166:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2146:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2837:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1966:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2186:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2521:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1938:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2168:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2143:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2155:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2091:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1727:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1878:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2256:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1841:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.1672:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.2200:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.3397:  99%|█████████▉| 397/401 [04:48<00:01,  2.06it/s]training loss: 0.3397:  99%|█████████▉| 398/401 [04:48<00:01,  2.22it/s]training loss: 0.1487:  99%|█████████▉| 398/401 [04:48<00:01,  2.22it/s]training loss: 0.2361:  99%|█████████▉| 398/401 [04:48<00:01,  2.22it/s]training loss: 0.2054:  99%|█████████▉| 398/401 [04:48<00:01,  2.22it/s]training loss: 0.1989:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2287:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2284:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1731:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2315:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2049:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2083:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1959:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1836:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2061:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2223:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2173:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2544:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2165:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1974:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2470:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2414:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1934:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2186:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2243:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1468:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2237:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2508:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2128:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2017:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1849:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1689:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2422:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2026:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2277:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1979:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1779:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2086:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2501:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2356:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.3045:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2123:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1476:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2272:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1691:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2300:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2141:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2235:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2001:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2373:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2916:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2053:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2741:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1856:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1714:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1914:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2358:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2140:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1671:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2431:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2046:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2201:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2527:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2384:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1837:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1707:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1832:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1490:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2078:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2418:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2040:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1939:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2505:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1925:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1906:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2220:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2284:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2658:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1871:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.2279:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1124:  99%|█████████▉| 398/401 [04:49<00:01,  2.22it/s]training loss: 0.1124: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2326: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1651: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1949: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1639: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2059: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2373: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1917: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1631: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1950: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2068: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2241: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2687: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2516: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2098: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1963: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2571: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2322: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1617: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1896: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2009: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2063: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2216: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2070: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2115: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2122: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2372: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2851: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2238: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1857: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1731: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.3375: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1894: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2121: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2054: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2428: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1960: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1988: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2170: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2134: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2153: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1513: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2170: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1914: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1689: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2387: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2016: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1929: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2013: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1975: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1965: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1832: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1820: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2147: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2169: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1754: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1797: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1765: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2084: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2136: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2215: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2561: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1811: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2094: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2358: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1665: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2243: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1858: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2052: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1766: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1660: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2144: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2205: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2185: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2219: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1931: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.2608: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1775: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1744: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1634: 100%|█████████▉| 399/401 [04:49<00:00,  2.38it/s]training loss: 0.1634: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1881: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2320: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2583: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2526: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1786: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2483: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2128: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1841: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2804: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1729: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1977: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2064: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1680: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1855: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2471: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2537: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1744: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2649: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1646: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2390: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1983: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2015: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1962: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2663: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1757: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2093: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2121: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1836: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2821: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1990: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2228: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2358: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1698: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2363: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.3665: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1682: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2665: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2232: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2063: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2295: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2132: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2114: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2084: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1917: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2344: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2456: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.3044: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2575: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2623: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2391: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2209: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2408: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2615: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1798: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1531: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2119: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1986: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2233: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2007: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.3145: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2444: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2632: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1955: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2428: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2190: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2077: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2272: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2573: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2230: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2491: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.1906: 100%|█████████▉| 400/401 [04:49<00:00,  2.53it/s]training loss: 0.2143: 100%|█████████▉| 400/401 [04:50<00:00,  2.53it/s]training loss: 0.2257: 100%|█████████▉| 400/401 [04:50<00:00,  2.53it/s]training loss: 0.1993: 100%|█████████▉| 400/401 [04:50<00:00,  2.53it/s]training loss: 0.2151: 100%|█████████▉| 400/401 [04:50<00:00,  2.53it/s]training loss: 0.1991: 100%|█████████▉| 400/401 [04:50<00:00,  2.53it/s]training loss: 0.1735: 100%|█████████▉| 400/401 [04:50<00:00,  2.53it/s]training loss: 0.2299: 100%|█████████▉| 400/401 [04:50<00:00,  2.53it/s]training loss: 0.2009: 100%|█████████▉| 400/401 [04:50<00:00,  2.53it/s]training loss: 0.2009: 100%|██████████| 401/401 [04:52<00:00,  1.12s/it]training loss: 0.2009: 100%|██████████| 401/401 [04:52<00:00,  1.37it/s]
diff --git a/slurm/logs/pidm_toy_9912868.out b/slurm/logs/pidm_toy_9912868.out
deleted file mode 100644
index a509d5a..0000000
--- a/slurm/logs/pidm_toy_9912868.out
+++ /dev/null
@@ -1,21 +0,0 @@
-Thu May 14 15:47:07 2026       
-+-----------------------------------------------------------------------------------------+
-| NVIDIA-SMI 580.126.20             Driver Version: 580.126.20     CUDA Version: 13.0     |
-+-----------------------------------------+------------------------+----------------------+
-| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
-| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
-|                                         |                        |               MIG M. |
-|=========================================+========================+======================|
-|   0  NVIDIA A100 80GB PCIe          On  |   00000000:AE:00.0 Off |                    0 |
-| N/A   38C    P0             44W /  300W |       0MiB /  81920MiB |      0%      Default |
-|                                         |                        |             Disabled |
-+-----------------------------------------+------------------------+----------------------+
-
-+-----------------------------------------------------------------------------------------+
-| Processes:                                                                              |
-|  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
-|        ID   ID                                                               Usage      |
-|=========================================================================================|
-|  No running processes found                                                             |
-+-----------------------------------------------------------------------------------------+
-checkpoint saved to ./trained_models/toy/toy_9912868/model

From 70fc0b71ff6e39e5fbed6780eda54649eef1d178 Mon Sep 17 00:00:00 2001
From: dimanaStoyanova7 <stoyanovadimana557@gmail.com>
Date: Fri, 22 May 2026 12:25:26 +0200
Subject: [PATCH 04/12] fixed 1h to 24h wall time for darcy diffusion

---
 .DS_Store                   | Bin 0 -> 6148 bytes
 slurm/darcy_diffusion.slurm |   2 +-
 2 files changed, 1 insertion(+), 1 deletion(-)
 create mode 100644 .DS_Store

diff --git a/.DS_Store b/.DS_Store
new file mode 100644
index 0000000000000000000000000000000000000000..c61ff468cafbdb6afb5b98e7e71ae66be871b9b8
GIT binary patch
literal 6148
zcmeHK%}T>S5Z<+|O({YS3gT(OYr&@4L-7)7eE}nSP^k$i8cee#N$sH&@&NimK8Vlb
z%<cwS3?4=74D5ch^Rt`zAp64@<HLFAFlIBxENF-vl?p*~rEA9oBXTvzG+1P_AeKSJ
zG=I~C-`-#ui`kr|Z2kK`f>|78dAIw?cWU*<ZqsU7ZR^2%mJ2WU^LaM((>okpOBn~H
z?gux~WHGk)FJzMYQ8GzYLKIFQ<o-5FLb({qc@kzS*V7KGWwplk(Q?@z3_8N;ot~{a
zV(E09UPlai{ne^v9UPyWUyWblX(Hb=l^i%%vS+Y_cTm=9diByImdO)X%ZxITkQg8a
zhyh|?8yPUCfz{r|;;Ck0fEf6Z0o)%1G(^{6p;2ue(BbtN{dGhX(D5ySC=9v=3yt6b
z;W`yir*iYe;5r@b!o;}-3ynIRakVncV^%I7FI=q-cA>%<cQsN^3=jjG4Ak_{#`FIY
zewoTg{$>h|hyh~YpE1DeBX2Z>qRiR)tvozy1++(KC>U3u0s{KRB>)Dvj~pte_6yV@
Z&NWzQ#97d;(gEorpa`Lk82AMSz5ox?ONamf

literal 0
HcmV?d00001

diff --git a/slurm/darcy_diffusion.slurm b/slurm/darcy_diffusion.slurm
index 6025ca7..70804cf 100644
--- a/slurm/darcy_diffusion.slurm
+++ b/slurm/darcy_diffusion.slurm
@@ -5,7 +5,7 @@
 #SBATCH --cpus-per-task=4
 #SBATCH --gpus-per-task=1
 #SBATCH --mem-per-cpu=7500M
-#SBATCH --time=1:00:00
+#SBATCH --time=24:00:00
 #SBATCH --output=slurm/logs/%x_%j.out
 #SBATCH --error=slurm/logs/%x_%j.err
 

From 6ea0686f6caac3b9cd1c79fc3b8d3b68fa5f4775 Mon Sep 17 00:00:00 2001
From: dimanaStoyanova7 <stoyanovadimana557@gmail.com>
Date: Tue, 26 May 2026 23:55:21 +0200
Subject: [PATCH 05/12] added file to geenrate fig.4

---
 plot_fig4_topology.py | 461 ++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 461 insertions(+)
 create mode 100644 plot_fig4_topology.py

diff --git a/plot_fig4_topology.py b/plot_fig4_topology.py
new file mode 100644
index 0000000..73cb4df
--- /dev/null
+++ b/plot_fig4_topology.py
@@ -0,0 +1,461 @@
+"""
+Topology optimization visualization matching paper Fig 4 style.
+
+Loads saved sample data from results/reproduced/topology/<model>/test_level_2/,
+binarizes the density field at rho=0.5, and plots panels with paper-matching
+colormaps, axis labels, and metric annotations.
+
+Comparison layout (5 cols × n_rows):
+  PIDM ρ | PIDM Residual | SIMP ρ | Diffusion ρ | Diffusion Residual
+
+Note on residuals: residuals.csv stores one scalar R_MAE per sample row.
+The spatial residual panel recomputes R = KU − F on-the-fly using the same
+StiffnessMatrix assembly as the training code (src/residuals_mechanics_K.py).
+The scalar R_MAE from residuals.csv is shown as a subtitle on each residual panel.
+
+Usage:
+    conda run -n pidm python plot_fig4_topology.py
+    conda run -n pidm python plot_fig4_topology.py --compare --output fig4_comparison.pdf
+    conda run -n pidm python plot_fig4_topology.py --results-dir results/reproduced/topology/PIDM/test_level_2 --n-samples 4 --output fig4_PIDM.pdf
+"""
+
+import argparse
+import os
+import sys
+import numpy as np
+import matplotlib
+matplotlib.use('Agg')
+import matplotlib.pyplot as plt
+from matplotlib.colors import LogNorm, Normalize, LinearSegmentedColormap
+from matplotlib.cm import ScalarMappable
+
+# ── channel layout from sample.py ──────────────────────────────────────────
+# output channels (sample_N.csv):  0=u_x, 1=u_y, 2=rho
+# cond channels (cond_channel_N.csv):
+#   0=vf_arr, 1=strain_energy_fem, 2=von_mises_fem
+#   3=disp_x_fem, 4=disp_y_fem, 5=E_field (ref design)
+#   6=BC_node_x, 7=BC_node_y, 8=load_x, 9=load_y
+
+BINARIZE_THRESHOLD = 0.5
+
+# Path to SolidsPy mesh files (no BCs — BCs are applied at runtime from cond channels)
+_PROJECT_ROOT = os.path.dirname(os.path.abspath(__file__))
+_NO_BC_FOLDER = os.path.join(_PROJECT_ROOT, 'data', 'mechanics', 'solidspy_k_no_BC') + os.sep
+
+# Lazily initialised; shared across all samples in one run
+_STIFFNESS = None
+
+
+def _get_stiffness():
+    """Return a cached StiffnessMatrix built from the SolidsPy mesh files."""
+    global _STIFFNESS
+    if _STIFFNESS is None:
+        if _PROJECT_ROOT not in sys.path:
+            sys.path.insert(0, _PROJECT_ROOT)
+        import torch
+        from src.residuals_mechanics_K import StiffnessMatrix
+        _STIFFNESS = StiffnessMatrix(no_BC_folder=_NO_BC_FOLDER, device='cpu')
+    return _STIFFNESS
+
+# Paper Fig 4 colormaps
+# Density: black (void, ρ=0) → cream/wheat (solid, ρ=1)
+DENSITY_CMAP = LinearSegmentedColormap.from_list(
+    'density_warm', ['#000000', '#C8A850', '#F5DEB3'], N=256
+)
+# Residual: dark purple (low) → yellow (high), log scale
+RESIDUAL_CMAP = 'viridis'
+
+ROW_LABELS = list('abcdefghijklmnop')
+
+
+def load_sample(sample_dir: str):
+    def csv(name):
+        return np.loadtxt(os.path.join(sample_dir, name), delimiter=',')
+    vf_raw = csv('cond_channel_0.csv')
+    return {
+        'u_x':     csv('sample_0.csv'),
+        'u_y':     csv('sample_1.csv'),
+        'rho':     csv('sample_2.csv'),
+        'vf':      float(np.atleast_1d(vf_raw).flat[0]),
+        'sed_fem': csv('cond_channel_1.csv'),
+        'vm_fem':  csv('cond_channel_2.csv'),
+        'ux_fem':  csv('cond_channel_3.csv'),
+        'uy_fem':  csv('cond_channel_4.csv'),
+        'E_field': csv('cond_channel_5.csv'),
+        'bc_x':    csv('cond_channel_6.csv'),
+        'bc_y':    csv('cond_channel_7.csv'),
+        'load_x':  csv('cond_channel_8.csv'),
+        'load_y':  csv('cond_channel_9.csv'),
+    }
+
+
+def load_metrics(results_dir: str, n_samples: int):
+    def col(fname):
+        path = os.path.join(results_dir, fname)
+        return np.loadtxt(path, delimiter=',')[:n_samples]
+    return {
+        'residual': col('residuals.csv'),
+        'ce':       col('rel_CE_error.csv'),
+        'vf':       col('rel_vf_error.csv'),
+        'fm':       col('fm_error.csv'),
+    }
+
+
+def binarize(rho, threshold=BINARIZE_THRESHOLD):
+    return (rho > threshold).astype(float)
+
+
+def mechanics_residual_map(s):
+    """
+    True mechanical residual R = KU - F per element, returned as a 64×64 map.
+
+    Follows the same assembly as src/residuals_mechanics_K.py:
+      - K is assembled element-by-element scaled by density rho (SIMP)
+      - BCs enforced via row-identity replacement (same as compute_residual)
+      - R = K·u − F in global DOF space [65×65×2 = 8450 DOFs]
+      - Node-wise residual magnitude averaged over 4 element corners → [64, 64]
+    """
+    import torch
+    import einops as ein
+    from einops import rearrange
+
+    stiffs = _get_stiffness()
+
+    # rho is saved as 65×65 with a zero-padded last row/col; strip it to get 64×64 elements
+    rho_64   = np.array(s['rho'][:-1, :-1], dtype=np.float32)
+    rho_t    = torch.tensor(rho_64).unsqueeze(0)          # [1, 64, 64]
+    rho_flat = rho_t.reshape(1, -1)                       # [1, 4096]
+
+    # Displacements: saved as 65×65 bilinear-upscaled FEM node values
+    u_x = torch.tensor(np.array(s['u_x'], dtype=np.float32)).unsqueeze(0)   # [1, 65, 65]
+    u_y = torch.tensor(np.array(s['u_y'], dtype=np.float32)).unsqueeze(0)   # [1, 65, 65]
+
+    # BC and load fields: 65×65 node-level arrays from cond_channel_{6-9}.csv
+    bc_x   = torch.tensor(np.array(s['bc_x'],   dtype=np.float32)).unsqueeze(0)
+    bc_y   = torch.tensor(np.array(s['bc_y'],   dtype=np.float32)).unsqueeze(0)
+    load_x = torch.tensor(np.array(s['load_x'], dtype=np.float32)).unsqueeze(0)
+    load_y = torch.tensor(np.array(s['load_y'], dtype=np.float32)).unsqueeze(0)
+
+    # Global DOF vectors [1, 8450]
+    u_stiff = (stiffs.image_to_stiffness_coord(u_x, 0) +
+               stiffs.image_to_stiffness_coord(u_y, 1))
+    f_stiff = (stiffs.image_to_stiffness_coord(load_x, 0) +
+               stiffs.image_to_stiffness_coord(load_y, 1))
+
+    # Assemble global stiffness K [1, 8450, 8450] — same index_put_ pattern as compute_residual
+    batch_size = 1
+    glob_idcs  = stiffs.glob_assembler_idcs.unsqueeze(0).expand(batch_size, -1, -1, -1)
+    global_b_idcs = torch.arange(batch_size).repeat_interleave(stiffs.nels * stiffs.ndof ** 2)
+
+    k_glob = torch.zeros((batch_size, stiffs.neq, stiffs.neq))
+    scaled_kloc     = stiffs.tot_local_stiffness.unsqueeze(0) * rho_flat[:, :, None, None]
+    scaled_kloc_val = scaled_kloc[:, :, stiffs.indices_ext[:, 0], stiffs.indices_ext[:, 1]]
+    k_glob = k_glob.index_put_(
+        (global_b_idcs,
+         glob_idcs[:, :, :, 0].flatten(),
+         glob_idcs[:, :, :, 1].flatten()),
+        scaled_kloc_val.flatten(), accumulate=True)
+
+    # Apply BCs: zero out BC rows in K, replace diagonal with 1, zero BC entries in F
+    bc_stiff = (stiffs.image_to_stiffness_coord(bc_x, 0) +
+                stiffs.image_to_stiffness_coord(bc_y, 1))
+    bc_mask  = bc_stiff != 0                              # [1, 8450]
+    mask_ext = bc_mask.unsqueeze(-1).expand_as(k_glob)
+    k_glob[mask_ext] = 0
+    k_glob += torch.eye(stiffs.neq).expand(batch_size, -1, -1) * mask_ext
+    f_stiff[bc_mask] = 0
+
+    # R = K·u − F  →  [1, 8450]
+    residual = ein.einsum(k_glob, u_stiff, 'b i j, b j -> b i') - f_stiff
+
+    # Reshape [8450] → [65, 65, 2], compute per-node magnitude [65, 65]
+    r = rearrange(residual[0].detach(), '(x y d) -> x y d', x=65, y=65, d=2).numpy()
+    r_mag = np.sqrt(r[:, :, 0] ** 2 + r[:, :, 1] ** 2)
+
+    # Average 4 corner nodes per element → [64, 64]
+    r_elem = (r_mag[:-1, :-1] + r_mag[:-1, 1:] +
+              r_mag[1:, :-1]  + r_mag[1:, 1:]) / 4.0
+    return r_elem
+
+
+def simp_compliance(s):
+    """Compliance from FEM strain energy: C = 2 * sum(SE_element)."""
+    return 2.0 * s['sed_fem'].sum()
+
+
+def _style_ax(ax):
+    """Hide tick marks/numbers; show ξ₁ and ξ₂ axis labels."""
+    ax.set_xticks([])
+    ax.set_yticks([])
+    ax.set_xlabel('ξ₁', fontsize=7, labelpad=1)
+    ax.set_ylabel('ξ₂', fontsize=7, labelpad=1, rotation=0, va='center')
+    for spine in ax.spines.values():
+        spine.set_linewidth(0.4)
+        spine.set_visible(True)
+
+
+def _design_ax(ax, field, title=''):
+    """Plot a density field with the warm black→cream colormap."""
+    ax.imshow(field, cmap=DENSITY_CMAP, vmin=0, vmax=1,
+              origin='upper', aspect='equal')
+    if title:
+        ax.set_title(title, fontsize=7, pad=3)
+    _style_ax(ax)
+
+
+def _residual_ax(ax, residual_map, norm=None):
+    """Plot displacement residual with viridis log-scale colormap."""
+    eps = 1e-9
+    r_pos = residual_map[residual_map > 0]
+    vmin = r_pos.min() if r_pos.size > 0 else eps
+    vmax = np.percentile(residual_map, 98) if residual_map.max() > 0 else eps * 10
+    if norm is None:
+        norm = LogNorm(vmin=max(vmin, eps), vmax=max(vmax, vmin * 10))
+    im = ax.imshow(np.clip(residual_map, norm.vmin, None),
+                   cmap=RESIDUAL_CMAP, norm=norm,
+                   origin='upper', aspect='equal')
+    _style_ax(ax)
+    return im, norm
+
+
+def plot_loadcase(ax, s):
+    """Reference design silhouette with BC hatching and load arrows."""
+    ref = (s['E_field'] > 0.5).astype(float)
+    ax.imshow(ref, cmap='Greys', vmin=0, vmax=1, origin='upper', aspect='equal')
+
+    bc_mask = (s['bc_x'] > 0) | (s['bc_y'] > 0)
+    rows, cols = np.where(bc_mask)
+    if len(cols):
+        ax.fill_betweenx(np.arange(ref.shape[0]),
+                         cols.min() - 0.5, cols.min() + 0.5,
+                         color='steelblue', alpha=0.35, linewidth=0)
+        ax.axvline(cols.min() + 0.5, color='steelblue', linewidth=1.5)
+
+    load_pts = np.argwhere((np.abs(s['load_x']) + np.abs(s['load_y'])) > 0)
+    scale = ref.shape[0] * 0.15
+    for (r, c) in load_pts:
+        dx = s['load_x'][r, c]
+        dy = s['load_y'][r, c]
+        mag = np.sqrt(dx**2 + dy**2)
+        if mag > 0:
+            ax.annotate('', xy=(c + dx / mag * scale, r - dy / mag * scale),
+                        xytext=(c, r),
+                        arrowprops=dict(arrowstyle='->', color='crimson',
+                                        lw=2.5, mutation_scale=18))
+    _style_ax(ax)
+
+
+def make_figure(results_dir, n_samples=4, title='PIDM'):
+    """Single-model figure: Load case | SIMP ρ | Generated ρ | Residual."""
+    sample_dirs = [os.path.join(results_dir, f'sample_{i}') for i in range(n_samples)]
+    samples = [load_sample(d) for d in sample_dirs]
+    metrics = load_metrics(results_dir, n_samples)
+
+    res_maps = [mechanics_residual_map(s) for s in samples]
+    all_vals = np.concatenate([r.ravel() for r in res_maps])
+    eps = 1e-9
+    shared_norm = LogNorm(
+        vmin=max(all_vals[all_vals > 0].min() if (all_vals > 0).any() else eps, eps),
+        vmax=max(np.percentile(all_vals, 98), eps * 10),
+    )
+
+    ncols, nrows = 4, n_samples
+    fig, axes = plt.subplots(nrows, ncols,
+                             figsize=(ncols * 2.3, nrows * 2.1),
+                             gridspec_kw={'wspace': 0.08, 'hspace': 0.45})
+    if nrows == 1:
+        axes = axes[np.newaxis, :]
+
+    col_titles = ['Load case', 'SIMP design ρ', f'Generated ρ', 'Residual']
+    for j, ct in enumerate(col_titles):
+        axes[0, j].set_title(ct, fontsize=8.5, fontweight='bold', pad=5)
+
+    for i, (s, res_map) in enumerate(zip(samples, res_maps)):
+        rho_bin = binarize(s['rho'])
+        ref_bin = (s['E_field'] > 0.5).astype(float)
+        rho_bar = rho_bin.mean()
+        ce_pct  = metrics['ce'][i] * 100
+        C       = simp_compliance(s)
+        V_max   = s['vf']
+
+        # row label
+        ax0 = axes[i, 0]
+        ax0.annotate(f'({ROW_LABELS[i]})', xy=(-0.18, 0.5),
+                     xycoords='axes fraction', fontsize=10,
+                     fontweight='bold', va='center', ha='right')
+
+        plot_loadcase(ax0, s)
+
+        _design_ax(axes[i, 1], ref_bin,
+                   title=f'C = {C:.2f}, V$_{{max}}$ = {V_max:.2f}')
+
+        _design_ax(axes[i, 2], rho_bin,
+                   title=f'CE = {ce_pct:+.2f}%, ρ̄ = {rho_bar:.2f}')
+
+        im, _ = _residual_ax(axes[i, 3], res_map, norm=shared_norm)
+
+    # residual colorbar
+    cb_ax = fig.add_axes([0.92, 0.12, 0.015, 0.25])
+    cb = fig.colorbar(ScalarMappable(cmap=RESIDUAL_CMAP, norm=shared_norm), cax=cb_ax)
+    cb.set_label('|KU − F| per element (log)', fontsize=6, labelpad=4)
+    cb.ax.tick_params(labelsize=6)
+
+    fig.suptitle(title, fontsize=11, fontweight='bold', y=1.01)
+    return fig
+
+
+def make_comparison_figure(pidm_dir, diff_dir, n_samples=4):
+    """
+    Fig 4-style comparison: PIDM vs Diffusion, 5 columns per row.
+
+    Layout: PIDM ρ | PIDM Residual | SIMP ρ | Diffusion ρ | Diffusion Residual
+    """
+    samples_p = [load_sample(os.path.join(pidm_dir,  f'sample_{i}')) for i in range(n_samples)]
+    samples_d = [load_sample(os.path.join(diff_dir,  f'sample_{i}')) for i in range(n_samples)]
+    metrics_p = load_metrics(pidm_dir,  n_samples)
+    metrics_d = load_metrics(diff_dir, n_samples)
+
+    # shared log norm for both residual columns
+    all_res_maps = [mechanics_residual_map(s) for s in samples_p + samples_d]
+    all_vals = np.concatenate([r.ravel() for r in all_res_maps])
+    eps = 1e-9
+    pos = all_vals[all_vals > 0]
+    shared_norm = LogNorm(
+        vmin=max(pos.min() if pos.size > 0 else eps, eps),
+        vmax=max(np.percentile(all_vals, 98), eps * 10),
+    )
+    res_maps_p = all_res_maps[:n_samples]
+    res_maps_d = all_res_maps[n_samples:]
+
+    ncols, nrows = 5, n_samples
+    fig, axes = plt.subplots(
+        nrows, ncols,
+        figsize=(ncols * 2.2, nrows * 2.1),
+        gridspec_kw={'wspace': 0.08, 'hspace': 0.50},
+    )
+    if nrows == 1:
+        axes = axes[np.newaxis, :]
+
+    col_titles = [
+        'Design ρ',
+        'Residual R_MAE(ρ, u1, u2)',
+        'SIMP Design ρ',
+        'Design ρ',
+        'Residual R_MAE(ρ, u1, u2)',
+    ]
+
+    for i in range(n_samples):
+        sp, sd = samples_p[i], samples_d[i]
+        res_p, res_d = res_maps_p[i], res_maps_d[i]
+
+        rho_p    = binarize(sp['rho'])
+        rho_d    = binarize(sd['rho'])
+        ref_bin  = (sp['E_field'] > 0.5).astype(float)  # same ref for both
+
+        rho_bar_p = rho_p.mean()
+        rho_bar_d = rho_d.mean()
+        ce_p      = metrics_p['ce'][i] * 100
+        ce_d      = metrics_d['ce'][i] * 100
+        C         = simp_compliance(sp)
+        V_max     = sp['vf']
+
+        # (a), (b), (c), (d) row label on the left of col 0
+        axes[i, 0].annotate(
+            f'({ROW_LABELS[i]})', xy=(-0.20, 0.5),
+            xycoords='axes fraction', fontsize=10,
+            fontweight='bold', va='center', ha='right',
+        )
+
+        # col 0 — PIDM generated design
+        _design_ax(axes[i, 0], rho_p,
+                   title=f'CE = {ce_p:+.2f}%, ρ̄ = {rho_bar_p:.2f}')
+
+        # col 1 — PIDM spatial residual |KU-F| per element; scalar R_MAE as subtitle
+        _residual_ax(axes[i, 1], res_p, norm=shared_norm)
+        axes[i, 1].set_title(f'R_MAE = {metrics_p["residual"][i]:.4f}', fontsize=6, pad=2)
+
+        # col 2 — SIMP reference design
+        _design_ax(axes[i, 2], ref_bin,
+                   title=f'C = {C:.2f}, V$_{{max}}$ = {V_max:.2f}')
+
+        # col 3 — Diffusion generated design
+        _design_ax(axes[i, 3], rho_d,
+                   title=f'CE = {ce_d:+.2f}%, ρ̄ = {rho_bar_d:.2f}')
+
+        # col 4 — Diffusion spatial residual |KU-F| per element; scalar R_MAE as subtitle
+        _residual_ax(axes[i, 4], res_d, norm=shared_norm)
+        axes[i, 4].set_title(f'R_MAE = {metrics_d["residual"][i]:.4f}', fontsize=6, pad=2)
+
+    # Bold column headers set after the loop so they are not overwritten by per-sample subtitles
+    for j, ct in enumerate(col_titles):
+        axes[0, j].set_title(ct, fontsize=8, fontweight='bold', pad=5)
+
+    # density colorbar (right of SIMP / design columns)
+    cb_den_ax = fig.add_axes([0.93, 0.55, 0.012, 0.30])
+    sm_den = ScalarMappable(cmap=DENSITY_CMAP, norm=Normalize(vmin=0, vmax=1))
+    sm_den.set_array([])
+    cb_den = fig.colorbar(sm_den, cax=cb_den_ax)
+    cb_den.set_label('ρ', fontsize=7, labelpad=4)
+    cb_den.ax.tick_params(labelsize=6)
+
+    # residual colorbar (right of residual columns)
+    cb_res_ax = fig.add_axes([0.93, 0.12, 0.012, 0.30])
+    sm_res = ScalarMappable(cmap=RESIDUAL_CMAP, norm=shared_norm)
+    sm_res.set_array([])
+    cb_res = fig.colorbar(sm_res, cax=cb_res_ax)
+    cb_res.set_label('|KU − F| per element (log)', fontsize=7, labelpad=4)
+    cb_res.ax.tick_params(labelsize=6)
+
+    fig.suptitle('Topology optimization — PIDM vs. Diffusion (test level 2)',
+                 fontsize=10, fontweight='bold', y=1.01)
+    return fig
+
+
+def parse_args():
+    p = argparse.ArgumentParser(description='Plot Fig 4 style topology optimization results')
+    p.add_argument('--results-dir', default='results/reproduced/topology/PIDM/test_level_2',
+                   help='Path to model test_level_2 results directory')
+    p.add_argument('--n-samples', type=int, default=4,
+                   help='Number of samples to plot (default 4 for (a)-(d) rows)')
+    p.add_argument('--output', default='fig4_topology.pdf',
+                   help='Output file (pdf or png)')
+    p.add_argument('--title', default='PIDM — Topology Optimization (test level 2)')
+    p.add_argument('--compare', action='store_true',
+                   help='Side-by-side comparison of PIDM vs standard_diffusion')
+    p.add_argument('--pidm-dir',   default='results/reproduced/topology/PIDM/test_level_2')
+    p.add_argument('--diff-dir',   default='results/reproduced/topology/standard_diffusion/test_level_2')
+    return p.parse_args()
+
+
+def main():
+    args = parse_args()
+    n = min(args.n_samples, 5)
+
+    plt.rcParams.update({
+        'font.family': 'sans-serif',
+        'axes.linewidth': 0.5,
+        'xtick.major.width': 0.5,
+        'ytick.major.width': 0.5,
+        'figure.dpi': 150,
+    })
+
+    if args.compare:
+        fig = make_comparison_figure(args.pidm_dir, args.diff_dir, n_samples=n)
+        out = args.output if args.output != 'fig4_topology.pdf' else 'fig4_topology_comparison.pdf'
+    else:
+        fig = make_figure(args.results_dir, n_samples=n, title=args.title)
+        out = args.output
+
+    fig.savefig(out, dpi=200, bbox_inches='tight')
+    print(f'Saved: {out}')
+
+    if out.endswith('.pdf'):
+        png_out = out.replace('.pdf', '.png')
+        fig.savefig(png_out, dpi=200, bbox_inches='tight')
+        print(f'Saved: {png_out}')
+
+    plt.close(fig)
+
+
+if __name__ == '__main__':
+    main()

From 2ce44771797743e43c4865a548bf23d493147ec2 Mon Sep 17 00:00:00 2001
From: dimanaStoyanova7 <stoyanovadimana557@gmail.com>
Date: Thu, 28 May 2026 09:44:05 +0200
Subject: [PATCH 06/12] added plotting file for fig. 8

---
 .DS_Store          | Bin 6148 -> 6148 bytes
 plot_fig8_darcy.py | 181 +++++++++++++++++++++++++++++++++++++++++++++
 2 files changed, 181 insertions(+)
 create mode 100644 plot_fig8_darcy.py

diff --git a/.DS_Store b/.DS_Store
index c61ff468cafbdb6afb5b98e7e71ae66be871b9b8..4ab740ae8abbbcebb3fcd9dbd6a2f28f1528bacc 100644
GIT binary patch
literal 6148
zcmeHK!H&}~5FNK&nsx;$5+KAWh-(FHcUPj~5=uF8AqWnDx=mBM5ouhSgdVC&;ST@6
zCm<mq!3V$}aNvNJKVimpQQUMTPV5SKB>Op@8PDXo@zemoda2(AXaInPjj&S3Zi|qf
zT0u%`<_aPcYoy@AIGnWI5ieMq3B!P4;H)t~-)<Fd!U#ebLhk#W&Sa|WLD6E$`+YCu
z9%}Gl$S%J6@$K$5EB`O7W=C{dtfSF61QpC@0s$oQBvHD~*9&>wMh=I2$0CP6zEiG6
zFX*+nw?9zaDzd;Kf)^Nj0<jhy>eq`F8#(;sYaX<9HZnQEO3Me{Q$9No<F2GIhpD%S
zXNvJJ-Yg8_q}BS)O6AJVxvEvQcCF{`5ns5;FiGRyaQ>8@9&sLe>+#Tg9E=x(#-)2a
zN`^r+o(qS-AEU{$Cqd-%MUSVE9}8bsDy*7S8#Jyhmj~T$({6Y6_E$}N*>1HvO}pDU
zSgmT-<r}x|JRH0XrxAZkNn<I%S|H@S!Zp0ZLGGP2em{LA@0?cW7V2t$HH-WXZ?n)i
z{VaaaIse!0JPLU<!MK!h8QGr0NXx491{G_Ko>BHIlDn<^Hg<VKt7TF;rd3a0)IM3e
zr=N<+z%XDKIAaXZ`CwxsbQES1#nFMCxB?(na9RkCMGZ%^X#&wvm`TJL6ee8}r7Kfc
z3?|)i-d1*w!c3xc2PPupIw~?#HxwqK<Gd}*fjJUQZx}EP=nRzQV}t7d{gdzix|4Y_
z3>XIfD+XAl@AiB6N~*RNUXE(5jqMN{3E5>5g$s779E$;!;;Yz%pw6ZNqN6aAh%+eW
OkAR@TbcTU{%D``nn%PSL

delta 98
zcmZoMXfc=|#>B`mu~2NHo}w@l0|Nsi1A_nqLvB)eaY0f}e$vFkm6HubSSBxLy+4_a
uoqw|khcL^=hVP7<**W+*fI2q|a(ri=%r9aI)CATHG6Q4?%jO7?HOv65eHGyV

diff --git a/plot_fig8_darcy.py b/plot_fig8_darcy.py
new file mode 100644
index 0000000..911895f
--- /dev/null
+++ b/plot_fig8_darcy.py
@@ -0,0 +1,181 @@
+"""
+Reproduce Fig 8 style from Bastek et al. (ICLR 2025): Physics-Informed Diffusion Models.
+
+Layout: 4 rows (a-d) × 3 cols (Permeability K | Pressure p | PDE Residual |R|)
+  (a) PIDM-ME sample_0
+  (b) PIDM-ME sample_1
+  (c) PIDM-SE sample_0
+  (d) PIDM-SE sample_1
+
+File convention (from sample.py / residuals_darcy.py):
+  sample_0.csv = channel 0 = p (pressure)
+  sample_1.csv = channel 1 = K (permeability)
+
+Residual: R = -div(K * grad(p)) - f_s  where f_s is the stationary source field.
+"""
+
+import numpy as np
+import matplotlib.pyplot as plt
+import matplotlib.colors as mcolors
+from matplotlib.ticker import LogFormatterSciNotation
+import os
+
+# ---------------------------------------------------------------------------
+# Paths
+# ---------------------------------------------------------------------------
+BASE = os.path.dirname(os.path.abspath(__file__))
+RESULTS = os.path.join(BASE, "results", "reproduced", "darcy")
+
+SAMPLES = [
+    ("PIDM-ME", "sample_0", "(a)"),
+    ("PIDM-ME", "sample_1", "(b)"),
+    ("PIDM-SE", "sample_0", "(c)"),
+    ("PIDM-SE", "sample_1", "(d)"),
+]
+STEP = "step_300000"
+
+# ---------------------------------------------------------------------------
+# Darcy PDE parameters (must match main.py / residuals_darcy.py)
+# ---------------------------------------------------------------------------
+PIXELS_PER_DIM = 64
+PIXELS_AT_BOUNDARY = True   # True → grid from 0 to 1 inclusive, h = 1/(N-1)
+DOMAIN_LENGTH = 1.0
+W_SOURCE = 0.125
+R_SOURCE = 10.0
+
+
+def make_source_field(n=PIXELS_PER_DIM, domain=DOMAIN_LENGTH, w=W_SOURCE, r=R_SOURCE):
+    """Stationary source f_s on a cell-centered grid (always 1/N spacing)."""
+    pixel_size = domain / n
+    coords = np.linspace(pixel_size / 2, domain - pixel_size / 2, n)
+    X, Y = np.meshgrid(coords, coords, indexing="ij")
+    f_s = np.zeros((n, n), dtype=np.float64)
+    mask_lo = np.abs(X - 0.5 * w) <= 0.5 * w
+    mask_hi = np.abs(X - 1.0 + 0.5 * w) <= 0.5 * w
+    mask_y_lo = np.abs(Y - 0.5 * w) <= 0.5 * w
+    mask_y_hi = np.abs(Y - 1.0 + 0.5 * w) <= 0.5 * w
+    f_s[mask_lo & mask_y_lo] = r
+    f_s[mask_hi & mask_y_hi] = -r
+    return f_s
+
+
+F_S = make_source_field()
+
+
+def darcy_residual(K, p):
+    """
+    Per-pixel PDE residual R = -div(K * grad(p)) - f_s.
+
+    Uses second-order central FD (np.gradient) with spacing h = 1/(N-1)
+    for pixels_at_boundary=True (boundary-inclusive grid).
+    Returns |R| as a 2-D array of shape (N, N).
+    """
+    h = DOMAIN_LENGTH / (PIXELS_PER_DIM - 1) if PIXELS_AT_BOUNDARY else DOMAIN_LENGTH / PIXELS_PER_DIM
+
+    p_x  = np.gradient(p, h, axis=0)
+    p_y  = np.gradient(p, h, axis=1)
+    p_xx = np.gradient(p_x, h, axis=0)
+    p_yy = np.gradient(p_y, h, axis=1)
+    K_x  = np.gradient(K, h, axis=0)
+    K_y  = np.gradient(K, h, axis=1)
+
+    R = -(K * p_xx + K_x * p_x) - (K * p_yy + K_y * p_y) - F_S
+    return np.abs(R)
+
+
+def load_sample(variant, sample_dir):
+    """Return (K, p) arrays for a given variant / sample directory."""
+    base = os.path.join(RESULTS, variant, "validation", STEP, sample_dir)
+    # channel 0 → p (pressure), channel 1 → K (permeability)
+    p = np.loadtxt(os.path.join(base, "sample_0.csv"), delimiter=",")
+    K = np.loadtxt(os.path.join(base, "sample_1.csv"), delimiter=",")
+    return K, p
+
+
+# ---------------------------------------------------------------------------
+# Precompute all data and determine shared colour limits per column
+# ---------------------------------------------------------------------------
+data = []
+for variant, sample_dir, row_label in SAMPLES:
+    K, p = load_sample(variant, sample_dir)
+    R = darcy_residual(K, p)
+    data.append({"K": K, "p": p, "R": R, "label": row_label, "variant": variant})
+
+K_all = np.concatenate([d["K"].ravel() for d in data])
+p_all = np.concatenate([d["p"].ravel() for d in data])
+R_all = np.concatenate([d["R"].ravel() for d in data])
+
+K_vmin, K_vmax = K_all.min(), K_all.max()
+p_vmin, p_vmax = p_all.min(), p_all.max()
+R_vmin = max(R_all[R_all > 0].min(), 1e-6)
+R_vmax = R_all.max()
+
+# ---------------------------------------------------------------------------
+# Plot
+# ---------------------------------------------------------------------------
+COL_TITLES = ["Permeability $K$", "Pressure $p$", r"$|R(K,p)|$"]
+CMAPS = ["viridis", "inferno", "viridis"]
+NROWS, NCOLS = 4, 3
+FIG_W, FIG_H = 10, 13
+
+fig, axes = plt.subplots(NROWS, NCOLS, figsize=(FIG_W, FIG_H))
+
+for row_idx, d in enumerate(data):
+    fields = [d["K"], d["p"], d["R"]]
+    vnorms = [
+        mcolors.Normalize(vmin=K_vmin, vmax=K_vmax),
+        mcolors.Normalize(vmin=p_vmin, vmax=p_vmax),
+        mcolors.LogNorm(vmin=R_vmin, vmax=R_vmax),
+    ]
+
+    for col_idx in range(NCOLS):
+        ax = axes[row_idx, col_idx]
+        field = fields[col_idx]
+        cmap = CMAPS[col_idx]
+        norm = vnorms[col_idx]
+
+        im = ax.imshow(
+            field.T,           # transpose so x→horizontal, y→vertical
+            origin="lower",
+            cmap=cmap,
+            norm=norm,
+            aspect="equal",
+            extent=[0, 1, 0, 1],
+        )
+        ax.set_xticks([])
+        ax.set_yticks([])
+
+        cb = fig.colorbar(im, ax=ax, fraction=0.046, pad=0.04)
+        cb.ax.tick_params(labelsize=7)
+
+        if col_idx == 2:
+            cb.ax.yaxis.set_major_formatter(LogFormatterSciNotation(base=10))
+
+        # column titles on first row
+        if row_idx == 0:
+            ax.set_title(COL_TITLES[col_idx], fontsize=11)
+
+        # row labels on left
+        if col_idx == 0:
+            ax.set_ylabel(
+                f"{d['label']} {d['variant']}",
+                fontsize=10,
+                rotation=0,
+                labelpad=60,
+                va="center",
+            )
+
+plt.suptitle(
+    "Fig 8 — Darcy flow: PIDM-ME and PIDM-SE generated fields and PDE residuals",
+    fontsize=11,
+    y=1.01,
+)
+plt.tight_layout()
+
+out_pdf = os.path.join(BASE, "fig8_darcy.pdf")
+out_png = os.path.join(BASE, "fig8_darcy.png")
+plt.savefig(out_pdf, bbox_inches="tight", dpi=150)
+plt.savefig(out_png, bbox_inches="tight", dpi=150)
+print(f"Saved: {out_pdf}")
+print(f"Saved: {out_png}")
+plt.close()

From a120e0109ad184a877b9b9fddb17e8dcc31901de Mon Sep 17 00:00:00 2001
From: dimanaStoyanova7 <stoyanovadimana557@gmail.com>
Date: Thu, 28 May 2026 09:46:54 +0200
Subject: [PATCH 07/12] added images for figures 4 and 8

---
 images/fig4_topology.pdf | Bin 0 -> 93067 bytes
 images/fig8_darcy.pdf    | Bin 0 -> 121079 bytes
 plot_fig4_topology.py    |   2 +-
 3 files changed, 1 insertion(+), 1 deletion(-)
 create mode 100644 images/fig4_topology.pdf
 create mode 100644 images/fig8_darcy.pdf

diff --git a/images/fig4_topology.pdf b/images/fig4_topology.pdf
new file mode 100644
index 0000000000000000000000000000000000000000..b549b8ac8ee97a82e790c85686dc37c4ddae21a4
GIT binary patch
literal 93067
zcmb?@1z1$u_bA=nATe}E%?w@A-Hp<vASETObT>$YAe|B_At7BVDJk70rJ&S1gZjVs
z_q)7z{oZ>Y-{$N&`<%VjUVF`6J&fwovK(Me9t_6vSx{Lc1{lN*ax}Na5D@`!X?r?Z
zfw-j1T+Qqp?}ND1&F)*dfFQsFnjkST3@Zmq*n<LpdqLLG!4(9(et=6~&D_??!WG2-
z^P`N1tDKgrnX46u=jRP|GgntDX9o~3>>~!3)&nz38;AQKzF(uxjuu*0uAqAWSZP@R
z6)O){5SM~IfP&<&tJJTn0?6oZ=z#yZ02tmd?47Lu?0%xprD^5j=;mwztOtfa0AIz*
z(#A~E(F1_U4gB##z?={sFciwq1A#(8{9ry#C=?9g1z>SW0jmV2asdhc#8tw<!4dcb
zhP|hW@fT%a!@o(XY~^s@^#KU{3%sn29k6&1m#iH?5os$6M@uW%8eCkRt<3B(JTl)K
z&BWZ2OYmLS8yi62BVk*;SmO8gd586>Erw%IY=<2sVC)%V9m9<M)MW4-KQ--m{G!r6
zYhFfPED7-=9$|WV=yE4xU{{Zc@x`~psqx42KH&4!v(FaZUw5q6L-kIt%$+)JpI`az
zckl!KlitPEZ6j<ytiB%ogTr(aU6XDy-`=MO)_&iY9Zov-)^lUbdWWN@8VqYcg0VSb
zIU6;#lnTm?FPwSLC-$v9&ILQ?O>wIBuO7=^So1FDtbQ>kvkW*=lS2~q78SWHqiOLG
zKKDI2Sv+h&8njyPR@ZWGZkR+RxA?(&8bCU}`blyy7q|6os<rRo=ccZv*0Z%^;fduv
zckEXCmi*jPp4SoM4mH9<5l^>8@p=p!T@?JeLzXClDB<|OQ7XPiZTniCpVX}P+>BpI
zS;t?famXhUW2G8p{cVJsjq==^a&sff=17?Wp*x?lY4zaw3w137<=;2Qwz$uiArLp3
z#TASDJLGOYZ&(MfXzNVPE>CLpeG`gee61geKwa9f5Qu<NikyOzZo1gBWuax{QfATK
zaKQE|dH8F(i!Lbo)z?X#WRlzr+)_IS_{PPclF7AhUCnK_*WbYFnlDtF`N-}K6xwkN
zy*FdSuw)@MjmKahlXlk8d)Yngxl!Jzy@TNAIIYXyJ(v3qo`tIadp;otabs7UPO@gV
z_M^KxwtX+S3Q&{pE=|6)l__`z_nDGUAD%WLF0VA<Y|^5J*7=rFn}SYBLkxaV$69hV
z`eblvx}{yfQJ3p`{L-!@ZCjid4+VJ=F_Z!ikaQTof|Ea~OpQIyC^PCRMEHz=lZ)Uv
z$XbwxnL0w2x0&5OX(m)?duVactVbBZ@pMx_N6Z}4R7jyG%#EFD-7r{oh{LX@YzPe@
zaJM*)ESH>2hBzEPJ=nTb_Kw$sM48gVfeUqt1oZ^v;`g!QBLV7~&(!Y{N_lRg6%aEe
z@dc=V=4gMQgkF%voP>jx>l%Z#x-83*r6{?%PoQ`|QyqdV*=LT%*g-co_)(lsQ?l<F
zI%6VpQmVf?9iC+PeKcM^NSt7#dLEx-I6OLI9z)V;l6szzWOx=jBLRO>L$<mzdQieT
zD2Wm)cO?{!@v#hxC$H4hcYH;$1a;?vp!5#LxLHW<N;5hmvl>em0?CC_uQ-bgNzmPM
z36KnHkS4bjOP5HH<^yRK8Fiv^jps5fT^2!_lkV)ZGd<%ea<yisGnBfqo~OPK)g!sx
z$o&XuX_%hMCoy4d&91{YeJPsy(L4)sMy(ENwmjdlRT}PzII)nV!*2>ibXVG`{90Y`
zG>~^!_b^uv-9N*Ll0>{+VF>D8?WS?(WNe@=xT5VO2p&Z{om42x9WP0HYhQUSEMAmE
z-~%li-@tn|s<Xgts;KAGb4ERTM*a4m#wFDF-wNb&93Ji6XV7yH_ge{lYJ_N%KZh9O
zh3?R*`qB7Hi${(3`74^~{gu$Hd|tKeFPGk@D|hC^e8oh(y<EO-?%(N1Y~5|~s>w(s
zKTpQ<R{WA|yo+-rl46`i#LsB(E}`7uyIv6q9D~@}0s@)WGKSCNuN_5B1(T>dz0Aw|
z=UZ#5k^I}MPXj5mlq*CBoimB}Ipk*FQo?6fkm7kyHd0=FpWtexQa;P+@-xgR<hvs3
zM{9+T2<BB8{XTu?$Klra=##f+mzx<Gawcz^{Vq3BXy*5d1XKvLF+z!#&I-0NNWbLQ
z+Z-ft%q@R>5!L*<$jENVz}C(WLvb-m1ncrE&hRu#=Bv&s|3LO73R0rnc6g43U0#eB
zcfucbJpy^mJIxt%9mF^%oB~RNzTfr(rq8i_Uk~-{KV0bR)-_b8y2n^Kba9@&OUCb8
znNn~2k-)wnrs@QGAY-y~3`dFc!%#R+%Hat$p<x5kD_+dyl%2e6*G!btkS>F(t#$mK
z9qV(f50xopa-7vui9txA%ZiSu=x8HN$~9Su`zcjox2S0=zQ3tJ?2s^<TSvX@nIQXK
z>Hn_i!&ExRB%y8byv^jv+0+8bi^dY?$B}pG=mx@A#vH%#629v7s_NsVeJ%rsn{p01
zcha2g#Px(Wn49G~vw9w3_<TPMrJ4Ku*5_<ZH3a$O{``9GYt3?`dgA!Lj`9Uon^A;k
zM@aVqXtY9a8Q`;<(*`NH1)HdOus$?YXUIl%RRd!tp*?%VG)df2B>e2bSnrWVfR%5m
z>8kw3Bp-%4)eHlt2BUs=nki|$jT(VXK}_X|b-=4Tt*NF5q|`{a)P{(y@5rXuHiVgO
z+fcvd-ET&F{TaM(_-2Ur`##d`dsBwJk6c)8AJ>Fg#l}~xxS@MK|A?)@ROsCo+_xtp
zH~S1)EoC&9V#u9%=d)Yi4ytCP+Y=+nwy)Hw0oM9u2<SFO9dH<(_-Q`M3h?!Mq;H$y
zLp~>tE<Kb~G`Q<9bsO$eF|l`*c=7^5{7Zx|#z&?udT<gHI68VI*fa4fNHoT0)$a@y
zHQ*u%?z)wtXWF1~W>o4xKH-(cXbk8ZVyG7Ac0QzvE7e?{yk}qf5L-T8Skn|as7@rn
z3weP}De4<@fq$YiTB$;bMf;5Mgr+R3id*tsJPx@|`NpTnG5kS>+Q|qlGVTujBz6I}
z!)$Tk^hKA$w23jda4NQ6$@H7ngmmia^pQ7q&F)ayAjLCPX-ZV>7jyd{pX*m&sp$0K
zG&VT&GYO=S9bckH#J((<#bya(#XxXIeu-L%JW8w~_xQuiCncuOz7w~aliEB4M!jC7
z&?O9{N6u}$3+rNJ)Z)|a3=`!czJ=*}G#BG0Eg2^{(NsrNH25aH#>tENHK8)Q$8aE_
zwp|;O2kEgQ7qT6KT~D3N2wSj9b8FH*S>fohA}%_Fy_Lk9DvsdTQi*~Av_G7LOd~fL
zV{F1SFBh6MbX(MJQ{PO)t02XP9L(P&khDLKnzDn9UrOs@L`422bUF+v!BEo1D=2{^
zq^2flBppvtNv@cK+rJJwXv6_uF+-7Mw>j5G8m%BvnuSV0a?_ANu_r}cXf-GSjHk$F
z!ID9eYv~`9kV~NWO_?Q4G`ABch$57%S6PY$pCGsMUJyYuz9PFkOFUz)YzY#<0Y(40
zGRv?)Zs)h41T9dK4{GiTASTo-S%ldo`>OC2_hQvu5|9#ZGbV{}=B}ioGhW%VG<iz0
zQh>(HQ4m;bKuHLAlB}w<N$up4tXsKgQ33Rl96@w(2pp2E)bvU1uPqkmwi;LF-tC~a
zaA<rFcT{Ryr9Vs%J2*#e=6qL5f23BR);*S+-kaqhWICNVzVI|+=AH4<ir{2yYG_Y*
zv_7cZ;-k!5SnE43vy&q$g$@Q=$HQB(G>ffEKG-hX7ZbuehDp}oJ5vs6^L7zi&F$VR
zBBZnClzl$wR${tyPr?kc68PSi&XkusT;kOVG1~8yx}21bFz0Zy!nqj~F#Bi}FlTOU
z2gpvuJO@!qkm`6HOlf{k_u0ny=-F;yepqXQZdkzV3Ox1eNrp$kd+TqCM-s&*9{N;?
zD%B+mwalgHZZakzRJpQCqtDpN!)rCa2&pSAP_oo76wJndSv4FQ&Fh8kcrO@Nn14@O
zLh`h(TAE9uG3V3OVEr3R`2mU_Qe<CPZE6oR)yj1v=F3*<n(iC?n9Of)?jOOF&8_(o
zpiwNZEI^#pSEySI!B`$-x$WaP&purLbiF64{Rj68_4rh|>Hvt6VO~E=6!b;;e&9ET
zc-^fHFO$2^TEa9Wo66XtrArc@o^kiL(tDQODjPX@k>uJ_Kah9qtr-zi*ZVYHfgTgt
zjb7`AN5N9^^C|1)8hxKW%S+esrLeL7lQ^R}y-4)bGVy9YB($)}w+LZAkM!%7h3MX4
z76|T2#t?tUJT%*_mwm>pCn+ObiT^PcEK~8E&a~TWwOFMWU&0N0{NW}+IQ346uzgBQ
z?_<#qiSAVNRVlY3@~9^8@dY$X%I$mcJ^g!VCh?wUOb0+q5~Ku*s3v-`bJHECgR#n<
z+NM@2zVCI=`f!&wlDr5F<6)26ASe;8Lq`V^1@=gBqvmc~k=kY=$$*O-i+R{NV6n^i
zP=-4I3r}iBX_6#~Ux%^0?43=ITax!IL6f_ooVp}jnQf1oa(e`CMx_QB%J*lA;VO3y
zAg#~bCE`jeO{5n#gOQ2bNZPQJ$I0X}2WE9_lT>BP>nlx?LgZ|=1mPt1*mh5YOWsw;
z5mR8yN>zAe;p6usSq^w*`NugE@hXple6z?Df&<<j+@H%(&(CggZT=WWExh1_r%lKu
zT2z@@X?$0!W0sO1apWDwd)Es*G-aN$s*a7woiYS@zk;}Y%`Bb?FQFP$FQ@7=p^)1a
zp{pCdvaX)empfngP{v|-hQ!?Pv+7VIzuyKKb?Q5fcPi9AQY?MA;Y*}6+LQsRRw4eT
z1-FM&_@-RpGj0JbI%8k=T@eXM1zbr5BT0J=wEP14B;8c?X*5ZjR;*Qf#w7O~bzyp>
z5e2#=9Lii*PV|E1hb%eHl6_=oj2W~^%8}|d;*x#p=#1V>+R<~|)+mzU;%JQ7v`HIb
z>gF7h;j?JG7z}Y?BkF5flHu;?jP6WH@|o&OUXtUqc(TSF>h7FD3Al7ghQzrm!)S~>
zaxCBFB>SQX6z4vvyY~krd|?_B5%DKN#Zz2F$R*OjQ+$V-OZ0-QKNl;PWFJr73_q7h
z6kkz-B$p@>Uy*jETHR5HwdD!JnZHt(kbiH1c^Y@nT6nF4j`}<^Y5nscFCKdNo`_;x
zNOj`UTKKAk+Zbxvq{5@4PQJQj4J$Re;E`sZK`RXfMjxPM+CC5Xrs<HY<3NvWq^;TY
zA{pWETgO)dwUKg00R<xM2ahG){DL^yN`kn6riGovz^R@!pO>Kc!;tIIcs9d`B9+M(
zrQ0PM4m+5cF`>_E8uk}or)V-dV2m<+R7ho`S&T_vw>1rVvcUS-Z=vMSAI`!8%<Fo(
zXoL9y+ov-92Z+f>bJni?tGwt}i8VLHX^{%|s)(%sgJSarQ<73g0@YXQH5JH;gOaBK
z1|;><f(i_(&%bk|1|J)6V~+EC5|stlNXv#BpqX$FAn@<1&{d5Me{HGD^CGXE^;D=W
z^_hz`pboBfWG|UZG}x=ZG#J;OPcdNlaTG=}I(9*@@}h>Os<@GWC&S)^M29PFFsHJZ
zLQ%Zs3m*SoWGT|l03!io!E-n2oq4jjd$v{Pz4p@O#&uvqZGO5BAE#5pO_stG%p~C-
z37z?!lRp(b*{B0UK^cKj){^--@Y+@4lCoNNKk0To#exu%zS04M-Us<3*$-lc1>aRv
zy#+;V2U*@xxdmm^#?IB<)xkm^TR*`jgu<yFh}l|Li%U`&)%h*st?nU~M3xe~W3J%Q
zB2n-m`tsa7ep`4aj?bEoDcG6pt{!)Q$>G=sKe#wr38PUyP<(`@k^1up+8Hs`oIA$`
zx1dsSpQtR2*>vQ`SD#0x(W3Qf7e%K@)E^DuL*b1ZBMf=1nt5oDZ@>1m(NI*Nc@;n&
z#hdax_AWYgT~7LFo=Kc=?_|^F)@ted3G+b3MB)T{Bk@qX+4cP72~f_Z+c<@HyiaVy
z<0{-|=&BTLh7;{~KA^i|>R^t)Q{XqK2^Ye%ibwEAa0oI$<~aAx6_|`6x%5qu<)44G
zA4?;**`Q(NE60FyHniS<%1L8h+7}WRM_8yq6sIftMMqB`U%NwWGlysMOi3m3O^Zqn
z2J79^ljlVNhQ^pzEef@{S{8>YcL}QV*<LBE)46xeEiSx#-fSD7j+LHbCAehFf~&xy
zz?8%!UtA&qVpU?PK+mmn4I06?)qhKZWtTMfbs5sg9HF9Ikh+jU(1<@&b=^gQg~~*7
zH;z!gP@Kg8E7wv#DB%KM(b|^f9yHhTIEa8BPmxHH1&p05EgwW-k1xMs&Ef*el}-*K
zctN1psl;*s&Fx-7BAB?<&*`szNEwt6NSkzym%CDl##klGB6vr#PmZF$GD-cgJ}AM0
zDe0U)cV!K|;K5UM3<|V@$#!)d3A9(@!QvSA(F%$~)iGkw3dkbVF<!BRya<a@kDQ4K
z_AYDRx_B{#YpDMU-N}qszP3T>$R$*4gkH(=O`f4wK^MJ}B#P)j{S>tU-MvZkL?$C|
zguc2!#tDjvSoZipZE<CRrSo2bABcXIeLNnKM}ZX%#PRdYCk@ZTeAp2&_Vn?;OE9@>
z&WeDal!u*z2!&Z4vL{2<1lepA4TCJnkKeG<5w@_<5vs15NML%n2KQ$vW(~>U8&C=q
zPf-c^qCZ2uqr*uXd5@G-t0BN{A@8Z(ex9ElH>sb_Bt|ClYZmH6>c}Oqjmpx4;FzkT
zf-Vd6BD{HNBx@(4dv^x1zWiY4PsM<bRE*nyIlwR~h^}=onKHU-U$#{(-4OO<;Cp-#
zh1%!Yh}+d(38DhR`wd$Mfs=a*k7{?j>BpB*(<WGLj_UYCLPJZ_FcovRb^<hupD789
z`}Wn7St%}-LNxj@vMVyn#`{qXr<oKN``I-xQXbi(m7b=*Wb}AW6hNBPE?{H7<PjWG
zc~qdYti&R7Y3@CK>X&r*z?*(glpHyJrn~gu3=$Fanrv9jmz#7fl3#4$uFN1)dP?%r
znF>gmNoDbP?~vj^=ycB5yO5$f1+`Mu|7(k^a$C!{zz1z7#&rrB*-W8Cf)DQ$rgWc@
zyxJTcIFgQ=d*Dy%xex}Q`HjWPb7&`5&=1A*ExChoLBH0+MgKaQ(SZ(oi-_s`jaBk`
zUEAZs=Z0iW-z<JSWq?z9ev!H`r7=Rk+jHF8Dw+Vb*GNJmPmCyJtMLpvlsE&6CS0mF
zj`}I%LQ_znyBf!mU_tHCaZJzr@{80|#t$Jpwyba`)amZLULLLtk3VRCokWOw;pX+F
z8ktjfx2Mzb9pB+160*2=1rq?F(jV&0ZIyMr<8cq0IZHGbSjFQJxTMl=7G9x)CqrmZ
z#NJr^xT(P`9xB1x_>XN=FjQ%{h70^z-F+L8GIL$sHWPV-%(YMLd|ykaJnYCm9wspQ
zQToymm9f#)M5gL)e<)WZkHM}9y-^}Abo(nZq%FqB*pVyUHMk+4En>U}?--pzMQAW#
zqAZdLJxf$V5=~hwsiZ1Czg=6qnJwDU$prP0PWrO>*uBWRvL%Qc1u`-V91;T(hBDgd
z(BZ}W`yYv$Ulu3MD|(q|<X_>k)`$tW_;*B1l%;9PWnNXL5X(RU=8h{RDaJCnymU13
zJ;6*mxQ5Ki&FopTi1~|H3~4AMomlx(x8&I<<hP%LxSsjf<)KWM-jWrz0NLmG*Y%)`
zNT|oDMf$tuW7S#QC!<n9+&rg{51kdSK|<^^B(lta#9@6DuTe$p3&Lg)=8x-b6F0{~
z4A&h@27kv>q?BRNAkXde2qFLz*d8l@;>&XfyMhR;2o(oaSp?xE`_%Ak=Yqr!1%nbE
zLXt$ua#uFc7@x?qG^j}SH4!MPrm7!~2PG)+CyCz4rJ%->1taAW+2SeUqvsOU<0&3s
z2kR1{;M=|<@F&v5SB#&i4zt%;YgS|V;g9*2?FX+K(XoF1_~X;IRU>uJc;;7@k67gk
zkB*bsQJ&e1aFeu8>wAUeLQqH)7RLEf+`C$Lp7?LRZ`H>ta}4EIw$N`qkvBT=tx3fG
z%r1xYUQkg`ci^HoQIPIIwz8;h>#y!$$TyKvMspX5DtoUX6df6CV{JR^!n<W6)<xfE
zOd|>FStjU)_XIv9mRZ)T#b&`Px35G<ol7q}SNKOdSG<EYZChS5tgTLx)w^2DUdUf`
zn9N=a$W5G#Xjbqb*Nxq}Olheo4+sN0J}C#cH$YSlGM|>HZ|^<mHj2JY!zO=lUVo<h
zHc=*7CynHwE`#K1wtl^|j%G?S7A>8lj;3VLZ>0h7DBRKT>p0RaR_wKu_^Qf;SsG2D
ztfO6<$yjVD!JUZQVcW_u$ezX2Z7E^PZJ=(I6!Mae4V^x&H^7uBlF>(fDrk6#^4`2s
z<V(`H;Nx+-s&{iK?63Lu=3?0o*IGWGfFgTxil#toj$BFRY;-IP4>{c!xa2*z#6au`
zI^Q<SFo~OupPRn)duoFgP$Y2Te(~*@6@5{{bK)xo!GwrV9}!*CiT9N!{QYMKh0NHo
zRul(a!&8!|4SlTzh#x>qHTou=0@KGWCAU!<ClkY$cdde(^hJ*Jt=~c8)Jj9x1SiZf
zP#jYOk0%4E5BeMYPAuEA5+z~?@Q*7eIu@`KB@|ci7@t;W-GQdLu3OfK2xFHx=&N=E
zBWXWGg+9nQg<*clRBmvA9O6md@nywPS%q^*l}FYXSO%@4JKbj**~>)pONfo`8TSNx
z45U?rEsKvGYD{=dSe~bKY_E=@%r%u<_?U@DIHtyE+e&U6o{Oand_HP8J6A-e7y3?6
zKkkDy525*fD#ucCy4Iiey<Ae6d^bJ{Q{#}svm_`mxZeW7qB-&Q<>~V0R=*#sqwt5f
z$h?1~gs4?!)3osUUn+W``NoG<KGt&$TKwGFa=A5g=aP&X7czN#^y4<EGd0e9!&91I
zVMEL#QZB5sDx<LTSC~~MEuN2|qnp+66mPweFX}m`sctQN&PW;Mm&>9?@RX^@?T8J8
zsNz1VPnikcoOy1%E9k2uB(R#dB;baU<EpVvMT-4sE{7_kdu8=>pd81+;j59VOh2B(
z6ZcXn+csv@FHQr2M=PTxWS^wFnH`^ad0%|%y25dM^5g63cFNVsvEGk4>@y422mVc^
zcXnnj;Z#g?4`<#B%%1-^et%TdDngUJo$~nnDAA<K!H=r4%CD)By8X@_qb&9(lUjF(
zPe@+mobtt%O?=FmJ1;ibs6Kl#D_4mM3#t7I0sRWDUB`=HF(f`d9)aHxx9dO??B+d?
z(eHaae-Fd`3N}Fi6_@MZB2A*|!ZnCsv~6Dus&}S?>mnI_`IED)(N2fPwGTMrkQ$hn
z6u*bd2a!-ic$nQ$=1{{~_o~_bdR?h3OYlf{F00ykUvq6>e4t3mGfMel9ac{6t`E(e
zI&KMJjAvHf^?0o|v3;jY)HsknE85?dx|8fE@-8R|%tCXNn%q{qaC?#G7_FX<u)XEe
z-I!+VYMT%I5LL$RjoYbXCG#7o=*^S4hHvg`*N~UWs|RC9&Wb^zqo9$a0cLvOv?KQW
zdND@@9(%_5CwJboUXkn=<<J!3E2saHj664l;&{3Loj6cFeob!mmq_@sBq$hbvd=JB
zLkz{m!jcD&2?yY7v7Yki+u$h6;OL>~QNYy;U^D&`G63ZtK|nspA3%ok=>d>=5D2V8
z{u8v7B|JV1xJuMh_BbJ=0XX@<SL<!At4>x<1@Lf-Qh0keVDa~$=r8UN{Dbw2##Cds
zaibx57n&js-Xi=Ko=5cI(mu+fXfaj_jV>x!supdM_mrLIM}Fv2NQoBqeNf4(#@V@3
zdD+J4926{w3n#BpSGBy+Cmz=KKF_~2WjQn&??I?~Z@>^182#^HDIf2@6G}8jkU)wS
zOUheyk^U+Fg2<gj1&O_R*+aDvecTn9QRPNE8HKTud(<y{H$T7i9=2(zWpVD`QF2yR
z*dN!|da<^t>5D6rzc_v$pVz{}B-&R<rCtXyLU^ofb4#YESnBrdcPpV?9aTFiu>_9G
z=|irDxhH!{c4`NP^7xaxn3iubqTL=cG6uIx$eG4K;}uY=+8i8KRpxSyuZWb7&*2bB
z#qw`hEi6X<U#o>c!GEw?bp_`RZmgy=VjqMq9j{p7EXvs{6HM+j$_H&rC@=5Htdfak
zp$Q+>a(<-GWqgv7Bg&3dZAgdrdbK5w=n0cXaRr6)c;8dOE%o@R(ZuG|cS*CXndv>j
z-eD(J_d-QG>JPq`dQ?uly{m<vwq(zPtIkt;=A-Y5GXTfgVVFFvtxK(0UGSVut@Y7t
z9I`EjD86_gRJ50&&P&Qs!%?x41h-M))VT+9wuwUkkqwGGK4$RA{E>B$4Sff_mb)Lf
zZQpbx)+knO2ZAWy2M$cpmf`3OA)<YhJ;%4LdW*q+SMVzqx(heZ3zjqRU-aVpgToD4
z%ME;gxslDGE-uI}^h&`*Qk+`c^eLE3Nr={IcT*7!n7Rw)*%3kZmgYD`w2(q4iag=K
z+t_eKr9=uhpaIKO_%Ae|V7@=twgjb^6>co46Tx84p{HMKmyfhxfFsk-9M^}_wq(R5
zK7|rN^=4iwo*mZBje6mneY<UOZ>+9WZ%065u%?&!R`rgX%q+>A&x}tMs@|52hOpbH
zNFp^q?u1ez`Ednu$ZBt3)om9s@^1o`hq_hYh`x$_W<&ArmQY!f!S|VK^_ic@QG$#h
z?nR&oj{EMrCm*Q~I1hhh+pyPgdc$>G?)d@V0M#U=LpQ$YUV8UK;gs|@4(rG0rZ~(L
zf`en3vcs|#4`pjv`cNpm+nlI;v{}4P6|SxxK%ZTj`^;f}PR~*1+)HpOX-{mzb-qWG
zg*9DPKhAOA?OxTHYg6EcsgnaM(*w4-6sd+)g3*kvwv@eP#wmwcqqB3$C5|Bex!Y`+
zw%^<iu^VQ~%B?eL6eGoA-a4(X(|F>!KD}WRU>PF+wFwX?|G#enuZEHXG8k=Uov5WP
z@s!ymTTj$&c<#wPDQz1D5z{Ez?*d4R9wqb@ag3)UyhF&Xf#-JT<wR0p^xq^N&_VFl
zJgW9Tsq3bFWiVlCNqPLNSAbdBROVHWKKRZ)Mrynx|Fpv^iNXgV)LGQ;OVnjD)O2*R
z1gSQ~zdd(?bl>u>dSjt}m^jC?mynKoJ1`=$%SGK#$pcxM%y>MS;+zx*h~R70(A&Rk
zj(_d?BzP;?y{WpTkot?$3GKeKUBg~)4B_BoZz297!<=SR*Ol=PzG1K98hW&>V;>}v
z4-PqpEL>&HZF~D(!VP`Z(Yb+Yur!>1P)*<us1~c_fCvUy*9F4}1hDSTk+QlgK(<?&
zAK=o$;usH0T>InXJxc~$6Vs*Uyku0v4G!lc-nVXhibW(ls#U1?hq8pnn{yg#y`D{Z
z@m29rbPTx8;LAX_Z9zEh9V!U(k5jGBog=UG%dzay<OqyAYKmTLeEjN4*1-wi3#ZFK
zpAdnR_DOnEh6_~a|Ex2^V14222Xa;W=SOcRY>5%2yA8*%_E5)0=AdVv4hu7v7M6oP
zZcxp?$4zN7a>d?<gc4_V+%vFJ(_eesBQn#qQ(u#vsVl#Rq)_iNxgmMCG2yZy^v#72
zoPn=l^9^LXNv-1jlY?4A&;bdIwS9r%X9~Yvcae=AKva9>C}opSAukV+8E)WXn%yUm
znwDPaOo_^CMEDYFvp`*XXa+xp^A#OE&{}fP30o8aKbZA)Vtw5Kh1g^0$rk%*VThf(
zBz9hCS@_PHtGsRznbjA3g|y)3fhz+FO^i0Tst|?CcJEoz8+B^otBynsIXnyHoypWI
zl1O=l6Lp~@F;?dyGakGcbTBydq3c2AOJkAb)LP~M!j`WeYoIj|?=|;nR(SnFP#?Zs
zzu*p8!y1Zt=b8G(EypsmTE{5+%diJFp-tiO+G@lzBSizF;)L@|m2s)MITv5Px!KDL
zOvj9SY&X#G@5<NDl(OHsVO&~n=C0RCX0ndX_8>0Fp9xqTU~YbH5C;!%w1Nfsfq!8B
z>%^;HnhR6_<6qU<WeBeZHy@u~?`jPX7_rv5jh$Xf3WUjmeqVeAQa=LsJre!!pQ!TP
zpsj(Se{jI7#7Yn#(xM@Kc^kkC7f}CYO4}B9?P?+_o!9$OBV_>v*SmJF1*gX!*v>T@
z51=JpPDM+eiBtJ>{zR`44U*JqP$VC!G$?++nvF&YLeF~J8%SAoW_QIPpWNue>ooiF
zGImdb!%us$yrY`;Q*mZG_mI0&`?RTu`|ZZV*%|l7jSJ)$dg#av3%Wt^gYx`=<djKJ
zarn%Q6?7to%w;Nm9&ee&EHfnIb!Fe0n@Hl}L8-Jd7&rFKs>61gO3dDBGPB3;yN=70
z!kG*4{eg<^y4mw*GLt>YucFns`Yj??mLnd8i4B;ioxSuGFj{c6IrSu3(tv;#S6?q}
z?rgavtMSM%anb2X6M$(IK5p(>tr3u}SwELBdWBYA<|v+cURCCO7Q4n@KR(9-h?uXF
zyJRo+oK{g4V;}Pge#6{wS;u@4@^ny>+;V|NPn^GsKxQPPK6|XdG-Ds30y5v(Yz7jm
zp~Tu2OJ97T_h|0)gCR@KXhYYbgLRluH5lX7t&2PBk59->8~wD(4j$z8y$s@+bUsz+
zPprVYdzU-DfTd-?Hpx!tmCTReIq$Y=i6~msXcR64Dw)}lWcBEA@&dVP_a@}rNry9=
z@+YxNI=ZsoMo$lzNE(RCX0MKqBph>|z$fqrF5j>}H>kb*JpX<wL;1kEfO)_TPas?P
z3}ek2<=Qf7DG6_o<Rq2H>g@jy>m&?)1VsbOT!JWrJY8z+9XVbDRwWM{LlQ~%4H(^^
zn*N!obQ4DZV=IaOhpA+7lc~gagOUdk_=B@nMpGdHFku0uSmd4cx~M2`a>w9R6~23s
zi@XxDELv}RKMyN%jx+6%!kvfu9GWgaXj+2mm>P(tAkL@}L%eU>>@<2=BU5ix#kXfz
z(dFTVgs8|CjwuWm-rJ0dt{G2P`Ee`$08}Je&H@Qna#SAUA>5!A;j$DZKaI6akXA9x
z-UXG*lg_cxWfBeWn^V8FUnB9z^){DqwDgdu=p~I?m+hvGgMavj?c2hm&&p%Z^=Bkb
zL~vZGQ3ER6?>uUz3Y(2DnSn2w$C-2yHa(w~Sbj8AE?nf(#v?9tX|<KHNPQRHmp)L@
zajvtemJ0|Cw|_o!?suQpyqML*#P1L_&=_?|&86Vv;AZ@G@%^LWGOyo!gYP4e8}{}F
z{T2KtcA!k05{$x9Ct|@dPbE%WvQ-PL!3|e@knbEjMUoD@+)W)XiytDzcQ|eD_J*~+
zNLp+KPo(s{*&lp^;lf=cmX{jlYUqpr#$J&v$0KeU2uDw6YY~6dCg%F-kutj9oIwLv
z?!XrROlQ+sXweJ*Vedii`Ig*HlZUNyzUoXQ4MS09$rX`YN%DdidW@@_x^~Wwqofh(
zx^nFJW{+2O6CYwSh?3*onJA42V~Q(An8a>3Pn$H|fw#eueQ*OAZqgwC#8<+r-hd70
zLffLjBxt5vwT{`C0X$Q!(Jahe{vsK9^6SQsE){BSg~#EUhn+9;9B6aQpy``z+F`O`
zMocF|La)kiaf}5v{wTaERQDJ4M#+84N?MF*1dn!t_r>g9hNrJ~{UZOezx%<MyZw%+
z<*YJtqSKn?3(V1x<jpJJy@Nf6^6%shO$JFqQAGvQ#-*KX7oG$If%loo-LsMqhO!m9
zqi{HnS1g<{tA%>(LXwHZcd=H+QNErY-#$&QsXf?&)6S8nye~fuK5j+1-P}SKqHTHu
zb#BrWdH&>U7$*!<d8E8^0!a1SeoTvfM2aMuI(vi9OPEgwudq^^!oc);xxj@s1?0S>
z6w>`p=(KKg@#E>ehoq_<o2^H7Z?OGv>^><ITNk``!XAi53s&2uKAG~0F4k}CO;4r0
z-(Ge_v6);pY)3LxswBwD>>YTEuE-HWu1jlfx>lCNG4}9fN(^Py18!YBZS42W`)|)F
z<~wxTBG;hhr<?U#;{{D~kL7a>IGaC~3zRfYeo~Em&1b1JFMq1Vl5ScWSLC(AL}V{#
z?cj0I=ez9f9+5LuQt?@;$J!w-h@bzKmi)k2;gh+JH_cDr9sG>H-axq<ltnP_9|&8~
zSYaH%s+W446+nt+da-*{k0z9VVse}D0jd;|%AMi0aDQ?Eee(41<6u&)ftj<oVv$3-
zY)0Rw?`h#ly3;4?2r~KQqP$riPH_~vb-o=%NYN3y2MT%qC?2yp_r&1`Z@v6DeytF8
zg`Iy<`|URhk`es0oWZg8Yrd+mRtqIB=$~Y)Msvu!*{>}|T&?ppZ=NI6NN{K0u)@Eq
za=)}O@E@teYJxZjV7%=kj3;oc+4Mc$;$i0BpF}dFMLb|SAeK{gEswdCwXZNZ>+$j;
zdoJ3#z93LY)(ORZX|5iT^42Fp68A!AP^LXL5xp~&LSwQl^$X1Sb^Y>%{>08hJ3VN8
z&umRzG0KVb-A9HVD*~;@#PbSV(iy=H=1$*UOqIc<O+J0E9UP-5Sh08Ir|11@9d*~9
zd+eX<1GLV6SV_Ep;;nlPcp22WdAJc0WY<VALP)MXg&=r5DBx;HMYJY|vk6<GtWT$`
zgbChld+ezjVBessfqDPHLX%Oy);*ifFtVQ}Z2ZXHb@iIOyqa!%JsQXqq%2<DF^jX&
z?!N5mef*5)o7tBT<iOE3`wfVMTWA(GeX<Vmk7rLvvpG(6To+ze+f)|{S-4@c-%`ZP
z2@a$eHh0h~Q^8=F*ZGm--xX77^@1SPMUrf=FHyF1`$X%haj|`}28I+4V>ojubiJay
zbNLcw?RBe3{dAe=9Y=cs_8XS@ca7)&!5YBe`t9ZZ6YWIhf6Ou8pXL~H0MXRd8`@R$
zxQI^qwOsOaCG!%W5S3(YLd=w7#@GJUE26V)FV~UT6H`g&>3P18&WI<6p=YKtJSG_J
zL>f&;&IwfLig!v0DAVJcc2;e3wIID!S~Rb%fklGR+^~Y2kBNUdn(k@uSx`@t8~l;J
zcMyfe)H6Rz!5Aezr+S&DHbRNg-_2nR{k!m>w-2t#RQ#QeM`REoB)Vy_rO=|62!VJi
zvo!~wY^_<su|H2c@+|k2=t}BXVV`brgwW)w={O+8c+GcaR}kEPZEJBBH=K4$xg9vA
zbW)#{W?gP}IGD5s*O+45K>r)`J1EZ|m^i!%3J%g>G-<#hAbrrMO#R{Lg)T|fnd1?t
zAH&W`Lr1`|KZ(b)M5#O8P^-l?zcgR%`{v-6XCK3M32X^k7}*(^?(=(wRMF#W%_fp9
zL50LRzU>T}4|{jDVNH~>h_0C@Mtq3zYi3Kf_e#_0?PfQ*=q_P!JPeci#0m9|xy5b<
zr}T1mp~I5-V~Kf@7eVFM8q4&(nCbegTqb)3<M3tqg%%$FCcPO8J>hoxqc12)q)?*Q
zRr$|F76ghY4GO}A^V+{d9m34x5Gt&r=JKYQz<2TOf!q)TJ$!?$tcIMueZ#i~I%edy
ztbXF{lQCg0G^b(;D?($sX8Ar%)tbpoS-8*_Gt^Z_MldlDm-X+P+n6~|bu==*_)*)U
zXy4FY@-QKc;~t}a$fq~M=D7;pBM-yB7GZrQeyCFh?b#fBKjJ^2d5?x39utL0_3}yk
zeV^D9u1{rt6gO<q4T>=M4-Nt-U$r{-(+(mj;EbUrN4&uc1enqPIN!j~KRDoIVkK~-
zXo1bo44_9dA3mDoF`7Jc6z;v64-)torHXR&A-G`a<)_KW!+Y|g2X9K!j`CjOrm?Zi
zN<sQnxGZ*iyS%C5=RGw!Kvagjb&u>z5(g7L6=p#=b;A8Bd)u|Ul?e<D_1#Ssx=_iU
zvj-(p_f9WTMST5KyOGD`duafIDBnP)8`Zc!P*g<KVU9qo>2)GX+RJXSk7cEAJesdw
zd*r!8f#Nkuck^YQI}Nvbh)rthFwBE<czeupLhYBnhkEnlPF9;uy>!=SH1yaFxVQ8w
z(>T`qs}^qe+zTvdsH0T=P!oQEHapI3a^>))p)FJsrDX_}6^;DpjD$=c^_ybu_v%Ow
zF&L)a$K-|3qx7}W>ivlA%lC>WUfYERZg$N)N+oSBjk3I}lDL4e*+=pL#Y;nue2rHx
z@F;dck~5Lyot*>TY-d!-hm=g4t2aOHH&2{!)jU^WzJWG3DRJC?U|6bXNH`$TVl@GR
z+LVz1f%eOk?YPw0)kAx0*{wb%rfzhbn3!3QskXyt@^G$)<pQ@`>DVrKat>l;zIQz9
zSQkGP5peHmqT<_AY#kbK=-PZ?%+HFcyUlXz8K$aS;`UP7o8pxq<lDlgQmQ)#`4F!J
z@{q@=_AL!KnhJN=8>@TL)GGT)Tx(Qh6gHf>SDD=3pO!C~XR++QW5<8RBuktrRVleS
zrQxB%lA^n%OuK@0akmCyxGD8Q$FxbTZPLT>;&aQ)I<9Ao@(tPx{|)-tpBUS`QBBxz
zun?14JpLiA#7>~9-pV&eF3^LW`%3Qh1c@FB`pk}5h0hQ3a3LOA?L6}4M6ZTMKg+l^
zIuO{ty`W?;7P(VYLr8MNHr=F8K?VQa{uhmDf>|N}O7D=dHnu;C0Pe+<iy8IDDLmg0
z8RIE!@QQOYm_kq?Oxe>c#J=g3o+HDVT3LZa4UW5yB~%bZUwwP_yo^mGD-QlmK*Ron
z*SD3hx<5n5Rzl>o;xS_}w`r{}A9V#Yjq%00y{OXY{($wmcHyI6QEN)sYH_d7o2H$n
z=9W!&&X50GlfVr+6hQfZ_1MV_3gbNG#zGttE$YQjk7Y%b41?cmT|#-qevnu|*7R@`
z373v|>MOSdmnfvEDG8_FMeBC-o}R@g_233V{C8Efs+>NNDVbbbUSvZ5#0rpbf1P|k
z)sE|8RW3<07ptE=8C?Y_3ANkOR<>rkZdzszE*z4Mc9t;2on2g|9+)|UxB;cZ>{lPc
z3kyyHm7vmAE*8!<POgs5ARgH9stNkbs|f=H#o$skvj+-L|F`o4ll&hYpMbX$ctpj_
z)!F8{Je8B18>TA)fB(~iRiy$LssmNCE+C%kl3NTe83&-Q6joFFS1s@FTNqr@HrCcw
zKt(L91oj>XCIeiY%q)QFTp%p$1S^%bv$6&%Zm+w}HuoR6f?!I5la;fLqa_HYa=AWs
z1n~j;Dh=WXOdJIe;HTwM2I^=*00VHTg9LyXH9-Qvk)sU~1fnx$AVGkyEkIlVMFC=1
zgShSk6|(>hZGa0fjU9*!Z~!}ixEui}fX9~ygUcDf34jCQaszR>1EsUT(e4T2@&b|`
zfKpj5JsV5c2f$)s!t(F+$k&_jJJRvjPXBG2uF3f?dtzsH-vyw`PtyM%cL&5J;bH-+
zEEa?S3xt7zec*t=+{RL7PV!dQ!~<AI|92Ol7En=bV<F*i-_8oao=eNs%3c@NQ8Dwl
zUKR+<1MI_JmBiPJgstfwh>x55|3}04znupPWSa2s@_~4P?GS(pfcOOYFu>g05Rd>r
z1O(;g0|xo88!rTU{Qwl;2Ocml2zG@65q;o=|6RlQ`xp<fP*{Tj`Q3PdIRIclc{Xrv
z^8<Ml{7@cX5TJ+v^tuULW5tgFg&_kpen8{l1A>Esg1o?U{2&2<bNPXK?&~XH?eRlk
z?*hmJi8in~!C-En*qa{=3;+Niycn?6z_5m0VOa12z+sIKm>4Ju2k{DC7l#9%0kS}U
z-s1-*gE`q@jSqMixB?{N0U!Vad;<K}FT!5t0bb?>FyjGUz8(W?O+f%KAHc(WK%W=D
z?0Pa_64(_$;OD-<NC+TtO<DjbAAsC7S$<;&yI!*pY<)byn_w^>|Me@tntrnn#`TT>
z6otKh-2lmR{U(gUe|2C8!lvLB1Tce*z_0?a{LKk44!GVpfa76T7`c8U@)Ik-v&#pZ
z9x(dBIN?7~y}k(>_(@z0e%LHPgCPf-<@)}w34qOkz5V+ij2o^Q0mcmf)qpdF7nlnG
z{EIVwUw?DP?<)-cZ_a>m#eX!|80;Pxf&t@@-|d<?fH8is;58$_nBl)0u;Bo=02>VB
zjK4LE-<<LL`ja7kG6t;w_Xb1m_c)9Jem59%01SiyyZ)5|_II668g!iz1_&bsfX%Lt
zNG@f7pg(&mAi!yJEvnRkFY?cxCJ1m<UEk9N@m?RQ7{H+oNV)5K79ij|f87I4|7-aI
zJH`R`#PvOEfH8jdfFE%9HM0!}_<jPT7{JjE<Z4_$XAkhf&z=LoaX)*26!|r?6F{e*
z_x=(<fP}f8<8N|^@7HpE$)anY4X{pUfFeKNc7aKxYj{6J8o(OYbGU-8?H}M-nCt@N
z)%7!O0Pp<lxr2bMy1wTL;{OH23ntEB_x?JJ1#U2+{v=GH^1cbX4TOa>l+7xFuy7@&
zkwgbLkFoJ{t8-kLvrI!V93JUo)d^EpoQ`Rw`fgAYB&fT5mez+dP6y?i{21WwNY(Fs
zUB$0g>D)pxOBwl39Y+ARqTiD5mv;mvmH#aT5X#H10|b-m;0Ovs*8Z91HmE%KlwC^6
z@>zH_ZJd?4Sx6^@uli{}oj!^<g`En{;PFqd7B49|@(nosohg6e^d}Jq(U<{P=9$zN
z<#%X{S_o&_I=Fq86Cplc?{M$+)}xbP(Y%-rPDXSLsAhIEH8MsdmLws!T$vFjja0NI
zX-#J;Ask_NG$)-atfH8OTQ@qh5WJ4~b(3o61`Kbo3IJaJcd7x=Wth(oqBq0~;nU%U
z@Thb1Lp9{VD*<4ackD0ia7YblgU}N``j-tZ_Ae+R!aWqi4ZQ*W4K~0Z<%0352_^uh
z+JI-U7`G1DjCgBN(QCfR?@t;N(p2O2Y5PVAsnR^s=;>ct_srb21X(X=DR;GgtHUKM
zJz1cpONzua3yF97RKDzx9YcEMp8QcC^$Xu=gn=>MWV`YwJ(ByJGsqS;nVo`t4pByg
z)zNMhMOylD+__jmuCF_iKrY(($9*x7wGDxI=IqEX-)7j|1^sZgG5MltiPulryaM<F
z^L9MHAW%3<Tp4{nrIu;hU<BPlC;6mdzL&WgWYX;JO8tt3z(q1$f|HQ;{U%!>Ub=dD
z?ThD{8cro*MH}TgPgYF~IsQp6fP4PI<q+VA`_~NvGF@Y&X|c8igSqw@4(Xk!Wy?6M
zzsy%6rn9Om`@M!T4B`9BVS$sXmKiIaSNgX`N**{YZ3ni4%A_<wAG~nGTz3lj;t7SQ
zGNE_O_$^}EWWXqyo34eTs7!)q?HEBWx2$$_<(b1v>0-8^F|65a-Z>s5?7O{u_m~qz
zS3rxJn&Eu~IZ6F@?E8~2gsg{=*a;dIED2Qv2AUK!qsWsWThxW_biU;xy)T3|ELA>~
z)2B_1s?DUGQaZgcnYL6-?s26aJk6~85GY98c(NSMhpG}iy|HsbXv4;(*+g|W%g>D<
z`7_x%89~bZC*<>%SKm=DL+{evKtb3!`CsP*6p-@&PC-p2hc0ng29@FSk^PL1o|-zJ
z-<~->l+r9=dm9e!=JxH6Ygkn>B6t+s_r|#Lo=Bk&=e@gWo?%Uq(Trk1{?8umYa>_A
zY5^*_Lrh2(n{@H}(&5}w$!Ec+ajN^dnC-rTm&;sF-%Y&4u3r>|NW5fNW0mZ7&>&AI
zkia)vk0&n9SI;qMpV!#iK7k<HIz|;>T2LON*C9*V%XcDdiNi_nBxzT~#oT8gY$g7D
z-<;BPeYgg`l3ZK*nfFdlSjmUtsJGIcVrnWsSe_|!=yp43k(-<+MUDBmBD0n793~wO
z>C_Hk>W6z0d=osEKVAQ1M;jvK@aZsol?K`cA^2dbBxstOvMjeSW8j8gN!3vQ!PTE8
z`ID1!-L_xvSG7ymnY-`Z-a4b@iLa_i>^I?5%2s!FLd3G7S-tYuUs9yMm4&`D!^8h{
z($R}ZapC+HkEiG%U7bE%#w&B_=m<L((PpGi%3rz!KXnkc+kMIUlv@LZve5=iH-^}5
zi@Vph967ztxdYwEv%g_a|L#`*ea`-Yzegte9ex`K4e3f-0v!WmT8$|&^xIW59>m9V
z9cM2H8S}NLEDdrplQFSAs-nfLdaQW!qBBR|EHbVW^ONZz?aXJRk8R==bXaHe2|TZG
z?lZ*|dk$M<onTs=(cch&2GpUyIPXuL|A0!*!2@UzV17UW1;c)g39xp5EfFdRSZM$9
zTT06i9&RmeK3<*PRR}*H!gVf?3q1&vA<|UB5(?x35d*)eaRWtRTEl;RO8{N+U%|-$
z-XcJ9NyBoc{g}Q1V!nN@6&sJyp`Q7(s38@48mj}eLkcAui#^2Xk^k{CZcL!kJ0@%A
zh1qz^7E<)rLd~NuxJlVN<x3&k@CcF=);FMbg9ZZm6St9ydY?TIqCIQE;N@=HplqT>
zjTEW5cp}x0o{;iDX({(G>E5$`s}p)b$G*l@sZiBqn?r}8_f^%GFR&2Yuhg~iDj2I3
z2MtFYs(BQ+raA<oQy#vGSugPpGI-&!zdSk0>c1%pd1qbQEXZ9Z`T-|SwZ6M*Yg9Oy
z0WrKW?ntr#W1D)6F)#M^OsZy<D#t2WO3sG2PYj%B*Ie}MaL)i~l<X^x;$hol0bFiE
zt>NTHW%2$=geX$?<@9(k3wry#BzfDT1#{DyJDf}r2Wo@z3o10<;#$FPAQ(*xE%PV_
z#K5)BvqXLUfl_*I%zp#jZcvc^Bzg(utNR(=Lrstk5q}mRE*U{fDi7B=xEg@I_S68-
zgYpDWE15!X!%~MA>#$RA0DXfV1O}Ame`lvSK>{H40?DO0fLY!!;G}%u)w>^8C8(d|
z@-`88C>u#s`n`xAh;3HO<~9yJ++bHskbXy!K&4(}5hlzcuPkqoApe>=kUm|%)+jYi
zo2^!JvCgKey>;sDc&~J{Q}lWGCW`jC+LmF`zDi(K0{91+_FLh=D1}pFnc2JG-Aifi
zYVvRBjxtQhLE+UUQ!O7&Lk3SUCIotpu$2S&w{KYJ4eAsWutNWJp}c@_fu-kuWUUu3
z*jM{-R9YI@0tgqvW@2S-(`8mJgAt{cF~*sKj+J{fCydpSbFsVWgPL6@B(+2zIjZD7
z;=kd*K++%-)lcIhrW^ZsydhNVq?qHchxUf(*4sb@xIo)eRO$jKNPS(ryU84)i5S2z
z>0<K;E!>$Y{7L@X?0M#j{M=(vgS3J9M5TfuDizfY_^$pgh37^J-=C+YDoQ7$Z2MMA
z9*49gh=|F7`=0Lbh1=&LGp$n>Fb;MS3BBw=cx#<LuCrm<P94e`rH5HtOl@~~k1#o(
zs$!XZihFK=TgyCm@g?%unz>cL-s&=MReRX3Mxs%N)84c9kI{x7T;3w-U$7ufcq&&^
zO@M79&=%H~Z7k4bd_*XS(-vltmClZ3@qnqwD<-^cD7&`6th<N$?$;w+?M<H>^h&_p
z_K))mu<QPHAD}S37EaPgi5}SkG&9?)N!t}S&^v}Sc+Krj24sOct4`$NHmP|(_5QOU
z9GZW!0bt|*6a1eAv4HQ|uOJrH8lvV+Q{SM!K>p-=%%P#+j3|ND^zrs_kaf|#Mau2a
zm8%J~epD3fNO9M@OV6WnK<s*NSL4ebbj(A+0rSYAezzy=^;g8TK?)Y?yt(cNUdPmv
zk5bVG6F<GgvM$Fxk7AwO=voAm-+wb<HHNoiR3(}w(N}KR$w)}5JZ?sRALmXQgtN{?
zlpnM%tDj;P=b%dgC5Yh(mZuFa&B*_NBtZ~WDI3k_OmtSj73&(J6I~46apABx`KTiB
zaA-%r{BR|S+UOA{GbvX&<?&ZOL{bf#@<Va?whIT`uP!x-^Bzj;A4o=*z2Em8wriVq
zWlT7T^NlafzYSYHi>g{*|9*~WVtOy^CL-RTFn|F|`Cs`%B~Aed1p*1-neC*-LD05!
zk=D}22VYt%q)^@b&sRWBA|gYN7&u)mH=<&0XHYJ;)q*URh6S$r>cu+25})%p^i$k>
zrUnUI+96<s*Rp+6B6)4NJ%(rmmMJtXZ6G?M*zdYW28qWX-w1z>ZLG645zT80-$Cno
z39t9`qOr$csr|e0=t>G3qXl8;q5l@0CZBLF-Ye}L=hBGU&l$I!h>y>QrS^7_U(t)q
z-?Z+(t02F$h(G#T@WN6&hF)p^wDx$BYOvoc6Ki5MEbJJf5i;a-AZwwU`RBXfvANX4
z5{z9maAR)*|97q8|3L%#EByiT2eB2E_}{5nl0bry#%1<>f78hK7c(L@n)!4+5F5?W
zPp^h!FY5NScC^@^br_z}jB3{CzcdqLsvo?+RITTt8l3Zmd)L8_+K0D`y)fE+Y3dOs
zIQ;1WF;r2HESqrBtPNS;HHp9C8~0$|%mf>9+h}bVsyGko$VGpnJwHQdAHza=9cbUs
zy;vFeNf{JUiA?JWx`!<O%xO~62NKhsQF&=A)48K6+a50yNHfst7vu`|@2NHjGmFKH
z6f+alwt1*J(<C%xW|SO=DRyv5BY!K)j%cMhvH9}t0<(}<o8Tr=|6NP^|3PXf_n%am
zBq#w{aIiE986#5$M1a)!ERlm3Z#;+kN*`c-t!}a(9WR1E+A7Mb*sP(ZxM!_rvGJL`
zP&P$H%W!HM{ma^g^<tn^V%3oGlo(+MXRA6=?PtsNG4z?4RqwX;PD+`61@<YlhUyFo
zevD!2?M=|LT2ybwj>;DS^*t<;8GJGe-m1t7sx0n`8RYmNDoY3pI3<iH-{8C32xV}`
z%gjVmKA(f&u^3cuV|iU0Hg35Z?unhgV5sd$8R_^Qde|~=>+(idUXyX3qi^X%%NF_E
zZc_ml{c=&m$5J24S!aWXc`e%%=-Y<6?w&>M7&$twHQe~Ay;)>#2uj~Wd3zIt!t3=<
zHlvtJzF*9M^B5xI1q}#kvP!pb51bQ(WBG5@&Q1%hUfxl&2Ff@r(wxt3+PNF_Gzj20
z{@1gKS3?j7krr#`g!odNA&SdGEsy2>W$XK>VO{EXh9PxHv}uQ$iN&<5T4G*loSBWY
z6N9!q>(A;qT%Ojye#=#n&=zhT7WmF4wH`iQ1YT-lxL8AqlzM2aK#S$&ERtBn8wcFa
z7O(tMUem6JgUngT*(KhW$Pkj)e`L<*Z8eU(HJ7scxmT;8`x%)(3cRiW<;2FsezK?<
z)37TsWUP#LfDD~bhEC*rOyM};_FbM42*Fr4ez`5;Tj2|CRX8}pM*|3!If_ZOE1izj
z$F(SWKQ7^O<g}mtlR$tO@|S4;E5rrVPyA0XQ&Q!BvG*QOQ7rAgcPl{w5hN->B<Gx?
zf@CBo$x(vjC|L!`IiutpBumag1r#I+k}(h@DuN)O%&i`DZ}+=7cfaR;_pI-%dvC4P
zJ=N1aHPuzmJXKx)U)89pN^1QkX2ON{hmHxJpMKLZk43KE1Trwdj~oX5V|E7o9pKUD
zSTp-u(*G)wo%q1^&k`o)ZxSZZ4M7h6S0zj^diQg1nBB$J#Kj7ThPRx7uIOM7lt*~%
z7mRtcTY&X{;el>;7oe)b1Aa)M4k#HwsRe}vj|u}Z6CM_Evp2ux>|*BNd<&K?ekz!p
zU^xC*sDy`}!3-5xrsM>&2)ijzivJ=}g2CZ`8A1NN?ftX<eyf4sB+9=PH^|(7piZ7x
z@c$L+BsUPVej5<~)gSwBpiY7=CJ#`@dBCF;Qas`2!xV%yKQM~V1xEk5!RR5p!O9YR
zo*P^b=29HL0(}rxp8h8r=C5;LUFa+DcB~#93zWQI0xwe9;se&p2L|K$1c5{Z<Ox2Y
zuJgirA-n<8;}Yb>1RGF5fPM(X6ag@}!4Kpbepvm1^+)&>J`YQKU_EPo@Od~*K>;8)
z0rdfX4}L}73^x!v!41I~`6asX0hS&9EHAk6<21mv;CqpAAc=7SnFHQ<fye>B3W9DQ
zA1svtnd|r(Sn=aTO1#{H@aK4dk_F3Ou%ZR-1>RsC5tiwG78<g!L7^fG2)u%V#e~0;
z7kma;D8DiXzjDI%1Ah~&?;_`VA=PO3*5D+LKaQ*u_~T&1<o#J^e<XDr0S14Z1kjq1
z(j=TKkaM_NVKewuUB6yIZo$aMarGlp-~pNuxb0(G0Cw<4`tVioJt2(=qy!)TkqVqC
z4h~G@xt|FL0>ANVgAL)>24Fk*>xL|AU>C4W{I((O0k(->8`4&O+5~J5zi)89kjEem
z*fxG`NW0+R1$7AW3fsU5n;`J*NV@>dDc^6~FPr%F3Kt5fcTD6f9RF=Y*7fmu_?ka9
z*e>8&g<t<rC6S)|*D#tCkW-JF7HMGh$1wnm{M6rI$0_hrfiu4Xj2+ns-MRwm9@!Wi
zlN5r--t^digKt7!1bcQcI*5!r!cO}*c1)`PO&WRV41*{jhKY3fpc0Vp9=8z4r)8iF
z9xH~x431C2jRhx?wgKmWe+QfcGJ(G|2|vX~WE;Z?2naaYKfNO-u*W}J>z_{?T%ef#
zu{Xo2+7}5RFECoi$8nE#t#a+*l?j<Tgad=(<)E|VB5zZ|LMIx`JI7)QJo*@l?juYr
zuM;GNp*`uSb;KDBT{9-%=q7x;Cd#8kE!cO4v&VfGM~{s*&q7n{;xuX<Vb9x@ne(V$
zKT&E7^ev`s6ronr)9MtFElk-lYAe1lEy*P-{1$I9o~Lr7)AF17O~U6UmQqG%C@OAI
zi(Cw4`=DC-LUx&F<V!o=3;nh`jWZa9XXLoJl*j0`Da+3Dn`gFNNPQ-q#Jv@Bq#>l$
z*VUkHo-{G?@LXDg-NVUP$!+3L#P+4TAAX>*Gi#{+y@vz0u74{uU`qd3W=N40tXKg=
z){Cb|BL=|m>*-JP=%qe0X_tla)JtToNQOO(D}rS1H>l(5n!iZa;L#|x!z-{2w>4c+
zKD2R6;@qNae^c4+eV#atA5)3U?4->7-v9bpqyLuB%8gu(fQRQ)TmjwlUrOtr(*zzq
zOgW_^9n{N$Z+1PVH2VVH%ZaC_nZk|X=>t-Nj@!pimY$oJ6i>?3?@yLLGX;K4|5#$8
z5uJoU0YECPXU{e%8yVraBW$Fqh`-34m5z8ok~<#tioD{q3yxQI0~^T|NrqZQwcQ;h
zGkhtF4Q=(v3?6f=XvMfN*#hykjOg{dI5QLrisZE?W$^dsv0tSII#K^Le$N~J5*vVl
z*FR-+Q7@=Js>G2X8~IV8F=S}l_o*>l)k^R~$n(nh<Swa)ukI7=+65|N&ACmX**tbR
z<u>^O!7kEZ6jy|I(og^(aQ<dvpt=6X3~?V<BUc@2+;a<Q%z~hQo$ZlIdRpg-4k{K^
z>M0A-M;$x&ZsLlftGIEHP{ns9qC;I#7f(>i;V$Igvcm<MfPc)7BFr;Wo||^TG<qwy
zaORzex~4(P9fVzaf6?mc$p^+gI_jKNbcUv9mnji(sv3h`%NE%lI2ee*?;<z8Tq9C;
zdxdeKllL{MaJFzIfrYLkcCOznj!CCxXONA@#gTW7j(DBby%w!0bde(Q=%3GCY`<iv
zbzA1MP$m7n;U_VhZI9%fFNY=ij;&C#JTa;kzmq5@A3)15w&gKiQ_bJSw7x!&Vosgz
z!tbK(Ub=aQ?fvCR1FuvqM5d<Uhe9)w`K#t#+UV6N6~=gFZkAsZD`c63L|bFCcWn!v
z8?xyy+ZR51qLK1Mt2wl4dilV`XY|J*v2(QE+({O8(%3T$AO53>sVPKVM=lMaZ=Cm8
z(K#bZdUoe%x~gw2hs*br**RXt0*&72raT87lP{0E3&UjkEN_-a_3O_V?2v7FF7UeM
zPn;iit`Z=&{DKxcPGC`V>&?eB4@#_;*TTr$PqhTe>>}L0k&I^URHFIEIN~l?x3CIH
zj8@*ha9_Nf#i%*ZOA-qa^@Ze<$)oq)CM*WM0>;sd+1FS@Z}tk&Rms=Mm+;ZhQZall
zEPtV=Ei;WC@;oLe!!`Oxh>BWaF2`B~gZJ&YfB@Q!YCMP3sBdUbRHWB^T&1j;v4zXh
zTt3UNa}c@+s&`?P_m)mJ<cy~BR^omg3Xk&1d4qS6sAl#N)*YzM`$Cj;sJ^~iUTvU4
zS?c*^)yPBDA}TVrGpCx%#s&!2TAWiP@9U2Fx39guZDnS9E0a{w+)fu_dKRXFcHul0
znUNLRD}OC~&uiO$I#0OC_~sv}*d%o<#@2Ek1YS@+b1A>{l-DkXljsmpM-#o|1OKKA
zi5vk_FZ!fwr2>llu1@&QefUJ7PoINvQnj8ilKpRu_bRH&*`tE--aY2;_hTo*{P%7U
zEOP84cniFwUu56HdSN`uh~7yg^17<OvTQ3qIqdR*H(F}9Vel=QhjmA0v8ny$ly#jo
zp%^aoL>bA?q!T*g9KzWr$bAgkHsu+dRO<z<6AKSxFSk`Kc;$Lla^E1PchAOnS?NO%
zmqoWOS=ACdJ%BUHl%taBK|^}G^RyS`GSs9)`dThm;yGy%R!O$p&;{O#&aLMtJQ1lF
z=cv3xWU|wqhnuaZP+^HrTpS9x6VV+OoHfE)Oj#bfDUz(+5ok1sC+Hz_si1!&y{7-e
z5UyP-uMqpL(6}i5(XvcidFI+7&IqI433C%Ufdun6?*e*E|M=68it2*}Vh9$9dnwJX
zKD=>x3c>GB=Vu(eSn^cXilCDqozxKRDT$V~Kvw^0<>4pp47R~%Bx!@ui#*kob<?Z9
zs5s5;;%@jF8Co1|qiEyQe|kD_h^GIZn(>6X20i+}WfMFi{bM$N`eYt{RSqsbRSwQ-
z6%IZg7{)n`aX+O|pQDqE11pau7^{HtOgY=JP$#a8gL+a9PUv}X!)Wh6JCSBPFs)=w
z6ph&9-q%{uK`eiQz9TzXBQ;e^IRZul<sM04L!u(tQdgge&t_+Vb`a8_>Pl@&{mQ&$
z>#}uUMdXh3lF#Qnt_UV#4b{V$jJocKn?m~%<D33VXXm?h?ix*u@|yG%zkFE5t4eR|
zrt$(eQ;<IlO%v7VbuNZ^JfFo=rmqOUxeqoego0KZ=ufspSuj^C0u?9l70&yjCv~Tf
zoNtl1hQDrxOFq<bJxSmVU%oAC0Lo)FbTpBNS$PXQZzN<tDJ=O1wJ;>DZE5haz39T%
zsjBN+=dpg?UqD><`8Ff%gIsK`B0}RjPg$4uBaSw?SW#7OgUqKS&RaI-<o%FZ)z4#&
zWH5-*9%auqz{;(4k;(|-GL+z7B66RZzwa&ZrqYkD;*9l!`Zo4$+)1#G-x2;U7n{TV
zvO!JPtU;s71aHEVs^o<J)_+!t7qIP_qYqOPIIKTaDljk`zd4G^Qi}WLb|B6<vBcLM
zv)?FpNI39yFBCHHS4BUUf8!eGd03eC{8Nw*hwb3of;F^*ZzLy)QDDU9Zw3qV(f@2N
z>I&6lpv~E16!6~%lcn?29JZVhb~GO+&)v4AIhCPHr%>}bzA$ey@#=xcm1J53`aWJX
zbyK-VzJC1RhaU6br_RN3l`lVgQsuVa*<JbCnBLSR@|Dk^r(f)pP(MpmJ_9G`!Zozh
z+pMu{M7f<I@w}J3-eN!E(sM;i4N98YRo&<N;^}u8Wu8aM9LsB2Npz>w{SAtNxe}F4
zS>M@#iv)oUQBMU!Uia6kn#G}OSrx=bJ_<FtnZxh%u$jiKwmHb9b&UJXkLSCSXN4M*
zjYC4wsoL>xoExuVnp$-?*`8JGAlFB$Mz_&0Z7=z<k;*N5^GW1|2X05impQk6L-=Bt
zhi49?PWe~}V4ih-8Td_c-TBVgvZ^b2K8H#x<Lvka`a4`fTyq?SzV_oW*lD`h);-3G
zxn1X-sJ(?5Ya1?A6V&wTDv@uTP50nVazUAX_^A2O!nx)Bu<s%spGFBg-=TbzPbpnM
zW$!o@pME4$NiV(2)0=RiA}X=)hsj{=GC85}y_pyt;S6o{pn8m9U7q(tH$DouR?l5@
z@i&<J6#m2ltA6~H?)azP>>Cbq=RYQ$UGmJ{DZ3}7b}cc&VJ)p|9&y;!HguA;p3u*Q
z2OR&&fBZ|gGKlV9yOn>PL|lP=!a`}BTqpHu{|)~s)!&KH0Xo^k&4oi}%gN|nGu6Cg
z_u9wZuAq}&_EFK67(TaIg)bJehHG=9jWJwcagbIzT}R>4WNoGHjKhRIZAI{F>b*1h
zxa2A)70HQR+kYclzgqA&a0`yfaNAQ^M)iC;!pLkio`If)Xu4xPDys4G7r&UK-kEQe
z7NhT8e*TeVUrAW$WK3^D)bMD!OV^RkGB{JELH8*^h^I!R*{59-oX*cIU115vfeg~Y
zLhn5W&dtB4>Pta+Pd2R}8T;N;Er{+lrQTpfM3~g`X9vwM#@ghq?d^FZoOwL0^bH>-
zk*QZia&*63*wlDkqAIJO#zQe!?(N(tl(m7W)U8b&A~I1!u$p9jsnWVPW~J!5!nN2J
z2?TKgH<)EEDI^YD=KLt`ldN@-dEWA6Y=fTYCe9f9CniLI{^1gu*j<R<TYvwg0z9E-
z%lYrDBPpe#0G3BQJME1bbq^PHa8#)<{LP^QX-4{r1U^P)uNr>h!#-gm4~+~Lp1|v3
z)YpPoO(?T2PNjUg$WZOtmePrSZ|>VgL;CkA{uA%xt+GscpV@?01$fU|S(la8IYyc-
z8ei$t-G7oHq4gYtR*64b(#W;JdpErm%}WeLi*Mx96n)qJg^1f9^6<1uP3SAbmvtVL
zY593KJoj#CqvIBMb<(|_(B0$ycg9P=4CN?uSb9SMK9NQmXSq-9G4bTy{BA(0?#=rV
zl>QwG1{yci+gS1vo@lgf^ckr6EzC<kWcozEEw3f-C0icXpywRik}*N&d4sC&GM78L
zQS>L#Sj%?N_icqq5qOEAZpq)oH*Ux{X^`nu>Cco)TE9W%7bpJKMa*esfFDjGS~hay
zdk&9@=y}plHrsUUmzcb6G%p9Z_1?%U6GiP}!~TTHBQ(RgE8xPD6HwBKfu_eOFj8Na
zDJwEMq~~_#`P!aY)nd{_lYe#jl%QGh+t4?Oflr^1ru5ODeX5R|nnR+R@=VU9%23Lz
zwltKD$nH`67S?mSAQv5R_TjZB=ct10%}R@hO(vh$l3S##?5ME-De=w#1J<2a!O0mx
z3)P|u3dMD4qjwo@UZ*ze5awsed5c9>MB@FfXg$ic^U1vOp4XAs-6IrxO7D#mDh3QI
z{;jD4!=L}IV|xPla_N)!a+d!4EY#fGS*v7h*SXC&>`c!laB`wl-<x`SE(Ez?Lh5;Z
zf|K%dLSGU5N#j3fh!<$IfCG^PYud5l7Vo<cdXh=$(Cp1GbqZjSo>NrSY)I;hliycK
z-eDEKA@(&4znbxfl9t667pcaCV96qlh6k75vsS$Pgi8I4KfUEyE?pa&u-HRELggyL
zxaFZ?ySOXXNvNJOSB1#YrllO>KT}&M__J9#d90ZRzu<H#3*`_{CK50FwoV$MNWZ^J
zPW@`03Y*Zimtg$Id+G7Hyw?E-_roI@%WbHpH>%{e?qA?#S;fAX7h#;^`IxXGh#uo6
zC13VqyKCkzyW?6bY3ycpJ*cQkGG4Trdt(`QtJsm&sWQ@1ZTn`t`Rcphm5`YBBIQ%5
z^*0j~J)c)uXSDj)QtC4Wdeg19KLplI_J3SO;eAn{;w!kqI)+6)^&@q!C>m{Iby~7}
zupOmx6E~AEp0e0TAWQVaSAA9)TQk0`yNs-BYdF$AJ~k&+$_d?PFkb%e8Obm1=P`=X
zNlBm34TSZFe@q*oWzO*9{UL$=6>e!`+stJ*E`z+id9CVcDXPmxl<MT;Wd*Gww#HL8
zCX(w@rcLi0TFY7XTkDu`jyQ9ko)`@(yf4UfeKUNPFnckU&uhwmaUx0XZgtKCnkCuN
zvqH-8uN;WQ*_OIijVwC*xfLOnLH(TE=|Y360!$I5EkUf2djp~q*wYhd7ySzZaV~Mn
zTUVin_fRlf+P~k$?Hc=dllsP`n{Kz?OTMP@zgj3%Ou3d7)Kewa^8!~@s)EqZH+F}{
zNo{y_wV}`0?bT_wRATP)S9QZ2XIJ%&lL%i)Yg7v`r=_ZyGjI`z8)C676qp+&Q?!Tq
zlAE{%GKWBseY3r!FX<SBjeO+e(-YJOPxZ#p2?XbON^ter+|tIrGxELmX$Ioi_iW<4
zxvtpl8Rhm=``ev+^6oG3<z_F*(dy8!uOdh?cW39?i7(!3KB;O>=mm5AJDna@)kY^k
zq`s`jOz6l|6J6dCs6150{=zmvD}7oVmx=SN&^HCU)7{BpUgvtY_WCb%emZSpu#_aK
zrEJBsLzW`YkCGJi#?1E}!5zW|{+aV4sr-f_jUw-2II8Wh)X~#im_4gWGgcSZnJUgZ
z6OI>nCx=Cvl~C$T`I$uG=SRh^xDMv>Y+n<jm@T4|qDeKdo_%uM7dAze>S%pE>{_mB
zMIAp~^Rj3}PPjgQB=43hSE5po0)gwC^d2{2p`pF{vU+5I*jPA!IL&Uj1<u2&+rzbo
zGF;t#Pw9FFOw~6AI#Qa0xm?K4sLhP;q46wh?p`t)9Nhkaqr;(h!pcjWpppBVgN3J5
z{u>4^7zGv(TK@{KHn|m7v}b<7HXczgeEnIV_zM?DD^JCEM&?BsgOU1mj{Px{wx@66
z1~-_VLf-^UFX7$(LV_;B^6Ui-*~c^kqwd;G(me~0(u(KXHCU}HQ-nCU?y4i_ZkvTq
z)4YGHnD%y6-TOQ<UV?iMjX6i^8f90_`3EcScGkB^?goU_`ZwQlw@i8RJtQMeB&}GO
z)-3Eaw$Ej)9+U^)Z%G7=+edmi(dn1uDdxJ=-uvJwt(C?3K><h44p(3}=4+I3PqsM+
zDlb2g;>8-#Ov<uGo2^~3?mKS8Ey{s@+^3S2XX6^!=3K8}uci0BdV3>Cx~`zK`z=~r
zXFTHURWar_wVU6>uc?GHca(wk9an;#&p1-tKz#w3&&wuo=RLgh(Gt6S=jaTu7Tgmo
znB(_e$Df+~?@WcXyo|1b;%`iaqJur43jTer0-orM)SONRD^5)RuW$t~m~qF-4eQ9j
zrvf!f0A}I;b7%#a;tFTtf03<#-7R1%kaL{jbtD~a-M}1dAZA&4I$GTV)3<+u7x1|C
zU!e<3c2_IsTkzCx7`$M&uyzM=n7v?kx#bRj@>t$ux3`8V4KoK@2QWtveA{)Ph5rS~
z5a7dP*FvgtU<M*5yl$Hlj9`Gd;(wtofUb-z?BA3)WbyyfBLA%8levo%YXcPaF?#`K
z^~1&fYi9U~_3~dpUhn|{^7kA1^;`v$7eIXd|GojK@qbG?a9;jjTK~DS{D0;3|H|uM
zf5ZQ_P5c2|9Q*fQUhX>ZkUxP5DG-G_=W4)-A^j#YstBTR=MB6IoGKtfkkMoJ3swz)
z4>6H`_Sl>L^wON5`9WTYbmN?09{lkU?Ani|29Vy*CIMc!1DOiavvYF&%ma*UfZ1Hf
zAN<v%zyKXGrJv0RCjfemkKuOacytTo#|cD#<_G@1pLu~V_?eO8CWRCE#0qi(H#3~z
z$q<>;Ps9U&Gss*Ww@RE~S{d>zlK22n3-aI?=|FbNen&cfe-4p`VYB0_rQroHenz=K
z19hC2Ki&23ePnUY-&bYvaFtPaHE{*)-gWUS-~ram1nj{F*~Pj3!^=3>;4u+!B{G7%
znEQWnG3Z4iujM;Vm*+pe^pCIqt)=;`WBTX){5I71=bOJ;BzVmkIRI4sED$+RAU_LL
z4ov0yS*vnjLf_BAlLIR|{H#(ru;MqeN-^2xz`_<kt5gm^Yd@(RIl!&`tV}u3oB3r?
za=_Am8I&9_^<!HCiGWP}vLiW=3*;CnunIYljbCOY2lDaDj^sc_ei@P+$jPx4!RZJB
zvh28m<v?DJEeNCoGV{xP00RRS#`tv&SOetOor25&Tn=e*av(FHABD6qIglBEbN!41
zsPNa_g3N#=V1B+Y2zb1oagZ4R&mE@&G6VWx$ZMoIS^s6>BGy}W<}mxpi%b!8SN?v5
zvlUnd;g?I`{yhOZYkTl}Lr&KOKR4;WoO83c<^rp000aMdpC_Fb1gDR0{ZG?C+QKi#
zblm;=`$F(?b|#kKcW}H64)T8;elD8>;(!na-9l$|<U&Pypx^<R>v0P#C?t8y-P-Jy
znv4Ya*)Sjw2nd20;hwRCwX2KDE$8bFc8<W^fMt0&!Oi@Ax+qu;=@wWj>6VI#vz-g_
zhoRzp%iP)wUegKK*YURk?}CiE+1a}QGXp)-zo(A;ZT&=B;C18SssZ=^^FN(D(l$~Q
zmAW}_12fI?+-1(+laK1mQ444wP<XOdErW>{ewjK^0Gb<9GoTLMi7vr5<+}Xfi<YX`
zK&p@%9XEOu57xXnm%ipWh2ICB<fm;3FC%FS8@VHv3_O&=3QUsKbDAqzFAg++E_vJE
zO2Yl<jtM_e>G?tbM!~J#?~|F*-8gwxc;ke$2a+grEB1GJMUvXw!%G;43rRkUvm<t^
z7W^B_jO`8e9Uo!6pB9qa<SrIC9N!S=7e;yfgjBC%X^8ZJ?e4@~`(%_k9)=AHlAHA5
z6ee~onfnA-V%rMMw43;7t)Wk_d+fz+)7qr%?gti^wV#^qVly*(Z&ocFYg%m6mf(#&
zCpb{?c2O1k?aQ*qJ7=(hhV=;saajGn%$#qiKs|iTnA*si6?si>R5q{@-StK8k5-A{
z3}Ppib3zZU)NnlYx;#&iF;jsazhm@PE0_1X`YO94v!%e=zCVFtcM`$u$Gw!f?+UB<
zQBO_TPI$;eRtao@;E$c)({L2&mi{lY%45g#SF04i4XjeCoi(6I9Y@76Dpo36Of6|n
z^X28@RDUd;or|}7Po){0)6^tbr{knyOOGf>_@20BcH|KuGJf{mHEih;mo!a3L7zcu
zwopy#Z&of!E_Rm&3LO=JS<b5E6jnM#EU7oRrZv7~&D|#$*X!K;Op}s|e`j}4j0C$q
zHb-tkJK-a>!B*DSy|J&g`nPKzT%tX=sonDCL%T04uu1BaRAONz7x9*dw0)5rBbF^X
zyB{38E_uW_Ig!1R=r%6byQcFLZ<HvhN{Q%d*Bpu1HZ76QQfu|SSfBfl(bLJLuMcVW
znkZ_~FtHjBAU%`9s@smuBuaTV4<6lK5DO4i+UEA~8$$W!e8}{p)BhF^@w2af;h7@!
z=yS}SzN>KqGXfsW!|J&bmvOp$C@agvmkze6qPpH<UFjtVni%|$+!cS=X-fM<7jorS
zVJ}8>wAL)HFJr0kV3VrtD7E+O3?TZ(s?~dRCx~_R?6pp^%U`V~H=p1icKKVI%l?0X
zw>)kH|6-R(iuM5<xYAc~WL?kDhj>M>Q1SM>h@<VHYQBu}71dQ0gJ?h_M(Ej#5Zv$A
ziT$upw|PEHbOv-%6Sr`Fh{87^a?aMo&f3x-^El%^7dE&Skda<WVXn8@)^c>uZE{<v
z`0K5J(CpKddzwCmpMn*%%KHuTl(i-wyE!C^Ry?V$>~+s(e!Nc4TP~XTu=!ox%g7~*
zNp<yYPMb0A$%Py3r@!rJ`rK#xPB8e{shzl2bu0K$bWzqLW3$4$^>+7NLLI*F?CzhP
zvrygMGMcrpZU51-^_}+78(%@&L>05gebe0!O1Y;px?M_2h98#^jlJ=-Gk>y8;-C4Z
z1AU22PUubr)xD!<3`d03_2wHpE4Z$z59#NNAI!2b1t}hdH)Y{?)!Z{})pVykoWkbS
z|3Xx^t(1R-eW0L-RyJZTMEAi$CEe`{aovxKq-4+A<PcE`mWH1E<^l!#OPp8Lww5Ou
zCR{5>hsn?JhhhHK@B6PZOfFt-Oa=rRgouO?2m?eRgs29Q9t1)Rfv`ioh7dUrq69+F
zfH!>++hDJWKtv!Aqlf?qVFMxb8NpjMh)D?X6h!tAh!DgUgxG};H4x$)cxMfPcz_^-
z5XKN<5FCQQgb)LfH;7~iQ2`<HA%rhDltSo12ucu<L$pJPaS%B~AaoFjZiG6BpGJg0
z2nz^d2;xo%gb+gC9>mfRkH8)s(E=gPfJh1gF^`Z05q*2a3WT7C5P}fG1sp3PJiz`u
zA`C)UK?p|(!3PdW5G)X46GHSs2rY2<0fA^h96|^k2%!oN6A-7NBMABqL5M(bSh^2E
zyAZSk4iW8J@c!~91g%5R3Ir{K!zO3}g5E*UJOs^vLnR1N4^6_CslEaGH4w>q4M8Ii
zGzbnwpnkCLfnGpR4}47#!W()DNASAfJyAOZwSovS)CBhLpn9+`g=*nbRESKd8iFc7
zoD(X8pb`+-hl;>{4$2369w-NbvOt6YN{66FAcAm90sC|)5rX0&C<esiphyS`hfm!@
zAZ~@g5xPLIPlN&>=pKleL4FYA4M83d<PJeD5ab9!_V8sbHV|YDK^7nmN?#f>gCG+S
z$Ab*vvoU(`o=per7a%PN(tr<5RN?(Lm~nRlj)=>F{V*gAL6RWC4v9n1RR|IRaRmr5
z0|`P9KZwVGE3J7Th!eySdF){C1|obcAkq&p!EbWW!+TG}J%|Q^sNncZ3V8pC41!2N
zWC<b$`%Z`ug783u0>S}%5^%vX;t1?35r}DoIE0V`@j(O*#E5Bt`S%{?$wJ!yuKugQ
zU;D3rJiq?ge|_YwuQ^uN!*3!s%B68u#mOctG&CoU1~n{NVzlWa_Pe)OF)~?M7*z6N
z@;++*XLDp}aXlU+q=tQy-3|=F8F>)EDCvRYJQ`+G^l{nc>eca-Ou;vE!peJNp{>iG
zGHdrt%Q%<ryb^p)=3>u-DE^pi<hQ@LoO$<Xe{;6^D)<N4=)2lG-8fgjfBvyIe|K;8
z&b%fFz7-$m2{pB~wLjQsYL4;ZT`nmp=`t#L{CErZQm2eQp?BryJLS{*-{hB8c+<}u
z1%w~@WAVZ%-f@_3i&Utkx+uO@VbB~DE<JL@&{Ox~qJ^`Yo7>lo>3XNmz17v*x4CfJ
ze(X*=wC^vGHoawXd}r_J>A4?>MJx}(t29BEg1o$i(<@W8Hh0yZeq;QW{plRY!Kwqg
zW<JrZ6!#E%wq}^Rep|MMIw`whi^sRm@4Dm0Lwf33T3XWD>8cZxla1PZ_PGqQu!z})
z9uu>JqbS#%kHaWu&XWmve16;69gLGH;Pf7~V=!G<#-aPNZjZhr`*+ebagW9K&%!^l
zd1OZ~4`yB+^oniExO(?;n<x8|^H*J#z%u>x%6?zRw2jh5Jijm$=jG*PWo2C(@nh~8
z7qD;+{X)Rj|G-pgh%s)8gzXs!fq{X|cRtOfr-G1~*$$$uhkKvq?|yzO-XM5qldQkm
z{c-+>nEp&5w^dZ)mNb>MkHfjLf}aia_4~b=Dl2jQ_81S|hqJd$G~Z!2*d-z$$cl{H
zO(WC$kkSX=%e_1MYq%ux6gZbfWQjjQ7(pO$9GhnM4S8h{;L=o79O&=w|GxfYP;9!@
zoBw_{(bUX{Nukn;j|jMbF3ih0bTP?4ybk!)OiU<IBvu(27<vam7#Nt%{}`_<wvRe+
z?eWOys5%Js_OoH_vQwrX$fwx}hHcPz2D5z+cQJ@X5;8Lp+IVP84Rv<Ybxt3iM{a@O
z<m5!*_w8LUh40R=j9#7XWR+P@R9YHYOXw0YF)@W!&p9^=YDN|o8s&($6<+?MGcz-3
z;Pf|i4GW8<SLwoc?5FGOu-+6Xrt;C!&}7kCsrvYQ_eaAblGTkPoBpmP7S9cWOM|nE
z%N>`MhQ7W&@zU-A@If8)D<gYz-k(~BhE(+5gP>Jm_+zVw;%-_-#`z~!2W`HGH#1a+
zbe*x4G4^k>C)hY<M;lAvY)({}fp46yv!87uEaqfn#K_>YpK0*=x;ln|fzj|3RHu}T
zOfIh~2-`~osls<Q_2pjD_PA@?Wb_q-P;;*P+@%L5n_;y6J3Foo;zY9Y^17hRnjV1g
z?c2A{AOLg8(s^QmhK`ON1dKyUN-7%%4-apMsioEC4V&(;TbMuDt26Tpfnle`<<hX_
zLcRysJqsgb26vIfqEk&HB;>UPEcE_G5)vVs@lqX<NNH}f=Mg>86jzgKgd^_QUVTqx
zcJG2ujQR{M|26&E+hZg73dvoL9v%X?COf^c)Yc$yTlA+~xOg!{>}It&#-ji<K}N>V
ztUIcT3K&qx(;#T3#(GqG1pJE$@pAz~tob-v1>6iQB9?3H!9hW<Qu!S&>+*oFq?U;y
z+kYE?Blhui@n{36bh#;3XWROV&u$okZ)M`T@6Sa^dH)jMN6d%8>+Oe|&7ZnBXisxJ
zN=ZpM+YPdtAqaj?poVD9?VJ<Ooqip9w$Fd${G;sG(>b5{3~~}#Bt5XYy1R!XhCl$N
zHu=PI5PYVf0)%i7MzWL~+V+=HfwgrT$Th$6=;0FrrNgMLuTN$-oAQyg(Vw(BdI*Y<
z&TRz0JJBn2baYYlf&v0rI2MB$<YZ)I5xCM3z<s1>nV@W4q@ai%mz0uXeH-@P|H3z|
zoF}v*0sj6&=Zp^y4%&97Y$_TX8m`>*-rJm=?&_ifX%%GV+?n%SCYK{+?{P0y?O&(_
z;qzxl%zZ~LmWJG`xK#Qbb(xtI#wtEc?yNEAE{pjHfO6*?0O3PVv`m<+g2FZk*DsJ0
z5TH6<q_QgYW7aC|ka49u<rI_UxxIwuQsw5lIn!8lcX-s#&+q0;G2_iOI0q9G69R6l
zuZzJzv=s&iLMk>dGS2L<9OR*+qvP6btVv?YJC2>=XBzL>>FMbu;B(lTn8e1##eD&O
zGT59nEF=WFYi5>PR#wLPCAgx3J)*<@=FN+G%ZaSkJO^OHU`l=(DD4lElllwI`O-sH
z#yIX6v5)*E1>IIPYQU}2(NR&I4tWKFySuyh?)oIPb)<)_F9<&x5^frIQGnP5lA0t+
z6}0K1FvgoE9x*w0HC-29Br-EHGM)$F=F!N=$dK~c#<y>cOMPmt;|t*{y^Azejd|bp
z?CQJDf`9;&NB3J|Q&MD8g3pr+5nQ-%;obVWi1kRG+#oX(2yr#~&bAcwOAl>rY;4xv
zzxT)TeZYWn&GkTHH#W%_0gPT&g5etQy6M2D#Go1bfKPt=xW0bwJ*U}o{U+BHyrg!e
zbfN5wp#6v3mZu+SDJGF5ELeI=Du2#QN(!of*REcu)DbX{kU+o_@WQ0)fswGVaC1&h
z&Ko&?0y$k`!8!_H>Grm^wvsLQeXZVmUfUJ29IgTw)5&ZG61r43^5|%&?3+J6k0b?6
zMn*&)hx3B$jGMD_my4B>ygcSP)vnV#W$#$z$ON4q+*2_TF3OJ%$tcJn1C?{FaC&kw
zyPN(-3Wv%5mqi2M&V@{$hFrL-N&}a3;cDn5TE4FC6@_-cA1c_?BIWvxUG8e2Dmnsw
z=+)b^g4Rw@jEIo1^Kp7Qxt`bI*R^0Y)w3pHGI^+7d47sK3_Pc1`7HV`*5wHa3Rbzz
zy?SN806asYSi95Oc$prxbOZ-*tS>=0)QHWijWH9RW3c$*AywIRUS^+_=JdNATDbmY
z(Gwn3R*NCNZ&zM*eA{t9;oRp~dX{ze;k=NLvpa+r0<b2}qyTH}mchcpsx=~4WjCUf
zoT@(^>qW}UT-ya&rP8~Iqe~!=5=34W^{UCE?W>BkTI6m7VSgz5x~oYJA!!}s&A<(2
zjy|+|sA}IpzPfwBEq3lN^u@=P4sp@b(@&tvf$}V|G`~CbJtyPhRX-6ybJJjbdEzH@
z>yuA{DVa9G>I6*I)~NaU5fKsRTwJzmZQhh`6!p%{%^8kd=9;S_=dl{PA|%(-B`b}_
zXKA@CYMvP-s&ZkQ;nGB{jrM(lmn0X=2GsA-f7lQYK+m51*zfn_Ae$uLjo@v_($bQ}
z<`XG*{hG|z;u<sc30;JQgg+8x(cXZ*%bTf*3E1`bYd;W<OQPv<S7XlX8)WuYy(tlo
zn<FCMCpHy6wFfNZ8o>-S`toJCiQmCW;SV_r3kwfpP@okqrZL8~1?23kIkuwtA1<#d
zTX7}7&sd}m`nb5L30fg>&rl9KV1l6Kobgk8ohuW4xvHwFf!cbnw<_J3fP3G~@969m
z`{rj2rWB258G}FfV&nD^UMCavaz$rkXCDML9A0AK@sPvh^cN_k*fC2jaNM&nmRhEZ
zpY|%=cg!}E_$H!|h05#jZ_s^x0&a>aDJie{9B$OlZ+2^HX$6JnrQ5cc9TML%k-XAT
zG<7DhAh|;e<gEN6)x3r{xh$w%52aJ~I$mRxEE<y^by++Kl0<0q(wy5na>Z_C^bZWE
zqTpQQFz)!izYTXylg-S`I(f}|V<@#7<KpArl<GW@9yy<2W@ACXEy&K!UXhdIe`%3z
zf?W5y(~vlZY%td2wAR+vMye@A_w}J{6vNz-hkofDftc1pr=>i@!z-`nALT{8c9LaN
z*`cDJoS4W$FBq#W00Hz|It~xkD%y8<cJyVv6k_uh<IGZrA6Yt|q0Qx}dVM{%ga*~S
z``UurJ$WmXa&lq!JSr6Y2XvSWL-sB%F5}vye73zGa8x_PE#Jn7oHbNI0Ubt)LoEr(
zOE+p!)zqDxs|yPYm$BGeK1(dWN(auitWY^q%olW48)S8<FHhHgKZi%NySpnPf|n|r
zgBo76k3LqQNZK;ne)n#jq&k_u|08TOU|_bz;K#uexTI?`5023JqRu>f{`~prDsT^_
zrKJ&C+Nf(?fmrt^UcY|5u(}G@Q<X!@)^k$zf*TlT&z_B`p%JVr^Q8+0mZ<XNo&MED
zTpX9>rKR03pJG!}Nm*<sD(~MCr4_D?0nL8U*BAFrq1>d((U&}v+bdQhj7Hq^SatU?
zYY6Du6KiSb6|9UFHa9gjwIPlUKPf-ty7lAW>)KV|0|r5pZm6rP%LKb9P>E)D4_4^M
zWic=CraC(B)rnVe;I-|79{4V>*L$*o6wKd>Ch(QMjAdh>Ksi6AaLYHtKz+yG_gH>K
zP7w4!&<B(g<|2Va3up)j;9eQIh=(Kaadk*9VF$bfsKAZGos|GUA!&ve1|`j?XladS
zgtsMKB3S<lzKNh$?7Jjdk&v9CESB%V&VB3CUD6wHzp|s??d;ah&QpUcx_WvJb1k0S
z9N<s8QhEfJ-gX9@k&%{`wy?C+)6vn9)2&^YsGEA|1G<2Z2@ZNsAK2N?x3$Jlm5Zr%
zq0C$s-*a?vG20KpwI=U5CviI~VW`#nPFj#@vOFQmJx9&Y9WvhI@5;-|83MF{kB;Mz
zi6jXWGOhIYJlI(oO#}fv6oC$VJ3Cxvq98ERz3sk&DslF1Uc<g!EM=#mvon`JDgiGq
z?^`N0N(@sc>Km9^L2@3((;(CCPS^4b$Z(4Zh&ZUJsWZJ+iwi58>TKR@KD5m6T$;4Z
z^c{ckq6B!$S(>s8a38N8+S=LKDblYL34pKqO8GWTX~u}7sQz`1C7SoW!u<2L5?fT?
zFV|ZPkcc!pzUzXED&v*ZOUB*OYk8tJ^Pt<zl#pxawUVDqMNJL61Ri1G!$fUEPqY**
zEv-!uWR*t?6u0;G_L6J7;>@OnES<qqLwp>n?(2u)-Ic-`iArxqEow_OP3z{o)>!Kr
za4vC4esdt+x$jslxtuFN=C-KY=uG=c_Wn&hy_dUX`T6<y^h#+Hpa;taO6x&r*f-Ee
z?=kfKs+m_{5(f9o6-G$5CZZPoRllh&)m>={eWvtz&``A=lcb!U($K08MIf={ra9w<
z9LopXYM5F+2JL>npb%IoNf-h#MtgdeHRIab5oGW#M=G31Zi-H@?m1_C;f;q}XyFr}
zztVSfGeF{2*cq#VLs75!EaTp>F~WVw*2nWXp-xG0v7BSjE~V($`1nW($z))-mbQ5o
zc*rqvGpMt@q&0r)WfH6U_+(OG9jFE1ma*ld?AB8IV8ab(eGh&(COlWJK)Zof7Dj{>
zI}C^UDk?_hgPAm6P)F~P2)nZ=+^T6(59&fWb?Vd({u#d*^AO;PMHQ#oe7!+|Cq+j`
z4}x5WU^Rhu)b}7L8aUAWJZz55s#fr$QDiZ%t*zy_T{*D+YU@Lf%~(@0k-Jf@bYxC+
zm((|E(JKPx_8!W)qr=P#rz#kNIbu)SfsV$M-FzE)ILo+N;L1zTL5H?LF5eU?rUnUz
z82Bf_uB1nA{{|Z?E34GjWSyPfxJoT5-R;LJk0scPdA{Aj9K>vM3g1KDhT3|2Wo=DB
z?S;gvmxN)HJy(&^H!_M=;BTwSzky~Y_c)1cx~|NP4u|ifevBA#D_3l|?lY!|Y^Ig@
z3y3c6L6zE5@{)-(i^);$=i>dguBg%Ensf(^y?OKIs@e_@vDJOxXuNHk87>EYzV`r9
zzmCz&I&Sd*Uy1<ZYGsvHT@AOMugo61q?(RSC>G}!2)AzCx{pP%wz?Wpy?9MpFn+7i
z?}v~vgYo_Sv>ecIik4JVoMGi)jHBI<MA`uCs}C5<=WlQb-8ev%xSqWc^nh<|zAKQS
zQfJ`B3)6PHhUVrEr`hyZsL8WTyX7A<jf{qeiHL|?j>%BZvZl1}Q;Qq-=&Ad{e?9ai
z2QCStqpD*S^ir+(jYF6}Za6(>V{<bKx;NiD$Z4|rmTPbnzMgz1xWy{tui!Zmv<pX?
zvGpJX2cP*C>?Efv+E?Y9ulZ`hUBbdM?i_dQ#h4B$)I2lvz=RJVDESCD=+szUpfvT>
zcrkBcR6?uqR9^QBWOV&{H~i!TJoEbz_(|%CrSi28I=Wu8W#WBRcD~$=uZ*u8xm&F+
z5+|AM$bpBAD^Ns-l<8#8{CuX;_2QcJ?VVBO-0aeOMHLk?VqTx$p1Q8VK*|CPpq5Dx
zJaB=8!2`e(`b6@$@!lT3aP|<Zda+O_&myM?pIRAL^)qcX?ZvUCK`B*vURGV{H3kxS
zH+FyA0eX?%;bGN78aR#jybcZyJMnoNv^~2zxhZ{GVdvOGg!IuLUQ9UqeDdrAB|$eL
zrLQDH5xAag5?pw=<cJHYCh4NyyDY4&aazjGwtCAq#0oBprN7QC!G4-^Ez;`B;^$22
zkHju?Ce3moLV_5HC_Q;o+Jzq9KD`(ozMvVB$NRp@_p989IDS{0l7j2RgKHX3PK7WT
zybBh1XKNIqCS;j?uy^-j>48MDoGu$^KfUOTw1e|H&+_WOQNuG0dHUS%0`bJR3Wu68
zg4^?FR?|==<rNTzuk+aDybYqtocb3IU$nDgT{)fHbOTCOYP|CL462mQvLHD_#sk!M
zH!*lQdL)%{YIg1>WuVIG-US0H*0-xR9?qRtEOK?DN{Hvu$etqXQtPmJo5Sz}VLX})
zw|aIP+@7!E^X3Aoc{L{DR>=Y|ZQDyELncZ`f)c+BQ(W((v2I+L7zYnU-)ovm$K*uO
z_i|PbPNfKi2!)0qZXfk*7t_Km4aL@|=kDFs)j;+3w`0*NOzt{X)o44J;TG58c4Nt=
z&q#B|8!ec~X;aF7Wi~Led4apKj753D8c{kTJ4L)WLGtXzF2}{BgKHAcI)?q;AZovd
z=Ec@L7p`kBQJALJY|PQUkaI<DT0N>PA3TwwyIGC2FRaO|W_pqTXay;t=aTEmEK+=4
zp}LGlf|3zM!<szao5xx9u#}h9x~708ay%h#_)#2>u6mrbjr@p}q8v#Xqg?KP?&MPD
z?7gcR2sFNLX!<9KFz`SuEW+^e@c$`W|B?*<{Bx)OlVOUVEX-fz!J7m2T^#3*My@QL
z#o-thLl2f)uX4|AcABAfnlOpJkSz)|*Q!|;@MK@TZ-@7k&DJM)<mu~Imd(%6>8@cz
z#YO}eev;1D-`jaNHsxYFJ-ldgZPxx^`Sihxn3%N4)KRF!KFjmrSN%jl(zt?AosU|n
zQl*rUMmcxtFm1Nj^TVrjH`Xy`f!2>J+@XYRrB)F0($tspXKn5%iQ9g7dCN{zLFt_D
zsHR>?ZG41UCB=K@yC}wtg67nOwvA4#klr<$ObH^wD-0;Nxui{-+WYMSo8OI}KE=7C
zFcTMjbA0}$3|$cV3MFA*=(}FNq%)&2>vdIJyyo#Gv38``Eym$8%@fOMPZI{UR}R80
zmy#J~hrZtwVBs)yQ`zs0fA;jN>u_Rn9b(bSKmHS{jr(-I%|$n|#du@Z^=D^4>G~Bi
zQ7yjUW53nC$=meB=$XV`kI$y<3U#$z`~@b8_m7@Fd57L-B>tvX_!^%5%(HC0CdR5~
zvo`dxX>&(~?`z)Ii8_3$DP^#GX-ZS5<jZ`+R<GtdiShY)UL{Gcv7++Vm4ccRCVl6v
z4Zb*@aa}n$DrgKNt};u=d)fx=qM0J4#Gj(V9~1@*JHbZI!^8WB()de#{4ca|@E>0c
z$Kn%^oq*<aEI6I0HvJ(r9g9prVFL0J(3XycC7>!DOG-dbIu?_Fk_2QVAQ}N>=>LB?
z=O;n-mtRo2wfCyPxxf`PwIn*qb#>h-1cG_liF&>_X<cCG6~S^E_#?NMFJl*2v*XnZ
zKWur3)J)x(a+|{BE#WI!jbXwQWfg7}(5-m0Hg>yKw@$alYg41<(ctp-q%B`+-NEQ>
zQ`9Mxmf1zzzUA%x?^s{P(QrobtnoJ1*()jiyu7?lZ<yH5k@)hLou64OjV9^WlQ+n@
z^)zDqY>lOd4bQIZ9ENc^pRCVS)(Zi<m*(Pd`+728>CxVqO&efx0E`eqdoDxBsNL>d
z!Yb?ab?P7CB)PPvLr3@PWhB2uFO}(Lx1=eSslDUe%rwI5%VK@E@$!z;m#WcEMQW{c
zB%Hdf!JIBu?G`%X-WLPvgEKC4vL)_FPZ?LJ7AmeV4_=$boU<V6>xrqjs+ukG-f-%x
zS6TG8pb;fK;~{td`ZD|I_X)Cf!#A=YN8k5vm0^#I+>9_E^23-rDwh@8dEj)LpzzY;
z5iZGkwCXq;pK}u&VbVp8dXz((?>6{SWyKnr2BtOSrAZC1#MA^S?~;fg(s~FJ#-@#g
zHc{&Y<cij(e|>(9#YgnnqZvzIGSn&2mI0=?z4D!w*5(zAQMJ(zilZ|!dLf}&AVE8^
z*cRnp9Xa8cgi*Rg263Ciu<GTD`Mjs?j^;KE(1_32x4bSZUz^L*d@kO(@<l`UVRP1O
z=QInoC%>^2JK8Aqc`XKqf`a7n#JpN%tl=g9Bvc3P(1mo3+pnZK$CxdHhF(NfN#!M9
zw5ti`M1d21;IF8xhNTd(89>F?zpav6^OSZwX_!b#wYT`z(B@ma%dsuti?(3ee6d`$
z#3hDZ@PBw0WUM1Ea#$I3PU};7l5UMDOo@|YBqnJVQfkUmp?eb#mZ}j-otpaII$Lru
zUJ(2>%<Xft^`&A}Rf1j3A<WL{;OK?2l2fx`l)RxKt%{*Zmls$R?<F<3>S|}*@~@A+
z+^45`J?OMAZy$BOc5C`D-NEY;v2LadE6P7KsfX;}ZD7aRnyN;c#@84oHLN@~(#4Bj
zNXXb;II~SuL)$X@Jvw&g+{M?sb){UEauzlY?VEW6LqtW<?o~HguBEouE2><#$}Ni1
z3KLt7{B}-n@2%ohu8}#)cc?W{Z#TN7o$=Lc@OfiiQ)}(M-3$py#9Jg{OHVTATw$~l
z?wr0s?Mcn^VBElc&uY=(>ss7ZV^f-TlvPPtUAiHz$jND;ASUIJ=6jNOPX<>^DPn4t
zb}n&P`F2jLN`EORlnDIv(L}+ub?9;oa~;0#`yj(b9=n$$m+_RZO?ONWOFEO&e6^Y^
zW=~cSS{7g>9gx2=73$CUi7zX=ya}Iqh;P!n8T=Z(M&qXrDhozlipiBmZA`38-+z=*
zT1{wCv-+Zf&?*qzgG_ZfDU(Kmmi+)<u6q4ra{CX~d&~Aqnv6q7ge?OCas0j{Bjc;B
z268Xm3Ch$W#%XVz$yZ$G`$C|Vg>5Y|H(r&8Jvv2$Ut_^tXCybhXv|ecTR<DIIi#OO
z=wDAAy+B+TU>hDZU6`oJbVDKB&2~5{z3$CiwZlWP^3n2Xd=xu+k5p@#Hxi8G=1dm{
z#dWFOQ4`1Y)b`p$J@vOI+$y?#(=n{{Kxw_uOh~HrKCp^bbR0QfB%VO*I@~c>*St=;
zBN@=1!_e};;xsG9+|s2!w^E6(BTbr8);5!>FRFK>i_~oG0-|zI)B}AmZl9hS2x%$P
z#LmW!`gXB6c2ad(?YTozL1AmnQu?AZ#+24)K7?%f?39ym8Lhi==<uUdjV4UZf+4)B
z?|6i|KL)A^tu#BQd%_ol#4{?q=DeP+4zG{b7)|N!vRwrKO7U7VYGgHp#zh}CT_vxh
z2d7upKCHK$=8tQ|wcvkrK4PI7e|y!N`ce)1=Q_U$S++4!)SP<a%5+KV*)6*?zD1%5
z3}6C!GPzL;T<#Q^g<rh}{J6)M6(h7VO|UoXoH?yUu%<Y@^@`&TDI{KsHS3n;)VSYH
zER&FtqoqqtI#tH(p%=*#_qgq_BcRYsDM9HWiEgx3PE&l{mN%h)p5iD^mK&Nw`vcj{
zK0Uoh6EBuct7KnH8^6*jzo}s_#H(m#;f|PYLECuG*}~g2t0!!r)IL1>=D>04N(qgf
z(0#3vFi^&%ebOk_))$7@>=g^ux91IB7hj4VCw;9|j=B<LVqdSf{ozNJo90)Hxui*H
zF1bOyJw<5+ZDXP*ll>zl0lKXcn&lHKC3$)W%7WlB+S}`MTJKQ|=kUtx90KIl++y(M
zNRwZG?^YRV@~_{Qc22jdur+YgeN<Cfv%N2pxEu7PW=#brxcgL%#Am)y*>d!v=yAg@
zD^Yg2HMaLVrX5_-UxdhyW~hh@V>&#38@)QOw01#ZYR*R9Rd)~FPSo;_0ksWBblJ5v
z%sDYz8tqx-)3cvgPdyn=Y^AO!ZjVk%ubvy)Bp(@FaXoFfG#4k*pL)Ojb$XI#On9A^
zxUTd%>w04$b26%J*QW543o~5NJ&_9sq<UElWwePM&Q8%*0|8>{-Bz>bxooVWH8PH@
z(R8&x?+#OYhS=Y;sJRgy(;`85dA@|)Tq{GVaI`O>5DXW*Ty#EV_k3>rj`bB#42L0;
zhX*$zMcWh<x<wu(309`H>a%?UA&dNq$Kl6V{l+p4-Wz>2?<+o^dn_@{TW71{ZO{CA
z?eOsMt5>VP)>*iYGR}2%c=cO7JUg)yf2-59#@Xj_#nUH!47ne+WC>TDTMe&@iHTiH
zt*RgU%&GECSS9pQnE~^aOa0X>g`+F4Rr;4*l6iar<=8i>60?21y}g?aD>6aIYE}GP
zcW^8AJG<K<SJ4TNEyxZB+@s?HvpD|f(*1gt`7i9!{WoI3k5T=9VZg;<23(5%gRD*v
z%9Rnb%4<0?rhVrvd-7v$x^{9>Jw4Twrxp>bu1~{5OB)}J@<s1vV*Apd2VVUuZlC_)
zy;}!F(!B%JuUb|#@{1Rg2+QJZG<QN;uoZ-Pb!oLttT&jXHm4i=(MsO!wyJ@D5;xpr
zt{m(wF#LXm&;8EkS)ywI$5kmloI2?i)<^{EVO@eoOJ~0)P5qfiE=jaEXGCLeT}Y~@
z)*&+S6ps5Xx|mt_EV-lHsYzypYT(QZ|2E@;%BDESM*fnI#npN}%FBrLDAB;h+p+m8
z3+ZE$%!}TdHHLgd=56Z9e4drpYA9F;<Se``xgUnVrZ}^P&yyI0nEN~vkr0hTTzB`-
z_y#`1lHi_`OJ-5AU!ui#_pDs(=ij9WTa72ni1l<)ofJYM_S$3?-HS5!)Qj$&AzgfR
zN5DnoQ*oqK@kzD^&uV~ekDKQYZt*WGp#7f@)c%|q@|XU8N)>E+LG11{PdZVun4&v}
zPK73~5=E1H=AAz$A|2)dRnw}eQ8z0FzCD}WLm|_PaP0PN6wbt_ACCP{OI;C}qsoXn
zH~%5-6V~vEWCN~LxFc)W(W!Y4bwd)?t}_1oGSk;{N1DzDUI&lf@|TA>qGkrzZD2MQ
zvv1E=&9!T}%0!1Os5>HzZJv&*`QDo-q^0L~5A+{@b+1peD~(`Hl-Wcp><*56O5*$3
z06dF)kG-r1I*fCo4DaUc6~<59*}(mjl+e2%-k7Vr>f+!g(=cVDx|4sC!V*(*=V0*F
zL^{86xc;Maq|Bj2?;{y>qr9=??Vl>7266WYhW7F(JxkeWeMd+4YJcH5xh(%SzdJb{
zUDg7(iRp4j;wQFO1=7!$T{lP``k-2Brfp5@pp|j<IY<p-J@=}g$Uk*e!}UAixIuVv
znQG=9Mx?5Dpv`)oLsivL(LEBZF23FKE>zhkExd=U2c#+T^8NCHe_7@3{{mAyo+$Je
zQ+)Vy&Ox646PNQUx)d}qmzfn<oBLz&KIZgPD&V|j!6cGQ&&lJ%j>VSBh*0=JY}kK&
zo3|^D_R?!=EQmBx+?uGR-ly+zVP1K@F%wi2H+jfL;)_y^p3&1RdprFBj$GO3XS`?`
zOV2prqLB&KxrbQSU6+`1&@*q0W@4K2wQ$w5m14Z(9m89jvhirSLUG4Wd$u3t`+JRf
z*72m(;0+!7OBpi(P1^DXIw-+htsG<Fm=B|+3NOjze|V?G9VOq>U1mX+7!|BHAizY9
zQ~$_G<DlI%Cq0F~tv--z?wX%Liy%cu&z2#+!Bg$_+oDT-r-RJ--cCS<o9lxi+^-gj
zx~l@2_a8X1eH@4s{qSRogDqZH`QlY*FwS6_i|$UXib=@=>y7jCSY8O<hzuj5=8hZO
z?=sd*O4;hI(|sB|xGC^A8!bBNe2TPg1Yp+R6KrA}9|-3r9j7P|7Y)6m(hl9Huckc7
zIl|R}v`9YgKP>W>!~8F7m%*$t0Ck^%30@elu7{anm=H!#!K5({66$V(U=SNn+yLqZ
z<THS!_mP-)CQR@G)E1_;@4@UhV02+j8*v#1n|nZn3np>_E)J+&fYAaR8=(rATO@1k
z1f$;o4@MBdh%bz3$AN<wKrq8(IiR=!S`9#Pz-K4J@Ggvx1Ev_T&oD2Jpo1x0z-R*m
z7|`B;KnG~|F`x}t-A?FFC>ssh|3zdYacrHx;Mie5acls3!#K9#F^jDUv)DEe0I>nd
zJ_z>4Fo^w=!UpuY8F)VniC~KZ==)CudkcwRiyR}^X)s<67;KnQ|AWCsFu@G=CK7mm
z{jUr*3}9FM24GkJ0btu9>1*`A(AVlPeGOCS08l^rNnZm#9E^tnjvYp?=U_Vick~*`
zU0cK4wd61EdJy_!gbe2KXJCvRjFZ7gJQBJFpgkBZgSm8;pV0L&ZVj{6>EMe#0M;6S
z)-YuaXn7ALVl55B?d{;5VHl_e<UL@*0niRc;Jm?`fSI3!iShpyG&NWw<8QM84fge-
zCP|~s<#t)*X!S63@bDxQJ(&aLrQHW2SSG9E(|zK3^{8~>f@)SaB9q?PU~eDE&980F
z^fYEJi+mdKx%;Tc({I?#X@EC#bHk;g#|-dSFOymI>d4vwUXcL80ths_IxI;r*#n@?
zZ$NZ?*4^E01^~18b$4%o4d?(^?+AcYutdHCP(N67Gz2`dGvGC!+`fJL3kY0XT<GU6
za%2Hs+BYB|U>*=;_5e`M{qf^Rg?^*+B8(4#KjwT>Vbt!|37}Vr>(^n%6Hc}}2%D78
zZmPz58z9OsL<wJ%0RZAgm*rQi`VEdI`ub@AlKccfo+uy0(GQr*4nB8@D=#}c8z{v;
zU>edH5MMx6J_Xe3bPj;GF#=lTp_s4G_m9~_1q_qVQ^n)8%XDj3+t(Ffl2}3E`nDqB
zQYwHqt-t`zISv_^&*%>EczjL7YA8!Qqya{1K*BK21@l{-ot+@Neq^Miq{3c1AK}~7
zYw_56Kak3A3HYYdQvh878s~2N(ZORFX{@)MtfpmPu=)bPuB(97C<gNDI}iY*H3vZA
za3WUS9RM%l03-llHg}Hz14|5`!0CF2c|(1D5la{v2b2vdKK>Kem63cvco`f5zI+3e
zW3oi^OiQ)F6N`aIV~@21B;fMRSNX_;!IKqaj2e>6qH{XyRMo8gAaTgB&)S3iU80aq
zpHrNV*r}wq2l`+A5AxnRD#~~7{{<DKyFm#7>29REq-*HT0YO5fI|P(20qO2x04XJ<
zyJi3d0Yw1?DFx(Q<9@z-Kl_~TI{%!tf9F~2xz|#cOSxz6`>N0NxnA%0XR<)lbNvBk
z_C3oc+rb1t05Ung*4NIL@Et`W1BVi+1&O@anH<ZJL?k47CMG6NP(TcLvHk$u{DI;v
z0c!sVK(p&?uw8YyTKV)AXgzlmKxJeBEd3RB$<K%@rkNW*SO{?Aw@AX5d5BcNl{S3=
zkQ174s(eE}3C>V(ZPbd`ErWCCh(_EvrRC^$Bnl=1FN8kiU{%~xaqsKb3ps|NMp^(9
zH=|xCI31-!alR<%x*O0OfH<k(gmGrLr)d?9<e~bH*GFZc_r85W#u_`FcnToh`b19T
zh4@Y1bq*r8d~z0=KGSXmr)U^;ymBT3jciW1^Elv})G!%#(sR%c6vs_|oKf;xhPBX$
z0r(GeLpt!Mtfr>scth{+ryGDs!r7<!F?#BMih^e-*;;j+r=7Rb&>&+h`u3!l0|QYd
zB_-kFOA8C=j~92ssF`l#QHV1zhf_VJ#2Rq!>5uw3N%!ChU$&=#fx-NGcOYPAgmFk^
z6=^}M&!9#Hpr^qz?qQF-rw_eE->I3d*KgJmjAr!&47b_Chm$DIzU0bQ6A{P6y30_G
z`=RlLhJ>F9WG6AsD*ij}39ZE<=NHijAM*jwyy)Ta^ZZ=)Gd>Ou4uDH(xQK@1eJJ~Q
zilux$PZt69Iv#K+Q3j%b)_9pA->Ej@SH><BFjXKG=m(k^U&f}#y7%3E-=Ih_F8e7R
zSl@V7y0!1NF_#IWZDcKFPRk>s94;i35DyP;;58>v5;>=lY%9)}deD5gN4rp>0MNgg
zgqJXl9$~yrjC*U!4(rV`h679lxm2P;Xz)2-(r@n_F*>%aU4&vgv&|G$NZKu1y@-X}
z2DzW){hsx*n%RQI_~23+u<p_61@JxkkLc;IpFZ98HLiSb{TU2*ta&ICxa8&K697C-
z%%9yLpI2gkF-VrXx4pgX3j_&5@9#SIL}@1&5D`W8%QIp7I?aAy&4)ri`<jPf#Ij@y
z>Ns(Id<0urSy{fsC7;CUB9F2>HX!mt=eC;&qw1PRG2p^NLTDB-lU6`WAjTQ(R}tV4
z2yiqzz*i_mOSgw!hZs0dHhOz|Gu*fr7_*gSu+sD_!htULw))Q3S2Yu8pXAQT0~n$#
z5<6Cw<=z;<>q+97N!&#_I7a8@<^*|o2oh4j1W>jtB@3Pt2TI6-)B*zv1=ym*47uNQ
z9baGYGwilAe@w}bGu5?g<snR0;LUub`Z@ZDlXJso@sTPvg&ct2<bTKF%Q`bL*gi7K
zMmySiK5v2U_2fx=MaBJeOBBa!`g<t{4X|E!P|a;Ma@x%<^m815!Ve3j@pl3*&ksNL
z1*v^r1A~iz%iWp)OO1hoxrk|`#d4z-t?6U9z|8Gi1NN`*deCoTen;Sops9VlOLQ9(
z^M(cHfT{pm6TrfW@G+N3zlh>JVt;{8*RJdQJl7bG0WJW!V?+;GN8tqH$=P{F?d2G+
zD3Me2@$%ag+%Ep<dV92y(4>6d^)cyCfxM;V-L0^&Y|WIE>1XNGL~iVYiAC1GKTRN3
zQ1D6un8wHvAJyTKV8nx=+GV1n^XNC=ES++$3Wma%&zW<-N&A?{GAj|Z>zYNdm^Sn$
zW}SXl`%KPag4c<<ZBff8MN%LY;}7C!+E?RvkHkd2IbjVDJtarXslzWcOGd6|f-w3L
zb;m!Hr9A#D-%y_;+iW=_!AQ-!yFpqk*9^LctiUTsG&iZDW}I^7gAQ(*v(L4CCB?-Q
zI0GMQ$q+Zd1Oa9T<7<ld;CEh&*FNzBET!pj*|+a;sgAOkh#w!-i|`~e+BRnpaTD47
zB-dyNFzIBxbIX57=S|R+2_+*A@pCXQj2jnqm)ZxelH~@0!4$~C!UEQXo~xf=g%tHz
zmHmNn5gj(5*_Niwl%+TjsCd3TaVzyieG-T0-s5Ed*BJ~kBj-XmIZO%z_R*^KoktF0
zGK*-61Jh^*&eulGQcxVN5ESE*kdS~{x=|BLp;VwqwkJy45e(*gRE%J{741s!A_>K-
z$rd+hGfWc4ITXJYwB*-x^lHzLeR^)6hgI?JT$+>mwVYF#h5cZr8u86>VueoqqAPdH
z6%oMr0gTKDh_9pqz#<rVn-Hbm;iC$6h~vcpz5Vqx=cjPQw1&5A&mQ}@e>|U+KuUxS
z<t7ik%g`E)Z0*|kP7&oN##a0{OE*x1+pO3gIO1t}0J%pKqz;f^twf30yWYs|x9(@n
zvUrnVE?t-NB7eG_m_-<ox`>V4U3#p}Cb;s9bgnQg+sfd@%LO5k(Q)F)7CmQrwiQdE
zBvw)I6+uE3$ij?`jf|whvQGR$bwv1aarl+2UY)nP5FUcH&va%nUgYBf{v%wc42@IM
z8B<1EA0y_E_#}U(wddoU$VKp&c@v93#DJw+31nUJrHU=4>QS{hX{y5+s{P<O!(buz
zVlDR}HOT@Wk1M(iZpLlXJ;IfYBZ&gjyb;?<h;TG(8w>_pb{DBxaJ|D1;CLV^V}7AM
zIyP3sAP!aq)Pk#s>@KZSl)&#^7TJh=Wqa?f*HsKmYpYu<#2np!6UM2?eEbE$DqV|>
zrJ_rQa8ie_X%>y3FkK+f(0X^bzpoFVNfI2?kps8TX|Sz3i>LA8W=wU9!#_SoWZuu|
z-asna)-AMeSJfDdR4|`ANaZ*?BU!_3Pce74$q)oTM&aOINo8{2UX0|ki}Pw_2{0`m
zU*peAPXYq=DdT)2U-f}FgW82vOSW{p)UTg5456R$P@%zthUEogOn^=_95Qm+k|VUj
zx@?ynCl9&d^5Qb(H7C<4Nt|zs=#%fUQI;RkJ!a9!9*b_3&uEAryXJ+xUdhveC!@L4
z%hNh~tib(ds~o4dfP@8dY+y1(gz7J9v8#1el2A07G}SdSYSyr$DpiweMkmV=p;247
zc|UII{{H^=Sb4J=dox=ctz^K=D|RZKipf9Wcr`Yz>r3E(bt9mk#lf!y-Fdnzi;(kO
z4c1ZjAzqF+FGZji2!8Xa3*{x{M^1Z8g*xie9(bRc@Lmdx7g*Ed+14{qrwfcJh$04Q
zEIYko1v=;2Kg|^$Mf1$|KX-`x8Nal*=dKz;j(7^D1)vr5Y|UL|D<+zDFdBU2fXB7k
zu91^uOf2Rgvd7RK?D=x9CE+7ZkdVM>?9UsvpBdO-N$T+J@|mr750Boh+<QkMMa~+M
z(WjqcK-te@Rn33EK(*+xK9+8p_a&8>ERvk5iB#oIruh)|Z+=ZoVLG(BX%UVUX@NA>
zw)pI47_|9ow(&T-%|8r`HFEN`LsLWIm*wtP<lK>&iHv(|lfo_g5y}+0Q%eS^32>kt
zk>-+uGePXBO#0s3rQ($--lw@AD&W8>Y}}DC!7hm4nRaLnmCf9EB$zjEA#N*V^Hayz
zb0P#Ej8iwm<~lymotp`Z3HelP+n6RWIy1(eciHiN7NEbFPkwH*?5ml>xEE0YBz-Ed
zEoMp?f#h`4ke@{8D$nSX+Tv{iYfTQRNri%tq$56<L5Ig+90zttF)g4nD3vki>mDK_
zFSP%2&9=izUe7}Hanpn7f`qQ_8ndgL1NJuzka7X+>-kIz9MSNZu4d?bNT0%0q4QwA
zc=BS^n(bHFSfeP5I}WVQ9cvNPZnsAruiB@_&)mom$}C8AeP?f6T5sl=*mp)qhK<8T
zcF4yk8oA7IneJ~6S+NZuV9|Df2{`Orktimr`Vuls+S0GE>N(S9xN~ZijELkVwWt{T
zeeLRC4`jE4AtnqXC~)dFQ`~=xmyd@*ZcIuR`pR$^2C-NaL4~^AH|EOak^~^ou5IUS
zzrxPL#f>ktz4@~1ud~<%UvYDC-g^ZGl!CB!aM(`{*g5-((dC$MM-Dj+lnKXc#Z|?v
z(dx~NUy)XW0&ao2#~djPOpMcC?h!hSfkEy2l+(xLe8l19^I~Z6^zW_aeWH9`_Y-Qo
zmtyYbX|1AqRs2+9#7NBS^FvXWL^WmxR;LcdTZ_7*&Nh8G+#%|4^78qur>Eg-30^9d
zi=U_E#{q#`J{L|pEUIk}v$v&|Cie4<&U<o*4&k<)e7T?6|K}|f<`|@H+>@r>r)ZH*
zhT}%s@_3SOnCaPT#7#NfXJHYq7+1{_xAn?h@n}P;9X)#knz_RPIi8*a^Csq|ZdZYc
zx!dv`eSY+QVy(uEj(bIj;XZ@f73Pfhz<{4{MerzA;L!W<KRrwU^sq)bc073zg%zV`
zbXl)_-QJ|RV|6HUdSY!T2!)xL`EM8C$b`jH^Zu&4yu1twi>1FdWP=&8AUQ}~1cDy!
zXL5D;I`APEiby}+Qwqy`fcB6IlWC`_e$i&PfIVNxg+ygkZ{tbyqO0W!yxGgbUwGxo
z;G4rCU*qXffBKOkQf>(7McVT(oYbX47%(codxDXZ3LTy*8fkUs#sbg3m`{E)>kM*;
zt@p9y+I|UNDg!S&1Vpj`Du~5uj-v<>#HlkJf%lW;t_~R?-o@ZmExuYia<jEv9<Ub1
zqE<GZmgssUPw?!mBmFBaO--L<5uj>(fp__Y8faGJidwG*n(LeljUqB@-CnnHef*+W
zaQIdwnZn;d+?X||P*yXf^n6*RSw4EP+@98vMl0F=*+P)^T#<Xz!MmB)om;0<(_bEL
zF+w(<<AKJ+*2E1t&%%MGr9xY&g*!}P7vG6)@w5}ejuOJ>-nxgZDc1h*-R@v}z%dli
z%n#wV*m35*!Twt^dhs-E6s{|nj&DjY_w^tld`y%xaVAyc`WE-1L*hO~qfLU-43pNw
zhcVZ2@^1Rgbs|ZuDhV|Y>h~6{O@|h&PfcSZR|q^mQuj`yUnAq>mpI=N;@0aFsJ(g3
zSv=_d{2xCP&Du-uzu^PD>B3Av6+=)b8M$)V-Yn^Shu)atz6<&be#n~`e_m3m&JWIB
zVk$+@-_#Ds<BzKBz1|HL_}>0+=5}))4HG6wgt#e>1v|X1)%cN01)=l<YcJ=D^!b^y
zcWI{hXp&pq8V%PN5iI7T@Iepp$@-dT@psi4bYqc&9A;M5h(Zl5EkozL32vmwsW{!+
zH%9bUOX(^ZzLB<wq1GUl4SMMujrF+AXe!$tgz}9LI;gsOf;_U=UUKu(%+@b@JN?%S
z49S^z3Dg8HeK6|!?-)k5t%VVER(C-7_GS^$s3*n0Xmj(<8*(&T&8T~jorI_0an^Cc
z`Vr34wLet2L*#A}E2b;iJW=UgEsq2-7CZsDJY>P^KYb*}Kils2sR*Y7`r)X`ZOx8c
ztXEaOLFB6jk;T_Z^`t*<Q8<#dEw175##r=Ps;|~srNEH6Md#Ebg?DcqnEJ)F*Ww>^
zEaSw@Xl&5i>$6$ny?kTE0TW?CLcpZha!Oi3Ooy!V5RSupLbE>f_^Yq($NOKB^ev$A
z3B2io1n6rI1ZJsuL-t;NF>s#XHp^2E9+4&zA6Dn6ZC;a5{`w`Hy3s=X=iEudVH1wU
zkxId9WzJ|Bpu$EkSOXLQ7sZF!>8>4G0n~^P8NZc#Dbr3r^5gFk(|=js2#JXZ{WCND
z-`)297o3&+t!o&{2Pe7^pQJX|$13CQEq1!9F&=UG=Zf=OPw~jM(TX^^27NKuu}KcJ
z1>lVF?;{3-asvud7)NDy4bfB$CJt-bg}aI<VtX1a#wh$~BiB3KP5IV!Y{<ugZh4;A
zH=WDfbsId{czE~yfQgCtN{Izu2-S=v8>=J*(?hit(jhtNg0n%p@?$S*k*O@~!k2+T
zqb5eBd!7Nc<V&%V0pM@;$|DC`htNa^!Q!)4Ti?28(XFK4bSUj(5`Ne?2h{Gv_=)ql
zeutX#57}xA4!-me!m%7mcPGiDX1O5ja=p7NUp4i(SxwYXIGDxrO7wls8BJW&VH@*<
zkXLPIk%&i+%%q9t!)Us~`E-Ml$!z^RM6ivmmC{T0_Q}&n*PirlHbH;CvcLTRxQ8)$
zW~CdR<t3jIUXQEUeQS5i#Ij&Re52u@To>qvQ>wYz4Td7J_gHF0PBHRHqW`Y2z#l`$
ze;nBf{IeVWb!hS*JRkvQ)oj371=y<m!%*cPZYm&+4^Bz`VWRR62NjUL|EG7#|3`M!
z;19J5jzxg6$^QUG^>56{^4*L#CCFmLRVoL|>lUcVm56Q~Utjl`7FB6A`}1%=aeM#i
znVY!k#dwH+E~`0ffDBG#^ERSXpgq2b$z-bPP8}OgfQUR+io=TGM38i0g-fpGVktN2
zvT_)LKyU<OqZV$^UQri+$?bmI94UYG_7ifbIv2k9!v+3jIkPU^_QH<<iKT;_VeSxm
zl&q5o_8a@qYu!;7WTHkEcVp76)+;o%dX91%_NIG=n(r+anblH*g5UR@O1kFx-}ghj
zTgrq;M04By?8i$L)`r)&s-=!Qw&Vz8_C`ao=KZ$R>djk}8|ql<e(TXzb-`WJU1KT$
zu$TX^V%9{hU*wjn<Tx{BQ`-^aoDA3eVy=x2(lN$nk|&i}t$c15W!eG5fJ-Y|AZM8u
zGmVAIgv}&W9NoVzW(-Z7_!*t;UvoE}gd^Y#BN?G_zuc^o4AzO&<u3fzEgx67mi}tk
z!M&h>hxSy!i?`F<zG^l()>wEpL{`^AAy$vK({&M}HP3Is@9H3}^6f`fTs10^GI!V3
zET%I>@e!7H?>`@2DWR#f=F~xMFq<}R6?z1!7@8qJz?g<aTvV!`OG+;%$SoS3zf%~x
zf^yIOhEJFVKr2pssNvj|&}8Pq)wZ38l7+UQZ?5;!SK1JqlDrep$imsS#yTCOwq|qb
z7+&Nm@|P3kWYUeD-;15vL@=!{EF8<ZuizET;_Y9R&dzI@YwV8H7A?zP!g&#fF28><
z_b;Ng-tkH$&#jg)9P{(&($V}KR)_8C##hOVtG7M}trEIYX@EX<uc(Xa$tQ&0nm?se
zGjefcqRSOmhtY_oap`)xU7Yqr?{m8b!kL}8o7CX5L6B4hDP)Of9Sfe?j}V4s#4C8e
zmiKp#`Gw5aZqJ{!8V>ah&{Wk!?3R<u;i+@(t#u5pZhf43`eTa^>U{}IS0F<;%gwLg
zC7@1b_5*cf-nx$dkWqf5gBy;9b&V`EHg9WOH2m1Yo7QfB@1e0TLg0+u(hkEtKd}S;
zcKyWC(@ryo(xM%@vb5<~PT`(EeXTVQzcf_KJg%%;=-lJ>xJOn-(_D6+MP5^YVmTpY
z!6=HtY(gn-TC0%fKsc!tUtQZeuLv%zDuCO4_=9^wh<mlnvpcR~*KB$56<p@tNa`}P
zq)bj_4yUo<_UiQqD7XFu{24z69B2L%OAAY@sWob2ZKCCd)~Dg1)WFh!RB>V+Yqu~&
zGW&=qm%%#pE7<{)R5%phHSm_2$mb^Ln<+XCdL@6>98xb=sEy<vf&+$RTu-<1<kDVf
z39Gx&Diy&@`#o5rmp*>D)0)w%{_?7{r#puGrmNZSQf7@VwS&~1WZa}K<B=O?7_Nb(
zcBy&qow1YDyylNI-J^PWMjCy?5x<X__2*}5XMf@%n>@R7ah5rBkT$HQK7#u$v{7x`
z3B}^%6}!T??t=3o+4i2fk<>rRvspWa=Zp;v^La-auh3erPSlK!Wmwkdx#?c-8L&1^
z=$NUk<9mKt4d=PoNP1-W4W55qK)f6R9+YWh`_txp7k@Z329eA;5`gvVTw7>CS!n%u
zNU^(^48D@>%4za+xq2Ns`Tgb5xI?aRH#DVi3)hTde$kpwZPM-qp-`dR%BVhez2mW{
zV|o9v!s+k%H<@7wk`TL843+h_Mj@)DPnjHOOJg1F#wPDqI{Y}%XuR_n`a?Cn?($rC
zLgZ99{tnH84CjvU^`ez7jv48ErrkR=9!S>`@`Ked%`n%HNqMMQDTh0DB~<zy^QV+g
zRY?XGi%)H%xHb0k9~~e~9y{x;zJLF|-;b`9yr|__>wfbSYPYZMMu<kEmh~kd1$^+v
zC>*h)>W#l|_RYIIkc%&G5fWFV_4Q7{0kYhJi{jajV{UhG9pvRj+Dnyzc5#+{JKff)
zF{j?2@{*}-o+StN`IHc-^x-QLE()ObeBMYN*-(d-H0(oURK9qJ-q5}0iJG9u^Z5sA
zpHGuTTish@g3tM+s{7!Wt#{N@F&M=HZMDj(cgliIb6MS!^cF*{O1WEp&JgG(?&{;a
zW4KBtGUHlJJ^l7H_jaXB8pXc<R{`gH=|2?Wv|C!0E2C{*oAYEf-qD8sz|yL*K^AoD
z!AG+nzPM8Pju@)1fS2Psa0nN=p$41`)ss|>BWmrWa(VSK7mnUV3)-sjc(24NyU17l
zw@h0sIOYuT-G_CNFQq8=nO|O*LEaz1`Nsqg%9D0Yp`(>rlv!ijdam_LU$e5ZD3^CC
z_jS_D+lL6;xLcpq2@9MnSF)M?+T?X{TifCOO6=Ng*&v!X;n%s=2ghigh|SuX6>I#m
z!c^|L`=H}l-PzD$=YtY$P6!f+C{p|9{5nx7{b(rvIbvrgAX~-5efMIivdMjs2VPWw
zk8qWI`Yf~Jmn~<Yk;op{X@5HlT&AdmhBMO_1#>oZASTfQ8fYJ<?9a6AU@d6AXzd9O
z3CX;dPFHYxakcSC?B#M>V}1!-Mr4FVyg75r(a)yu7@Aui^d6$JE3M+UH_#^eJ!#*y
z6#*0+Ab6LgBLHGY&&E5Cpn}Z-<At#z+T}wCrOF)f)5ZmZsycsDL*$J917ajlQTwCj
zxXm_}pY-*Eul}w=wa{OZHGXkXv46%@f5rU&!MN&w5)k?~HkUaXuKlujF`*M=tNAV5
z=>x;guXO0E#`gA<2&ZX<!$F9De+%uTKAf53;{$aYbJ8(VjLp!ESn1=j(+{yjvfaur
z^FsN;?glz|5a|~g2Ub2=A3Pz5#~Lo)!@T4erPyH0vbW+dK&yGv`qe(i-)Pt2kZyYQ
zVR+eWnDh-*A6I?!^rCU$L!vjGdi%w+KRVxQt@9?GPfxxjHb&h3+#V4ANn9{AP|e(Z
z?oq2sLZL8~R>OBziK<~s>d^B_@Tr#@B~SM<4r9H(E=LJDsrToUU{A#bmF|6+iy#P`
z*@a48yxMEN`MNyZEJJY@Qet8DLJ}>I{!Q0|+Tjj_h3)%3k+YDO?J<~yE<``d%%-~>
zPOb8j_Q{r6p)E?;qzuwZk_}f;(TnaA9HY12j?;b@$;WD@^<oAOrX7Uc?C>OiIATw^
z$*oavC#jFjqzfrJG>Zs1EGK<Dhk5^C19P05hhz1+BGD9abLpMY52|q5J&A6Ek5&3e
zKV36@na9Eo)PJ`X{Y!c#DE6<e`hURq@_$lS{Tu(koC()HS+eLU`&*qF^s<_FOK{&F
zC%xV)e&%DC6<kV&vu~Hk<m2WSL*p4w^Xw7wRoYkbanmg)=>sWh)|}q3-<kb(VWH$c
z+4_&7vu&lm<=A$A9D|bZz6?|n{b1bS%xhjMJwusz|BdW2lE}*P)Ve27B66_P`bYph
zMjc<`_6MIXc1-!It=uP=ALK?PJ?;m5JDYWX?)FVZ5|h%g1d6_p<@9+fiC>g!#4c|n
zK%2ZmIGdI7oOpl1#t7ZYyr#eQMo+s@tSLqifBl^XmNeSYt<)0i=kfVbu~02;XMf{8
z7386mRAHOk1+4NRqweC8NxhPRlxzo?>fM7$`YMF6p7aRMLBL)$27Zq~%2xju*%Hzc
zLSG>s(l@X5OS&7qWP85tLC$_FmbRJ+vdu=D9AUb*#H;w+<LN5y{(i?ps`%=W%!E`i
z;lNd`tfC^jbyhL?%}?EYiVN0^n|JiOcZ{jH%ojS)@8N%Y*WFzz&#eqYG&c1i<zYFp
z5Qr;uv9CU15ne=K-&S5set~{5G4A+xo%b)uUWo5s$mw5`@BfZ@R`?&@`TsZMlpq3t
z_Z2tQq@te?QQjS6SsyK1SM>NWG{E|W>V=w6(6TIh{0|D|%Pavt*sTcCFQ0<8&@~jx
z858XWg`&J_vt#&@$>)fMnrvzM#Edi*sD=}Ev7jRsqCaZBK4`7dz`9H@F*7fCBp_vx
zQ!6sV=n8F9YnQLdm%78Zn%4HOpMDwuP0<)f4Bp#(d)ua1bCkH`c1n!L*B}conPGhH
zt>5_)Kzo&=`Fjqn>Pu2jy_Q9wl<P6?zrIERjGJ-$zJ8<&)^(L%uuMc>0$V5d`FKFo
zI&1a*9MAP8nHyXvs*>^)Qxzic?Qc5BpSOcba0m$h3y=S6#`{lp5Mfb3fKvY9G=YOJ
zAUXkv36M|4Kb$5YHvv%z%zXiM`QQ)f>HG)t1ZKAYYy?;+Fy{pvXvQBN(Cv>iFL3V#
zge1T+0n-VbbOERd5K+K%0+_Vz4?PM<Qs5H|tabstNrFNPQ8vCSC`=NV#s2<>nXd1@
zahv}JZRY;FhwdL}6A+sK*94d$3fIK@H(V2Ntbo-7Kq3m%y#3$2a=ZS3nhk#$<(mGN
zQ7($meE5ffW&VrM6!|ZgToj=h{I4_*piKXJrU#&}{}3tzCt?(v35ZnyIs&lvpVqkl
z6f2|POryWxOfr-&?mtw^fOrMTpMNr$fSE+WtboQOL|NdX7}`LT|1F?xQ3NIi%I_Ct
z!VK6;0L)tdp(_D$31C_jY6<vDfW-3t4@e;i|D#aGzYYBSuV$nwv_nlwH!vUxFKMD8
zUJ?_jVx>pYMc=^Gy;XKg4v#81!bt0+j;*di>j60|%;<XQ?DdLMeonqARx7>bY3>DX
z+=zY1kMYOZD-#b_S<1&^l+}!-cRA+7Tq0cbs@zh`&q&W+kBq3b>;fy%Ahut85)uiM
zMTH6q3Mgk*88I=jWw7@`0tgQvSdT3%Eb_qxQc0*2d@XPR8VZ1eUcg~f32++Kz=kP#
z4i*E0Hb_{r5)u+#yM+X*s^fAClaTHM*F>}#KYwrmLna>|9~iJ*0eFFsh=|D32L%B9
zoJZMv0<+gWa6ql~)f!1aJ9pkJmejBp>-w$X8f`9<qENALY^Jyqe7o<a)2AmVZ=K}a
z&fO({)-HWLS)88_J4JDzq$DILfJA7&5?&|hc*Mef@{YhQh86jlIkvq2RYJ!ip01)s
zscf0O__#MzW~>!UH{F?*hK2?(qpm>QjrxWt^F!cx%MZR<xr-VC{!t}})ygRIS(8}p
z4KJ(FuMvAC23#-$)38h?11Dhq2%O4VrasjG9Q5qs>Nnu97}b@SQdDhhY`_g)mv?Wv
zBa^Eg4;K`kevx~EGnneh4O37~(d>Xf56UFrCLjL3;w(hN&C5HSK-fczbqlZ?i$dIL
z$kWQHEnSBWXEWkZ>CK*jYw&So^65aQ4vcmf<xh@}kEz}SCfsvD)F9x=IU~mD+naI^
z1Fg|*W)c|#ttqPJVKDgMW+n%2I>mD04Q_5%PZ|U;u{*xF`ljdtxs5zcfOa^mxD2jl
zO&DEsaC4u?1`g?<8dZ)|=6AKra4R%lFs%XcvsS7&_lRNOW_*L1_!%E;x%lvD_uc2i
zk-{E#^n-(?V&vx@iY>v7%WjOO`rE!WcyVhV#>@ZMB8?*dSv<U>gPOBvXh=EYGy?JQ
z@Pl#TRP6N(j2UWne|*c!;Y*HmkWs7BDkUV@fC8e(kwd{Ljj+Igy18-kjEahiex$Ji
zC-3(t!lG8@=cBIYVQC2XQoc~y{dDOX<#c{>p_bIsvYjxf%f7!!Q_moe8xZ=LnbFFL
zM!v49!tRB`;hVy_r@4=zl9QuK^)JQv@)5<8Lrkr>&s?(NhE3~g+aVKc4)SN>G@@~>
zZN$DB8o2lvN6qE=i*Vmb%>sK))5-b^G!8bqepvKQm;<CbqocFGy;Fj?R!3kC|30Qa
z<$mW4y53D~Ff?*AOQC`DPDiCCJil8I#&QDp*(q$B-tmc=RrT?G8*<!kX8%D!OVP$~
zt8Q}gVN@ePX>G)W>LQ_%z+%*EA0f;mG#KIZT!QkMdyx~f?Ljj-bUEyaD%omwGoRNP
zzpFLq@f!`fr!QvVSE2bMOL!IAwj^g8nS4yAT;<a~RL;t^CSRHz4lGOc5;%)*JEN~I
zEyY@~=ei(Fp=M6wTVHKc4YSa^8>I6L@F&CSSOhc1GI=rMisccBW|1-N&gCw5+>tps
zIn+%JMLKLgIt_dL3QeDh1|C@*S)?s?b(*}M!~M-2@|b*+&TI~h@qGR?C(|s#IYHCo
zqX4r(2~0ZJ%ctC;gK<kM3zYiGD^er5M(OZ6brly@1=k1@er#VbAZ$?6#YUPYB07@!
zIZl)Qo6Y*ikRFd%5_?BSWu7_|mfJx*10#S#bvjN{a^|mHycPk33VOU@%HsT{9Ep{}
z<xbeMswM9{te0k%ybozS9`g2C3GLUy_iOJt9wqKCoOE=E6PY}KFz-0Wy8z2;(^A6{
z?q?7bGk#S{K6`Z3Ox+XlmVs^SqF-xvWySPMJ+))KRd2HH2G6uBBo$sq>e$RS8Oj}R
zL|rsaG#I{5o6D6=QWdY>AEW%8eba$-j79AWLGX?BZtE`mlD<JE)MSNOW_BeGG5w-Q
ztFN9xtVUNQ#cg);=&JOtE`6no(9t?k8)6<N2*zpth#ae#ftTEcw)4I&)Mb0k;!DEM
zpIocmP7u(CloaMgQMa2!tRIFF)!E+OX;E8%Z3TQW_sp!BzZ?5&{Z-j9F0+=#EZp}%
zlK^L@HE5jCnNXp+TsYq4qcYcchk727r(n0!019}mamj%}@5rQmO5fO!)f*HrQf`eR
zL#G;Wj=LZmyX{?LNBjfjKc{FrKbX6?0cWYw-FC3lgvByvgq_9huASZ-VKF7pUj!^(
z=+()RmGFPfN#eV3u9^B%<74SagCPS2LF>G@;S`dkDZgBxuU&%4{poE)$nMo8Pt!07
zvbw}kIj;pYW9+yA^P6961l6dQEM}+rWB|E-X)=e|3RURig1<LP5*`_CSq>3-EQr`7
z*yQSQLm}%MYq9yD8@+(<k6uq`767Z+5?rez&2rP)?2#|Wk9CS$OYe3RWE6>84?gkA
z8MfZ^&DsTz1TsdoE|Ca0qssUeLnj3KwJkF>rKFW*TW4WIt((A*)QlN!9djSInz24i
zkx~dc-2q2g*c!a|WOOLJqLguk_@=g6<ln)9QgfypOV3HAoB~!VSELe3>piYnz~5t5
zH!YV(vFXa-2+?@7!AydroZU3Zfkjah#ENegR!Mz{DQ9s(-aW~Az{#_x*f|<<K~0-v
zZY8eA^OC4hLT^L~ThvmK*71+0T#59MVagdNC+Fvq@_gTV=%+!+2KRgE(Tfq)rLFG`
zH%1|uv~pdZ2t#|<NvHme@4PXxfm4qlT^PY8=H|C5%kvlDzC)UpLI<YU{42&3r;J}1
zAoUGohU2BG#4HpL=?6_%N=axZGBIrOYb<)l@6KJ#b>=1|mf&NX&^Mcc*q?cKLcL)Z
zJLbto>-1zbU3{OMyn8ZS#Pu%ilhDXTQ=|HAn7Sua4<{zNzZtn9v}fT`vw{IiT>;*f
zBwiySoVPiIxhV_8AU>(ZI9c>cdcS)#15)BBb#UJRFFF+k#n-k5L)ovev;n9TI3+Lx
zi-19&?`c{J2d(Ti%=&UebiT+!yqqwk6z<1oGCkA8)q{1sew`4*$6=rX{NJ}mfU(*l
zAR@hZ=dUi#4k>tqCiX32Z?o$hiv1aR^{Q>(YKRA)_QzQHSp^KL@QlwypfMk>Z1N<S
zw(|1uYzjX?qTpp<G<TebGP4GZzVj{a=}MiOavxn7p0M7yTP6&`p8GAXkTUSqE;S28
z$w&tF+c^A~7S3*}@9p@by#kzE9y%u-K_opd7G~t}JLLoF8Xw_c$B>Y9&BosA-;$~T
zRz2Nodmo~3?@8Ms)!pB#$?@^nKQ=Z%95t-)R(QYbPc+he91We+cd{dvA@WnOr6!=c
z8Ai%ZLqktrp)W9gQxNm^?HOYqDKZ>Jbw<{!rD;!04ootBHR+xGW-kM>g5dR~r8fW5
zv~qm$MffxKjeFV~uk<oIZxJ#M&OQ2U^?3t?SPyYa)7-q4os5ks3%0dj-_5p=CnvtL
zH>JsN-fCz``>AgbN#4&&4o64|8_Z3*ASG;BdE=f-ZokZU3if1LoP$z6DYmyMWj-_9
z7bGPhB+RpL_3)?%kr}Xlk5?|yy+q8;Mu;isM!D`{JbiaZLR4CMG9O)Y7@GZQ`1tfR
z_ck$DbPw`H8(i@J3;;UYsqIw!>b>r;@7M!mXXe2_)P5=N$$oEqNkur2oJ=rq5BTt$
zTwIBRYj<}SIQx>L;=rV&q|ZYr?alSk7%xiQQE0LZqRY*+X_L@UnQEc~F(rwMwmGqL
z%8KcdfWoOyz~v{`ZwQQI;qt~D><$c4yG?5@S=RJ-O1FhfAD-K*4CL(+R=f>-Pyoo&
z2|!<6qKX}W3q-RBaG_*JuU|{ler?QBH-mjX0Ct#flzzvN;j?YL`zg{F)ndy46h=h1
zh4x{8S`zQE(ZL6tNi!wZ<T3k?56w1j5KEG+E815zw1UVZSoU`D44b?@@DHA;Gi&Sl
z4LopxV{`zD(?=~tKY#wLjBBEvd;k9V7B)%Yl(7}KoUmqY`wHjtXvax|2ReCr_*xK1
zZdO)TgMidT5;f;beGv?RcpF`O?!Q4q8720hMYZgsAN#j^GxwfQrK5szd=OiQ^uE6a
zA}5t_S!)o|a)97sX5SAK1E3rp9u7Smq_hIGX(Ao4a0WKv?7*b7ySmyHW!FiBbqk0F
zQ1LJEGGKgXh$@4n>2pt?c7JFP+?-{#Q7)MgQ=J3zMw;z|%~idvkE^p=ElOKmu<q_V
z>x$Wr?uof+YZFRKlEf<lnG%{0islAH^rK}UCIF;x*H2U}iYuVjc^`Ux<qz~pjt~d}
zRqJ8X7ubFS_kV1v($-dC*_&~C9E`uNLVD$>2eZMQm?WIRs=QxzPdaUw#c8|b1y$UD
zz7Kia+S=OAx+;kFY?w|MA5pn@lHPeYHFbZs3N$KkXl?@gh&`Yx`BNSN=*j-n;UL8P
z0*1e~3@A?_2Obu<&<<IFwapj`-A4(fv}LZ2N!ut6_{ox#fp7CzI29#jmU?!I>aB)3
z5VInSz;|faGuy|J%%V_i`OTt;z)q#ia&$hrxcYosf+$`Q2e@z(yZQO~t$MW4aw59A
z9-sk85wp}P7}T>+{G-?bQZ|-NBQ<cDny!oiebOcrJpL|S6Jz>a)F23#MZ*|D$<P3%
zZsRPx&+-Xz+6<l1i2FcF+>xZ&w`ZL_5w$WsEqn3>=)63c7zJik4Gqa9;y2Gh^@XUZ
zbs!N@HZ`TjL5b+VFiIL79aUGx*;sl8<O${wh`i+x8r0LXgt(Rx9Sl{>?+FPw@&nnM
zGWvRY-@|kLRFUxa#DW3YYKbb5QL5>(_NJ|Q(PacU8s>h3Ja|YZIf_z9hH8zTo}Lb!
z3=pUlA@}_{%y~R)G=z^pb(8C02ZwEpS%B7Cc0WDAv3v3IWg?WWbRD#FG4b9I1-3f>
zF-lh!7aboTuR4{x_!fT0_98OMxe7~Mk-ug30GH3fNw`go%Egs|C``17SGi#A=gcE8
z>&(uA?ILV^ToX|&9&&l^b$;OgK3K)&%*Vljg(8$HGARkaop&)D^fr^5tbB%oK%jt5
zTzLF_Lm?=;{LVCd-)}(kuKjOU`m}*@^`)8duj^#Fjol-vy5#y#m}X^_lrUTkZzT^5
zC?@C}0A)k*XQg+H2(Zru9`*V1rNCzV{LQV9#C~A8Dkmq0ZfRz2p6DK|Q5B2H6k`_{
zNDF#MFamCooIP?iZaOHC{n(@>*}8N&nsJs@8OPx9vzCgA+chhI`s5PUeM><>!L)HN
zL?^0`Tq<kq1m*t<BGmv8eVe?`Oi#CtB_9B-bxX*0wo1R^QJp>DXxTYAafvyA=Sfd(
zEgs8b4-XHXn8|%VPr;5gkDxx3Mh|Qoi%FJX-IJ|Q`e$mZ>dF1-`58Por0hE6#tV3}
zmjHoyQ7k5M<bFf%!}2oK)0m0t*;&2$cb|U%<&~_Nj!q*Ot{9v43g^CVZn&k(=@0z&
zs8;Db`(?XBu4tHfvT*m`O0~4K9M+6&%X19l0*w=Y0czKS^c!&UZunel&dwFfs$8ww
zY%(!hfX8ziRP(T@5G09zC04HZOo>}y1DK?;%Xff!AK^3|C|m6rTYB;V;H!KdzL%Sl
z;<Y&tPfC>masnU12e!R!`iGQclB^C(=HDpJJ;7yy1O;`K@6W=aj|VglShZQ$?@$!Q
zn~gx!aS-8s%GK|`eX5Vq_e!*Q=<dnN!jkh0wbyMkV9<|}?|6}s5sk<y;bv!-bMB)e
zVwX>r+m*-V;&SLT=YbhRAPGfcj&ZpYqwn6mA=E<dnj`(xT9&)=p3Nqk^UMZEEvvMW
z4Uap0tOPHwHpjVXTmi#vYo%M!ZGJe=LO}H_m3!p-l2q)(*w{@BB9IK2N(JRoCaT3m
zMJeroUv^B>s6f;ypCu3;sUmXW`bhX7w&2fD`{$IGf0yJ$Wr9#iP9b5je_>pIrN;l0
zS<e4CHAsd3QQh_5vSFrgJtAa@g1MNV%n|YpmiF4{$yBL$mWe*UDsi=)4Z#!+2@`T@
zX5JL)#3dt38lC)7^sO;ba_@nOUv?YN(43$#q>IV2J|Zb@kxUdO)c$VPA$8*g0jy4Q
zDGg$KEBS-x&~F^Eh{D~;`xeSpdzi%JyK>my<?&Sm-@4R?B5-+lKCIukl4v#buwsJN
ztDMs28B?e|Ibbz3Fmk2=Kj`$DWlJjN!#+c+GMT*K^UkL{s%@+3^Lm34{zAhae$A|T
zBr+3qK&r;N>ve1$xSxc(xV*~5J-|IK=b%04xWK01r}a;_9-`=qK)aJ}fu>-8SVxv6
zBkEmRV|nlKPyy!TO_ukoyTVxq#JyPMi)t2Kfen(UY8I`&pNwYdtB=?o2oKCIR^T%^
z%@&8BEYq2GL@ruBT`hj@>*PV>OO1bVus|f6s(m0FKBe|HU;Hiat(frTs$tek`m?M|
z>1?~ZKfFUbA4Z0+?=*Pa<F-Bvmaac>c&*jY4Xb~OKe&YXX;tv?_teS38@F5KUGsSj
zsdFScnznoF%Cizl4=%O&L#m;&cV*1BET1I(F8i7LuG7Lz9vUiRaALfe`7<2OU_fhA
z_@rIXQzv7amJC<7C*h!dAmQsOZcq0I>d!3=243@N9F(-87-v7ba4$Q}7!jQsmz@oH
z6b+0Qymx|0e$m&Ld{|q(zCr$oi}3FT&0jtc!vFGY`cwZHHIV*;V@3?1kH8jT1r6=L
zr`P{!h49}K>!1SN|6xe-|Ha@F*iZo10`WgZ;{NGZ@K2`#=0BC-=+V&V{?ve@MEkGm
zZ-i)Q=HB2Juq*igAG#F&M+xbFn<MgFtZ2qahO`e3Z=GQ%q3fE<$-bdFt7KrJvHuWs
zt^GKZ&;n|#efB0h@O{`x*9?`<j;AlT#X@B0$*>C_)uo$I<Dlh|AWj4W6&~jK^uC{2
zozd6d-~u@#qnd?>-~u}$e-PdY<Y+pA#3Trtp{R8m<h8(h?BVAplA_AogOdN#mr<)+
zQw87O2qcLgsGWT|i`sESpn{lLD|t6H_lu$`$jHr-ln`7V>z>|TK}gWA)6;SnuwShP
zJdF+;+3DFC%9tGFKt<C=wm=Lw3S!yK%gYBI^Q`zYud@}a)TnnZZ}0YPZWd36pd&Hm
zzQ+#G2xCR~-@9=QHp<@s<Kx(}($(47DJdh<V8D@qaxe!Wz|l$)NT#jc24(F%lIcWv
zTwpEoF+On|u;c+aeJ(76F3|@v+{H-Dz0vL8X~EC~3V--Y<bMK}W6RI4zy<-_I1AXc
zfjgp#40(6ZF_E!AnDQ@rnN73EfK$1=G9^UC)~pOXV5IIWueS?oZzGvcFq(iwn!P9h
z2MD@Rqrh2JleML%r)M(3j-tSPoTyHN##FBniv?!&1}-;mo2)VR#a>w>{uBiBIPpdc
z!~HkJGt`U3SYsC^B?JY3v>Eew3Ds%5c4vku+ad|IzN^Rl(xnMXg#+I^ODn4sPue6*
zS9`^3VD$j-DkRw8sk5fFQ?9Z_vuyr)&YdMjR@N2oH-oPYqWtp{oVt5W`_{9@0$ajg
zOfE2EvPD{XIdpsx`y#JqAm9a{M6TK#oR1>gKY{${BUEjHyq_P?lS|96Fd(67O}5N1
zt6{j@_-TpMeFnWs5D|y3?E0Xsxwh7WLxHa+Pp=LR2nz4sxpSv%&gEz&^qpz1xOaSs
zi)r{CD}uZXmE9~#N?-PyHTG7$qOyf8@95<xem@44%v=f!3Z`LlZLC>iMH+&snZ(1z
ztxgPMF+K~b&b_73i^H<s=ovV2A8gLr!P^9;5a`f~xwn;sk5LT=+NclO<jv2+jXYd|
z{Z{O(j<RZ)P91;~=O$;+4e;|{P$*x3kkskccfZagHjMAUE&vczgZNxrT#a=Fd2XhY
zNg6d50-Omx6ROT?wq}K_fh=ds)D483&tF{CRi?>ZfKv$TsAkg%H4iy6HZs)ik^d7Y
z>+$vq;auRIBMdRkiZP@pmnFy`cT*p+7hs23jlySWG&EwhWRb3|A8M17Z*B{SgmPS1
zmbmD1QJjHY*oRJFXz}iO`$@`xmoxj!m!9!zCM_ClXz2j_O3i#kijym8(WG~fJq>(k
z>i0i>JRWxU<riRpNFC_kmW(ZlRAiEK2cPZgpboclF($7bQZ(}q4z_R}R&$qR<m_<b
zj4MiMjVUh^6c%C#(9@~{QhnUwG6mZXABm)kSGrPcSckkUMmCK-262l#oboJ#K-wuW
z`5e@t!rEVIf@<%tDA#{Yft`y4FY01<WD>k|Mx>>YP8S<Z+6y=%rc+c_pE9MOr75@m
z;4Z<(KQ%{`G7hrnRi#h&JcCyFvfTbC<h>eCY5lxr@`<0}4ix2MIO|^E49?34<?<#R
zn<fUKGxso$O^Di8b?JLXlcV?{Y0jok5Da?ewvQj{qn-m<_ztw6PU(~@MA5fpK`AAC
zeSTshshm4QooeQzHF$}B68R55!oil{b4pKu!d|={tNfu?T#*BdQi5t59R7&B=t=^<
zpJY1T^iX%kZTAhft3BQs=&h)-gw))xg^%NefAW;ADJkGRC|*#A0C{r%ykQb<XHhba
zlpEy6#0Xsy<ii8?kn3gQ^DF<-sm%?yD<+PtDw}?1{yg3c^(R7DYq?;$5ppL|(5oUV
zTXRrIv{tH+VV7rFE?+En81zyviXh8gai=gQhNLcwWY=eCCXl{RC{?VvUP}DTf9I{v
z?=N4}RjRx@5=A54+!ZaHDv?r3!FkJ)qghX5d)3Y%cXOR5dF7G>W<cl3VQ^_;z2hz3
z6_7A}+LH*4JTDt`hDemJy0$hV`_)LZC_1Gxy#4tOG%DuW)i7$~H!>xzCa0!uu5u?c
zraAkjP6WN!0i9Pj9T(Nj<~mX@EIVN5Vf2d6F=l3H=*l~~x-LP155i(@if2mmqa51=
zk3Cq^-fHO~SZu=>h=_%@l-Y74b&40%{J>tYSM~C|yIYFczvx6AwAC?qG`l6|v$7bV
z$1}JW>&%&fvyMjytA6uNzf``XHcXhGjg5d9mTXoejzvCPTe|#{VNFs@?9E^l{EWr@
z;^2-$vXa99>|+T9zLXh0<bm0TS=*%wy@R_RoLOT{Fb!}<^Jbb@>+}ix6)C+*v2dy6
z&!D@L3AG_UK2f)LVNy-|^L1Mcj%pj~y^CEAEUZUV@eib>Z9Q=jpzCV|K7E=n{Ik+%
zh+DU`7?vk8uw2_5woU1*Uq#l#oi{<^QlNS$37)(C)pQ6rm6Qp0wX84XbZ$dZkq~hc
zu#$2Ya56xu@6I$bz8^f$M0c}o=gr@rJt^gu=xeVJ5&=6#1?<zXm*mFmpj+566tToZ
zgLB_x&`|}alFZ74W8U&%qE?6iB{+Os;wbWIin-_Nwad)!R1sOT?UV4sJteLXAKWh=
z+C3O(50WOFwIk1cvEWsvUKT+eJw24Z3>T&5r2duoJ_b+Yz1IDvT`f&Ml8)ZqvuUFm
z!_}JyWjbthIjTxZ%9BKM$xAo2vJLd?UCx_&d!H8?130){vBO*%WWnl;YTE0kANE2c
zrz#2xxPwNvAk1dPN?Ai?O20~82D%4j&GK~c>NN~UtGzis`1ZmcSe|yc8q_R&H)@oZ
zd}xbYx3As$5XwQRpf`n%Zzfc&teiquJZQK;;h+83@D+_RhkECH8>8);cJyZtlNp4f
zb1S3e(cd=cRT%&i@_c3(KQlbPD+BK;+-9W^`6`LqkfP49g*q#9blZ+YK(i4c{5C<(
zX>U4eN$(<l-@c~0;7!c0aaHGv_wXyRqqOQ_n`1NVdrJ}U8E0$F{R%^N<4@)sS-9zb
z<lkS2fkRjG>^mn%qPm9Ob#G0lCMRVzC<l$BMf7ZuXJ8NAZTT(DZ@+0;5w=G-{Hpa!
z+29Y^d4~nqwzsLMnHEBdZy-Qfv$(|4fSi=wuO%)h!JCaKy0V26W*HBCf8T@U%+9qG
zdLp*9y&e7g1F1SL-uAbH1HOq{``g<rC1r1S*rAV!tH}7`2&tQ}O(2fnz3f%P6AIOe
z;s=}=i>@}|_+1Vd_gD&*n#*Vcgt*IOjx1I=iNB_r8cwW6tDRR!2n)P?pQDR*>QAJ=
zOx!yClm#AKxRvpMFVtMVaDuLFB2tHrlv@POx+KEn;&rpy;O>q&d8H6Pu90HxO$up}
zox?-^lp7iQj;5(sRrLcmD1PgM#SFO~)vy)b%p}NqA+*)T!>;yR0aBM)ZYX@jn@90Y
zPBA?4S3#VCfxW?=by+-ghLKw8v2p+C25gomIkftTs?|(4d(j=u2Iz$!BA%HAl5c~Z
zw$As=8;aaQ412-a#fSwV$Y80y>vZ+9>G8Glg_(`m-TGO#s6|zG$r;Xo56<pUwx!2y
zUTjNDE3Sx(i$EFfHQbUiSfDF9VLUkvrQzU{4v$ir-E4aS_ciBb8*;>M>wd3#LB^g(
zNcL22o15ZD<?UPLuJb68A{PWo2{T`~oM#VSEJy4_*pad(-CXt;e6(NXM1ReW3X;~-
zYq!D!m~&|tkIdi`a~b?fY#c96!d|Vo>m^-&C>xXvk3F?zHQ7zgX>M>7EVi>uJifVb
zgCLqU?vq*3{xfLjTw`jEdvDTY>(29^%~&V)u3OHK1cTRSBkE{4Mwn0EIT4*ek)?Yd
z%BMNvp|^YB)fNn2na7Np4^74Pos7Jle>gQf{FQF1ob{GVX|CF-p_S5SB51b+_tUSs
zX}>}EzM9oYc+0{Mch?cm6lbl|cqNU2*ZH<t;~_b$i6Qw9CH*KIVNUAuW6YrSM>AG|
znjiTkTBMa`0cHq7DXTB)@iQ^-*D1F85=J)4S(zfxH84C@;lUc=EkCiLKO~fo$<S4O
z-4>=dbq$c7!rWyR{*q+5Je~V`>aY;KqPlo!?>qH_;cTryCNjRN)@r>2l~Qlkdu=h<
zVWy3nupMUBXJ)@2a=Do#mewIzT2OJ6CuvXW%@dP69`;R`Q(UI1Z~nMMEm_qg2~G6(
z(KjgKY3eV}%kGrz<t6d3cfHZ6WFSVY`yeyzi}js{$Pqg!{Uk1K=J}eX3I+;a*>l!L
zb50<8qGDLVzNHt73k1Zy_feCj)%_rrGk5AvzcrTv#yiEi0AImZkWd8S#WNkh9*1m?
zZ>$0oE{M-oN^8aVy@e&yzbTOL`+h9Fv@^da_bX!5aoWT%t2Ao*(=3d1p5W|z?%%Mp
z?`=JJZo%`&VrEl6_Y4>6{}hUBbtsf{45rS1y0>W}S*uUiqNpJ~<{t!~daBb6<9hxj
zv{{hmR2M(aGFdws&I#YwoKp`0yoH_iDPQc#slB|~q7~f*DYR1Q<K)jh^!WR%IiE=r
z^!9Xe@GVP*DWXo>mQNiJM$L68Y9jL*_!(qe@;S{+x${yV#53pXQ(CEtgYUxBF$98@
zoUJOB;0*~{ZTGtj4^{PcS_(oqN*wy7BxhorRf+`$h+G^JA4Z=Vx?eot=Ir<wM^fui
zOrxiricdbwC9gy=d{8xMQp)4VHj}JSXDh%2n{z`_4k|_cn$s>X(CK(bvaed0#6@W*
zS(7Dl%s{8+jI>4WnvUG@6(PM_-C5y5x`0gcs<`nx#Pzd|_p!*7(w%3!%4`ZaUIs<N
zAn5s}9-`~H{wB3H(1`VQX&hIwr!CyEcr2kQ`>sLW={$k1yyO}jO8a0`zP64k-(KYx
zSIN~6=z3vFv$<K5S~Q#+o?no0Y5VQl>RRn+6XWdX&E<T&%eUpHEozxX0-O5JC}b>A
z)6+1v)yR}zs_%0n!QNJlgwG0j2Wc`*<pGxSQ&AP~+PEU3;KJa8S|Qx(QXW}-tlM^7
zUW5D!Cz?OHp5rHKHQVJcoFH?FdDviDP5b>qwOiLW$}uX8{w{m+msVL&OjI28?|($3
zf8`<ngXxq1LD)Fh3;aKf4zuM@0%oOQ*3_1Jw=3UtD^aLEsy)Ezyo*~3)D4wlXe$`(
z1LQ1qq|r1i{mbzP)8&-HolvCLRy=iLY}+?vVkH0h$BlPIZTMYOcN}g@cwT?-Si>)C
zr|vCoo-irZ8Odw$dXh9MLa)TTbbscwuYe))(`>vbCo*00L70CSA=BZH_BRe$Xl(cI
zFT}q7=8EGrb6M*Wa)^Cd+^g~Q+Yci3J2HdS&wU<#6XsJC!3hk|xGx=k&)}3fM8V-6
z-<US9?1jvAjNa;X4=dY1QoD(~^&85!4So9w`y&Gt-;JJjB3n}0Q*Bi~S+MjeF(O!k
z%}Rf@Lw*n>2V*kYs0}iVga6j3=<xB85=3tyeKVBYe`M|9{>=BGe1A1|X_6p!one_C
zS2K~yz2U(W1y6OloyohJ3lBDf>^0dg@~UHy?5tc7p-6-4nuV#5mTN+cD>Ud&*nq30
zR|x%+K#BFHjG8LLXEq#Uo3#y%Wk7rV>&|#?8{KPL@vQc-^IJ3e>Ro@=TmO<Y3yS}f
z0v7x$|M$P7v;K`MXU>0hR?PUlK6IT8DhtI3I|s_wUz_3vnA$4kq-2+Es@{<oCAlah
z>ILq-@}V#}oVz@vio73#l?|Kx)?kLCUNY8S*1s&$D6_)JX1N#hdQ5VF%=jZEx2N!q
z_`u%O`qT4Q+jW)+7Ocj_`vdDXw>{(2mYJ}<g$`*7&<kD+gd#8=cHIaQGp)i`3?{XS
z`|<r{TEHRoCC4|G5O*Rwx2axSzMc#E55{G3_z5*$Sr|0yPuu5@3I@%%J@L7k4>6su
z4+;4P^S(iED4563QMh9C@I56ZNbd9Z8(yq6>qx-o|H#?3?Df`ytayD_IDf~x1M<uw
zv{kZ_NP`32Fosn+HYc;~ZnCaMHJ1LRZj<rq{&Z%H=z;D1>`hYT3W>6-k9p+|CEMNR
z<`RiX@ipTs;q3hP9^U^Y)+AG9znp&>r}Vv54f@bHV9)6?l<nP3=dl_G?eT=Ui~p;<
z_l|0^Y1c<%!2&i=KswT^kU$cuNbkK#K$K2^fK(|0f;2%udPhJy(nA2LqJStUT_6;t
zNk>3H1<jfGZNJ}s!L!!ypKqPL&W`WOI~nGgndhE+`h8t@>#}nTXH;1TmH!#p7Z<2~
zgL_Qas9w7Y+E<SD=9Y3hyUbO8x=jzS)ZE#)`Q~pb`v)y1B>Hb;gV3Kr_kW4X{)HgI
z=(oz6;A2E$Ps*Luk?NDp{Q~T{hQ>FGRLbII%YGht_ygi{>|qco^-=T$GfBB2OSf47
zgI5R%T}43u84^mCbI2Fa1>G<%4P}3FZ)CD9Yn|xC?HolHBdVaunVbh6hFqPKC)J!q
zprb2g&mwkvSt3qi8Ra-XTCJ=N|HLMla;8%ngh2dgde7!;U6UjCFFwk9jcs&5y3q4n
zh5KsLkTZXDQkvb=Ua9XJ5#C2l9~jvAZ9FIaWWEJAsa<GSp8D0cZTvXibakPT5J>03
zpeDR+)y1B%djp-V)r3r*j&8p6_4e1dBT2100c7i=+h%2~)okz1)_ZC#OS@?Zm5kmz
z8oo>acs}r_+wpUsTYG;dX?c#8>wZEsHF@)f`=E?-g0a_{x1PkT`k%-?s;r%yWUxW0
zxZm=8c_`>qVwcc2M1%RT<*<IiasIWX^B?l}`ZzApW5Uz=5=%=+449TP#VQ;PCe2+3
z+nSF^iw1N4O*Q|Z!-SCkzHJoxGs6BSRTBoTPJs3OEHJ|dtlB4uaDvYe2)HpJ;wz5+
z#zkoS=F<lF3P7a1_#0vY01^OV(fFH8Ti`di0-!R0JwLGX2WJ1k`2ReF$eykH8!ut{
z8>Er?8<GJ40>J+N(r?HC5orM!w_X3xV*^MBKym<dg~4y^1pozf|G`)!5HS`+w7^#g
zgh-Cv30Z+a7C`_YG5~6W0`dujt$#CPD-dsi0K$R@ulVn5*nk-tU_AimH$Zl55TOZx
zCj;O?096K&=@}4R1AqdS2%{i!dB;MCJk|g?0stTYR01#%05AeTB8cB01~ww@0bn-(
z=QI&iQci?E?0^_RxD80e0b1nFA7bfG5P%0E!cPE-1p1o;`~ClfE1SRZWc)PN?WE{@
z`hiDIK9IjXP@V6NwDehl!1{o2W}Xv)M^8_a<qShk$OS0<+TVL*Gn^sW@Ht)bihgYO
zE@#b1!IO90?^e1qCzRMI9-iUlIr(s(Z+}&ZZBuFx9QhNiXc)l<S5w0dtdbCEzTjqN
z4;Xx{>J(usDk=m4z5&oBw-eC}MDET7;GzcDpm`D5g?SCjR*2q~0c{4+`Fjhv)B&#F
z!PSokU@Z0Z0X8SJkqW>p@dIF5cFaki^4(iyO7$D~x+;~3_I-tOf0dce?u-Y2Hyo;C
zZ_$(8MLzX&7>8j9?`!xMLh(C9I?I$Da=b@~<oA5cxI%ny=}u}RaQcl(s3TGdlibL2
z^zKSRP(`#SBa|HQsoR#l8x9e#u8!TicI(J$ANT+^&vKU1k*V+5w21{b_~t8BprtIh
z(x-66g)ZXFROi;Lr-b8NSHMHWeBn}NH@3t9UmEwRYmRv_ldsWecUF$&h%;G3^BdTO
zS(ME3o7!gej%1GfvlMuQj(Dbo!xP_qOhhXWhN=Pn{a$m>Rv<8~A>~z+Sr(@WqiM%R
zTHvdKP27_-B3{*PynVA2(`yQR8>5D7k15A>u?-}S;;vS5rWx?`SBUzJ1Is}jPCUnG
zZt+s7j+&2Wzk@jayRs8|6nI*?#gVrA>1mxy<mhz(GU?3!tYmw0v=h0`MhOVJ*BA!I
z!Z60-nI`9ovaC`ZevQqlkd!KpZ<CK1mYX&m9Rn<^-}|Rc{1k5G1S-Yde}hdl#}8vU
z&!0UzI%c5R5J*d=M1TKNVfn1E{Z)!FVEpxD7_A(d&^ygzWtwf0%$1KhgHNQCt3DdQ
zs$e$OKGGhd?q_Be(A(A}m<#M)er!L+{yLJjuki*e>wy2UF<T|yO&Xk?;7^LCHsl$Z
zr$CKNA&|&rEZ{(`gGxzBF~ttkU2Ml@f?DKqo;P~qlh?1@C3W3=WZt}VMV&}DtYZ5>
zNm|YLGme3jbIN6uk1yq7va4zy@otc!_l*;2mU{JPHskTt7ap2wCHknTqoZm>3&l5B
zX^>|a=XvFuoBbQBs<u}?C#taD$U6Z(mUp+qt7V$nDZ_iqM3|0w4RBzzj8lf0ahO%_
zO?Fj%#^+`F;d<0noZHHIk)1Qn3B&L{Y&J%}9qaCZSN$}b5!OBUEp*a30&8cl-wQ6P
zyarBmIFxYYZ(qdYIwZcohkVD^(Py=a85IPZEUWSwaN*}pw_{UBa5alv{vnUoH&;$y
z_0|nSJb8Z+RTvjTMW<tpf~B1tdz{OhU+RjVBz-J^Jy|!4>@{y@$7*pJD$pfcO5b9D
zmU7@Q81K!}3#6pCgc@%YfeVY<a_eJL1`50`r2>nF>T1i}AcfcF05eI7h#*-UipJK=
zzeH2G@+GNz)k@jg0@m{qovm+DLAe4H!-}V}s&=ILc-onbBH$&*NKt?ojYcROiHy+A
z02iUXW(iwO4Bvg{N$bxaaV^DEP(Vwy9q`8R&s|RYmpZz=*&1}#zkCs-|KipcyH5I;
zijy^ns;pEF<xonBy48P+5{k*ddjOtrLS!(HNsH3A#J5%=Y$rHhrE8L%_+)zA<~Dz^
zqKK7@^}Qe}SAGQD&0O!GUv`%UXxnk6>YBs)*(v&dAI#-#x4t(<P}y6F3~{$`U%-m6
zUBFrfSGCJQSFho5*Cf8Dv&ycZ6e^Jt6c<sKx22QZ!HvSzz*b}CRIAc6$0!Q)sIWI!
zkCk429m-6!TDKevsp9X0wr&$nUTzMe+Kck7GJZNBvrO*cn~4nw5G#6!eqV`M?u=`o
z?`y3&W5)Xp^nvj7h*0$k;|GSRt&Fv|{M0oRzFtM8*vHk$jG6<fT*BiRC5#r*lXm#!
zl|I$pu!NKjSVrD<BE1?2K^5pRwoYE6*)~hkAM8S4ui^+QP>kUOFl&k_l?@H%#A?L3
zU%u<>RliL4c!HLie{rzz`>@tApI8bghMM?>qH$f8-IexqZJ8^{PVxgGy<*1Wn5=eH
zz8>r*2R}9cGo4JMAvIESls*{uc4oVGd$-R`k#;{DNVIaYGv3MnVyj;5q2yp%5KQ_q
zDY3$x*L*Bdp}JJ6@~lX9duC*W0pr~u$H=Uqa}Tx0fblbVZI@-g+OjgwD=a_g!e3^=
zjquBnp_$sZI@adYrPb{}6?{BBm25X2C#O(pxW|q*-fbRICiK0+>VWchXVWzoLZHq`
z&Ur3<GEORtYkXa-&OgO45{$JuLrDexdKgDX7$*OU1KmQ8S?lSFv;6dk7hXrQ+rKw{
zD{GA#PIJ?}IAA@3+y2xAZW<%J$A64{2uBsPYn;_ktg3peVmtJntP!1^M|v;FKz_pQ
zYXc8)ND7pJoD7s*S;Bhug+>@OWfjPvWPUUZ-qKOy1={4LX&RrcdWNo}S;6cb2?{pD
zO8xa?Bjns&gX^lX{6^WYH@_x5ZOKbEpv2=$B}5HNdwVQl6*^Z+O>dq;NyJBPd1X+o
zNpfOEXs*2UlrD+;#XqzbhF%`Q5n+D>0k3LgsZd2(&@g4KSgFcb)ROxvtSAmc=2N9V
z-qr}w3?u2_|DH8YS^LeLYjN=Qip;oqPW#-$;|_pyV_mX{=|ZhqLkDhER5bI97>+Z7
z=82>6HjAosM7i5uf9%mwdHnKY4>6ugq$K%0@KlU+XFj{EeQbb<__YiJ(@2O7Lpxs6
zGwJkj*K~xQ46mvJMFk)l=epDZ446}>z}vHGo**gJ8!j9%tH~ZJ_c)VFSrXq}Qz7?h
zlP%VvK$bL_;QR{9g~NcUwa$6DLFEOdxo24iWvwN>%o|c2olBP89&T>JfDAe#sLpDv
zX{-tpA>SNa9i@Puw(<<561uQh5w6Pt?2B^>crKPIRn1H(A91&|v<yOn(c+9x6${09
zS>2G$z4^L?q#Lx;!|=4uy7r?qstP(+5oWDX-~-HV^(7rscFy7v&i#`0?H!SG?^D48
zD3uJ#IvzzQ)cEQVe#dPwadCO&zONaVv?AKgV~Dvgc~yCOo9<dxodjSS<lP$&IW2}x
zS+QPveYqM~4>0scbgoS{rK#lUNcF^};6gDzZvB#?pZ76eEjQTff80E>Vd-2vFo5$u
zL9u5n!&~c}?3>EQoyAB`PcO(Hj=^(fj+?XY8-1gudEZuVd$XW268kHIHp8Gyi#1j_
zL8E|^gM%X(i1=(`n6W#e+y{1VG$eCnY@>_p1+qI+ZB0(l8`iM`yi>>tXb`3gpMyok
zo&)~nli98a1px!e(T^2BK1jWa>+xakuJuf#y7ogAJ-3AkzzU{)KxfN8sQ2hrmI`#U
zvs)sX_7mIkC&&7Gt)Wbq-{}1F_vCA4J=WFV&Ny~;#F=#z_`p_vJa1@dk_46?(nmmZ
z!QqmUKR>>Ba5BLYHXvq>Zx;QYnZ8l-^m$;A6mYfXc$9OO^X=!79&E#=C8tEIS$_LX
zCb#$cs1d@Yi1umVEdv<SY8;sdcHu;y4lqm<2LCv7JWsVrKH|d6&#u{adVkb5i$66+
zm=-?JmO`8Cy@*|OqkYp3==ev0X$3%{WLk~U<EiErUwl1k@YVKPUU!YG%L&UbmYeqr
z3pgVTWj82=T&~f$IQsaAuY41n0;{*_SFc_HBZ=QWO8kMR6JP`TKI&7K+Hx31+$~l@
z^m7eiqq#({rJj6p?1IrLp~vduZOT5m`U1zN;;6qfee&7zq%Mh|a=n_~z;%hVS5iP_
zj7Y_AWNPXMc;;R6d%)N}6eo0LAUegMr?%H2zE(;LwJ&qRw&tV=SLwZ@Dvii!ACt@5
zpHjF*o&e@{$>g4BprQE#=&THYrxFLgO^8<LFwE02oP2^t#GKq^)I#Qr`o~^LMb!3b
z`?}#63A0EBw|hZ%6bjmXFZ9cdF#!J~%6U4yc>(ttz`Z!pWe9OpS}iuy{3S(V-JJEe
zedZq`2O&Y=yZX-=^Ph8(|KvvVe~?-0Us!Z*7!l8yeGy9Um_()PmGWk-=WNTo$)m3C
zS*c#pO<{i#r83|dp*8g(tkW~OJ@Z8t6~gYhjPtWVpT3oqX07zHsvYdlxoeBj{=FgR
zdmNcgQ+7ioC`;4s;gY@;JQ3$BH*)wON4g?wUC|TrAR#J%T0kHc5+}AYO@B8FmT^Sn
z@#uFJ{pvdoC8u!W0;|`t3y>xsy}j(L{>y`bwqcN9jfK6D^Sgy}IdG0U4l>ebNA6r;
zdp1bY@nu-rK|C1;xudj}oE+$NVv+)X^(wnJtrY8{)l|0DGFICw+rRuUQk}`7ee*x)
zd(ZUnnhaj%&w5lFQ{cllTdhu6;3oSeLcPY9Mj+cAkL;qizc~Y&xOH}-;s+pWXL`Qb
zzeC1j_EdVp2Fnnzc6Hk3TYII3A*QiiI-hVPG+VSzOPhhW=eWgj1~cbojcTu%#SDDm
z1xK>*4#mB`APudp`^kLS5@-20^~qYF?Y%k6Fp}YG_<ZA>8kv`uW<z#RPR|eYb7lAh
zXDQXRWBtM%TuS%n%RgY57A*r~sy+!<UB-_SL{7Wrs&IWRt13fEUbGWfV{xpxcPz>K
zO6=bh{0|X@urT!B`u*o{<v*z3Lclv2Fv$Ejal-$-m-qia7=iwU>?gzi?zG66ki`qJ
z7nI0?j~+7~J32uiT-^0!iDp;TNbh~er?5_~((v+=(M`U$NsoZ#+yXc#FiNxnt5S2*
zPn{C)BNTMC=7iIF<~5?T3KYQ9TxoI@KwF;}mJE3}nK~iTfTjOiBE}RLg?_&`x$4mX
z&`MLQ9#R<|m>;5Q4f9V@sgIRlFV<k(w=(y?eEHIQ8TLeE?yBwEs#&PLrS|f31?+V@
zt+OAzoBWPo5NRNT3GuE|VVKJ~-xr>IAq{NdT4lS5x9;&20yulYAD*lidP5Ymo@?`#
zJ_NRf_7Ar2h}^h(=~+7BgvxC)yIgF_m`7?jr|u{p<s;+xJg!Au`@}KF+J%Ua`UR&Q
z!{v{;#JY%ON}#R13+;lk`01Q=(sKBCdd2!b-%hmakucTYXAe_SNvptg&TL%vs$y*~
zy#7|%3dNedw4EDycI2gCWIVzUZ@}&8GHd|r=-_`;BchseX-G=d8MP-L%KB?27h6Au
zQ)!FijMN&Jkx~gWhOBk#6xJ*$Mb4UXzqz(h8|A{JYJZ<AlQU0!97jXv+Z=<iR+7hR
zZ;TXuP*5S$!5bjgy1X(!b2%2>Bp8f)B(_z0X2#=`KHwB^$cvkn&CN(zY~km+8+=)+
z7U*o3_z&rlh+PYD4AV89JpMr(+S6syq3$C_UsTn|+}U^ibk7dNy~#A~ZpaA#(&^kv
zT7~c45{wBrEj-8PE`@uIbGc!|=ELq7ak#B=5QOkX5BuC!{wx7XwZ)}^j&Q?>qfLMy
zkYAa{Mjfmty|EQ?>PRF??|9Rw!x@eXp#gzH&0IP(7jv=9HLEKflA`vs)VBSh4!pUX
zwM}e|HOC)X^XT!i>O@?x)?*s9NSd6SBuWsJJ?Z)OEvb|0jXSK7rH=wG1<3lmF>aB)
zgvCBa@7->Oa$~%va2Wx>V+U5`_5<vfa~;NmRyD`J)C5qu+szVKUvibk<Mi<PpSmt`
z4%U8jrn@G6KipzCuM%tRe%!W)w>Pys#Fhd3_?d0UQu{(KHgC)$GnMnRTcf))Z_*_h
z=f)d+o&hTvGY|Nz>bj}3h5`+t18VG99n37CWF(INre^p+|B!@}qQ#xmP}{yP#GdcX
zZWmkOlUVFA<taLDOcAbBcXKwq%u{;&S8<f`_?vd<t;f4cAf>?E^_(0lL7qoVv|b`b
zG5v{lcrhByckLF?QX9?h51Vd>RFS~!O4>ds8mZ*x)vGFLuB)l|l;e6989SG47xkj4
zI~n=UYlm}Y;bPxl6;zB1F*azQ%|SSQd6+SZ{wa><!dqE85%?9IZ%a%XDyq3S{@C5w
zz+z7RrkYpGE+}1k+5D=K6iJ+(PhtAt(}aMj1Y8{}KGE%bdL6UVu2Wkymt)^}l*aDu
zjN7v4rkaM~`w3{xf&p%Xqcl+iuW@|rvN8&pF=)mtEG~BKcL-xrw~njc-W(IM^~0;s
zX=s`|I}F4fQ+TC<SHjROb{Tx^z0i_L_S9;LF>`#Wz0H$1bUkL9qr9TDzibefMu_GF
zw4LqVu!;CbA*Q@H(n2?=1o!&GXP$jXib2n1?=D=EM@!q`e{@LJbA{)eo^bhiDrj)r
zFBGjE>JBMQ&oQ@^N@eOhnfzXNEC?eGFroLU#gBHqstAd+{dDx=Iz^lT$}5!`KBDvS
z{BVo*m<}c_iqpm@QD1+E(~(52`Gsqf>G>@ASEdi~$`NCih0SO(G&r|%fW~5cXEGbX
zF8GevcnPCLF`3*O0f{7mvk^Ty8My_IkADO#n83VEdkh8!A)`d;jgf)4KKWCViJdL-
zJ^-64y@d2p&_x&6;nQ|!zu&v2c!Z9w*3^3%`@)_#bRb0ey&U70A}_drig7V!nN33U
z{Z@KZO({;^Dp<`<Gp^Q}+q*x0V5dtfUiiANU26hP?E}t=^;7>WGk?bP=^T5K3~Xt&
zWB`J6==9IefATngQ*n&3_TGJxl-fy!B4&(Q5{H=l&9HYY*#5vlTy&RLmG<&4%k@l^
zvH)zO!aO%mi0~OnoiUgZp30#>(*M*G#kWq5xtwEu)Ls5T2&M2mtOiieBbx8hN<1CL
zH+?>#W(-;zQxW;{7vE_;iM+~E(Vw_DhRb?-zGZ+hvfj4QeM`)Ttwa0?%|Ow2yD`mt
zvV`9SgHen9>~Id(BlQ@}Vo$C|DRXk(w<`kc*_!uCujgYhr3%?P+?Z@!2K!u>9!@}>
zsUga7AW$uMzV?WoLWF?)nkH{I#;2E-d)0TuLq*<+V|$uvnCyOCTw+wsl-geTKtVqO
z433LloAL4C!q!dacyr(b<HLL;yMDJ6d7qJgVfn5rM?&nD8F>p`S((le!=GPbU+}fx
z4dGsG7~7E;k1JStob&}-P{z=(AYxp=>ElEHKy_$}qE<KWCwmQsB~!xc>G>-DZcOk7
z?)@pYsG3iaT|@=nGhXU)=%A*n-Gu64NsOb6_g+W-a`u_nAAbE)8eIZ35<?fTaQ4V2
z(Z_1b?sf~V7{ZxV&fiku_Jrv>%q{fEl+x$tX@2>sFjk?!Sls_^2v@t<WmPyOBIu}{
zKaHKVPR+y~+ZpuK856I?eDgTJ{=Ig8*r*v1tz?XDvAmninMYEDS$`2{pPA>~o74RC
z<~FH^p#_>8nzPEr$c<qo*4|-Ibh3YsKD+fx)YmT66O&6yysPe?zs2vo!-z)~(Jx9q
zW8@#>3UQo^L1*hJVB?cR*S0OzNLDos#uV)EopigFPX!{3S$Fm??+<F}UA=3?W0s1C
z&wGbuWs4f2<7zQ=-a%00zA&4oH9UHvnIxCKq1D4o2laRir|~W>Qf@26-YSJ^hx6_G
z$CbH~PxzROuey>{#S>d?@);*xySK~dqo;dx6eKfu=rWf&65m$EdlchVzgqgeJdMKc
zNYH#QUFfPp?q=-!7I5;eMvQq7s3q&OsM{WD-u`^C<;w|8w-;0sPUcB_U)Y~bD-9M{
z8jMjz4&u6eT&_%V(WeiFmME^9OJE023Y;LXiaSG}Q1oLeVi&z+nWv7&1-tPsu1^Be
z47u^AW)I9iyehro=j#jqL^hH7rGj_IBzW<{`A-qDuk1;PO)lPo(foDZ(4~p(ZwuT%
z7(|#5^8ego|Jm042UocNgRF!Qf8pm#R44ND1s4pxVrOiXa|%>+S=1Q!;+ya~V<B<>
zd8{16#jO3)EX`CV-L?147@atPS4g=)=2QRrkE__!Jg4T@%5ZY`d)oGDt@KM<^(saq
zT$6l0?hjaZo0K<je2<R$H2vhCK4B$Ady1TM991vvMJf4R@oro<I`mBKF*=(Kp^VWe
z?_1R(M&;Sz6?HoHy&6`Tlo#jm@2DhX9M$H{pswM!-mZ^l?I(Y}xO74DbL|?3*R9uT
zsOM18Zj9_p<^|g;w@j!wCuYvgZQdI2IoWi!Su`t0$SzebAY-y&-}K8l{)wzcvI|Jz
zA~{~anR8TzXyI^yizM{70=p{Qj2fjUudk`NxsNf!5d2qWf7y7ATdb=_Hx;?rzlzxH
zB5NKsA^nR&{T3$C)C?wy{P&LO&o1hJi9Y>>_AN!-vF-X91<Zr^GL`dM`t(o5MGO)b
zqpYI!9A)wt@2}7n4JMp2fW^ovNyt9`f*1VGxD#f!$x1>~rqu^0`-lqudgD&1j5lAM
z!4*j=laj}bWM%qF(Ig*uaytX<Df=y6)Q~P#{wtZJl~LkP(j%MLh;ZLqT&%(;74G$S
z`#hR|`8=2AF3${(x0q#ee6KWbtZ?@;)6x6Xj0*ai{Uc}UUC%(@Qyjlv+ck7im_F^w
zrlR6Jn$X*6eQ&g!=E=i4U7xI6+Vf`2oz5CBsC8@9XEc)~J}@=lizB_sS2RsOy!Eo*
ze(ZNPwmfDCkx`=|`$=yc&04O52%U=WIVtSHNidn5Nqqxfok-odvIch_STikCG@#qg
zuh2`QN?1;leLao$^s%AQ-+n1~eY%19R0DX-&9V6R`{EPXh4cwFzUj_uLyuf#KNs~)
zHrAJ+bA2)2POh9%RQsDA{;_lvg8$pGxX_=$?th6M{snLi49b8W%3~f}GRQ;Tf1n4<
z$&~L(>Lm4)b)J$uvJxgY!&B%e`y=g=#6>;yq}^=6x_0^*Ia1zjE#)WdDzq$h4s2)1
zO%Smmr>@c|%N|dP%)Ju$R-ymG3oBN1*vG0EVYxe_O23o&_T0$#t@4Z#*R!5Kt7mK)
zT9+MNhSlBbkMmes9gAb^Z+~XL^R_SQ_RwhK^YbJ3lnilPsi8?WX3@+7DmgzFy?>=9
z-u}^}AUZtRuwJ9lvbH4Se$jJ%S9d+3IMFay;KSXCH?wnr!rS&&CDEI<{m+e!&@Z!%
z=3}1dIi9cl1i$U-y%5i1&Eicu&`A9=eTwFpBCSQC+-S7_?VBeW1Th&KuAARl?6;D8
zLfuwX&Nrb3GePb8K<&C-fZEaAqf3}_F>_y2`Tdr@7F{Nb{?G0r$Hj{?I~}5I?Z23R
zwtt7*cldVX)bRDc5t}0Zm@f(m|9d19CQdc~VfeBzf|TpO^K<@-oD(o}0&>j%H)78J
z==swB_poBbUtq=Qi{8^B7vu-Jg4o$Ew3&N6>bjlCI7!%;*VPMG(NRte=*Fr~NSRgg
zF-+;8E4yAUx{3Wv6hmig`XvoWp#aqN(PV1pLxE2ay<P1k$e8M!j(BN{^pg-=KCHCI
zIxZjmqZP}!gQJSMC&3t9P@;D{+B8!=dqxc<*C@aib!1A#Bfqr1wlm^Ey`?5DNKjqx
z`4r0-EO+$ohY3N<>B?HlFiTab_3|J2Y#2dZ-`GKLmSvD=KBiPz>u<-#bT0H5Ll3*m
z{;m~^@+z7{w7SmC!}&I<W$i6KjodgdnjCA`9Vf({&rjjwQ*6cdB+H8WTSSzzYHIEa
zQJC}_Y{&?HFU(TwOeqQDF*PQ|+=914dXEtU=3{$bhD*p^sA`$(-8HVcFoar?-!?8!
z9=_mXob|MXz#I$6FejN_YRK&!+Y{5%drQI{jy^k4Uh8w(<b*_W(OWlzI4mFL3P%`v
zcLl@1YINFtilyKu)^r+%73R)yS57eqZ<?4gW{V@0Nt)O^m1CNey^l4n6O!42Vi+2G
zwj`oAkeB;vk4KF;<SIw(VcuaGD{Jpw?o#>i)Ks31jnW)deoo%piBPCCnbfQ4>GPJa
z9g7#=K_C^G^%VPh-RSPbV$YP`HGlRB%e;fLj!A#ZX!nB_?^}L@w@y9~`*jQv25tw_
zn@XM8sCm@rPnS-5N4qPZ9%C+!2z!Oi1>)nHX89tMkj+nj^Cq;^a0TPbDjHq8D`Tto
z{0!y-`9rj<xfAcDE^+SV@k+)dtT^qEs(nm{d0?`Kp^p=qQij?zYJ}{gpLU{$EVl*f
z$p~Id&SmXdkb6cgdmSa_PNRD#Dix-#E46)Wz%Qby)Q#=)ymCZ5;UmeNI7)SUYpx(P
z`XzREcJ-a~$b^bjfIyaf{IU~yE6qNVKfftv1Wyo+jqaR*emh^{*J~|il!9G4vk(=g
z+Q5;Zf)ZKdRfS?qjh*gV8h7Ku&so5ye$F1fQ?<-!Zrcab>?>;y{;}4Ptdp;nR$beG
zlG_B^{IsWOE$fMTmnxA)?T>1XO3&p2s5&@Bh-h!4b(PM!JP<g7FIL<H-W}>2*k9wB
zAKSLheKa-aZRA5?E97bH>P_B(zF=3wV$f*sb!K2~d3m+DaNv3gpB$=kKigC-?$_!h
zbA|2at@?%9<!xGD?%X~20BL2dd)O>EA<eTFPRsQ=ifvZCU#@#$Jl4zWCsrn+T?X=E
zR%9qw(A^rvwzE?`9di!=UtdIWl~m4K7@d0K+q&7NYW_y7$w$aknm<YPW0lSTO63e(
z&Dg?eKv=y=pG28_aEGU8%Ugg%Y`952(l%Il616@NHYow1xN555O{J!6>tCPsrU~vp
zJXLd~hTVW8V2?zbEGF~o4=P)J{<&Xg2mGpPpVT~@<$GI|{AuczD8=*81)p~mQq$9Z
zM+S_aU%K~@ocyt&YZ03=MSf{zt+>tc=a4wt#8DahJ;urQ{#5pdp9bYkY#*Kz2j??!
zT|sE|%G!j;+0x9c6QR1OU)CvMh3?Z<B4ojqeQl6smUlJzIx`!d-PouRyq&_PP2qd%
zT;LpY^?bG_S;RM}c8JRsMO(V^!>{pdrw4||@sWFb<;Ki8Cr(6fysXQcxE3K^A}jjf
z952Ufkc$ZYxs=39J`F`CYy~ij@j<=X@7n$BLy2TDNsUElMB0_XqI8;Li=M)?&{YP{
zG+H`7zwYJU@rmmZtq~meyB}u574^u(AGqZxlPuj9ye!Bc)>Nv@_Ouz~9$e2Qwk@|3
zRP52vnX+ZdW^PuX9U$D7dvqHR5j;TGu3#ity!fpK#zjuo7rrWc<A9KTqNaZ2%-N{^
zxK`nUOUE9Lt?%v;8_H0puqTW;3>Bt$*TB3EYhdU7fF#KFW>Ks+#^!7l6U8<_`DdVO
zM(`?%o3Zy`$F{AvIxYINewo4LPII5Ou+!P5n7iux=(>LLJTpG25I8pJ#G+O(d8}Sn
zK15-!T0W)Dkw<qaB(TYu!lJKOx6j8<-z)|P?J2m9$#;D}luy>sO$nnfUE)saXOYJm
zKwD+2Kq6**oHr5vG{)}JP^`}OKC(=eY{a&kiwiZ+Gn^xzTSz4YC$Baak_2Q4rnPu0
zRQU*gNq$o;+}8F&$W@)!^H0Cp!cqzouZLU`=t|(rq)b~ZA}drgc5*6kQDaSAlb6Hf
zlNZ!pNLT&%Vkg;?`<jd|aNp^pOr%pt8Rp&bFs)b0q<yP&hrDHIvR`c&uk1yFmcGuT
zRXRBPF1$g9bZdLN2GAiSd%T+*hR2dw!O7Uq-f%QkkKoZYq?vHNyRMfiWX=me?JmZ!
z5sJ27S!L7He|)Kia!fF=$bMRvuhd8Kp<<J{pm-MU(m=?oNsVI4u8X%YW!VM=H6Ef7
zwq!*=;jOtND(b1R9rupZ;8($Qh&hUX2iG5yo}8e`I?Kub>QRtF!LAhZ0}qYT^dP}o
z%}OM8)uRqDOiz>g>u}jzgSbH&M;UulX)LZ<jCZL}m_^C$Mn1fKQiGSVYo;VIuUBl^
zYT?Tl5}9L2R9Amd7rhQSU2H4hD2P;e`T`5z^;n_fejAv?oHy6v6gupF-ELd!<a>&N
zRCA|tZLlq=x{z_BQFvPOPFsrSoWxDFXRC7FfrH1xj>ng94Ct6U#f2+YvHQo-&m`QB
z81cNCqn}`>hmEa4Xqt&R^w0*{sXSy+6K_U3sb^dFVM*WkP`9%yd_MQ9f@H$gAmX_}
zNuJWLes7OKTj5ts*D2XkhRJ=5dz2WJvuSTSl_s*Any;&C@v2H&-5HCC%j{(?(TU^0
zq{ItjWNo;#0a$i!nfqe?_QNK19?Gr<FK!ENb}hq1A{)x&_qIh+ewH`NL7i9bh+Gno
z*KqOgIL2$l3$MXr+P{AL_6^t*uuZlx$=RC&?gt##PXPGeZc$6dHBX+)Q+Pgn<p&pA
z1Z^0(;69slC8sjWHFCDJ9)(9wbCg=9s5zw>s5m+*XjsR1O|MBw`ENIdhKAm1@he*U
z4zdNA+r}0%q<J*(hllmQ{G_$dlZlpISuGrk*%xp(zxD8M8>l}}2AB}A>i)00ec?a5
zs{bWBsKfZN9-|(|Ho-F<7jxIJYhvge38lPErIn7z%@aOXay6zaYA?^6zONet(Nw>p
zju-T!Nb?O9t}*r>QK#pG(2hty#8O>4`YY&;&Pm(x6(1`)DpbYxYsqrHYZJS;I15j2
z1d3e5gB_XWzh-5~(@0Z$#Qt)BvRCejkQ;0JC*1AAcVE&?d63#oUQ%U}CTYOjKaHn;
z`Od;j`WlJ6PhfgQ&v@hm(#01!VXq(X=rvT@4mUq~a*}0wDLwy7>(4%lGClE+cb+Z0
z&XQ~0kZuv{4`!OV!@~u+9&Px{8(L|hWs~v4keTN_o9OPRk<-hwp+n_gTAL(xI`VHM
z3h!OnP?DrCFP0gM%HHJTzfs4Is>|cu&413pU$6H)Rix0GMmJjTnM>Qq$-7ycScL^M
zc8U*$Ptvej=C58dzzriR?N~KC6b*&~Ushsi6EI(C>IO8pPkIN{(?)L%d-NPHvXFF@
zGJ6+IN?*hBGx4-*6I;TKI!^UEL&^KI+GZ(<yzJUqLWxx!Z!$_qf<pFePLX?=E*s??
zxn3A6vTHkP9bgJ=^sjvW$ZWLC{fkHArmJG62UQzO+OuiR;foi4O3zf)Zn>DVtm(Wp
zQuus%O)tc&+x*H00k;l;qL+7*Y6XfEXHSw%KjT1Ext{c1@;`s7e((IVx<FC(UHj<K
zO23JO>J=u#`sowy{W=_vB1q;-_X6R3F`6@xEo)*~lBNU_+=&Ng{??KH059Oe@PGHC
zKYPRfU_XMxNV$Lqh%5*s6#@Y+93Dgd;kM!b^KBu;{{+G*#9u&n8TLN3qGy7AoG8Zb
zgwmV}5XPG@Pq+>26Q*#{U&yajNe0c2o`0+Nne6x}A%QBZ(Zp5ct!K?AG8EmPzDvtx
zS^&&ITwVnOi?4TyrtTBB1wDxd;$SLhZJ#7U4gkaF=2yVunLD)}t?-omm+mzrZ6rrr
zS1#aez4qjmsj2Bz;L{E82LbxW=9^$)K%o38xiAktU`8Oq7pS6peS3FwG#cXYJ0q%_
z9~#?G4f7oNhTa#lclLa}^6;xmAEvqM<YaU{Yy+FPYp*4NdjP<tOEukR%Z3FDM6j9;
z_CTcFG%+zbwP9BS01D43P!L|bT=rLBUDNSk00)dl!3XuIIyU`5l0RvV{sO2!{khNw
zFRtJE{$smD;#3!y#QMPoqI?-O8uBu`SA!!C9p4z+3+fJb5Hb_|AMimQzYQxQ2dL(7
zlJ8<2hWJUZhK^hoVwuLt&pLi}7QB3lV=@L0?m%Z29?h!P<%ua>6Cy+LQIYkAC#l#T
z<F2jV6+iDTP^jUvhFirIvE8*0Pc<|s*(_1PFK@@6rB(bS@VIrWd+B+I{aDCLef<Ec
zCl@t2o;1|eX`$q(tx)n!crWfvJq^4co+@5n?|XGh@)EzyxaY2JarEiOl-EjLI0uzc
zM+7sgM4#WLs@$CPE^$He)?#*FtGXaB9$`1JIv@P5n0Z=yT=$Vj!qM8u4&A2nli1=F
zo4g+2gfRTOm_SX;&M?}?5pPPS>au=)J3{9EqZ>43r-AKUVNBvpz1+Noqu4M$9D{M8
z60hf7goel1+7nCsq^jo*S|)YS_;_d6s-n5u0-LFU!gnJF_s;XO+ljW&Mmt5rn#svD
z4}&?Zd_5+*ob5>{<E;nq(w!3>9`OnxXxlpBZ1zw3k16g<P8KK07)N|>s!HO?62mlL
z@EC`H=~k)AB>#|0L%mDPYJungOw-V<d=sZt2Y1(|n{-XRlVX@D4Bkmu`Q6aB6XJY1
zB!cZ-J=k{BTURtDRmnd3sFt{rXwd0lZ_m&<;t98u*Wksr%~jf6xY@i5SDEC}E+(Pl
zRw_EuQ+>p_*RlQ~n7zJZ37u>#`PVSV3k<ljdpJ*>%N`0~z}DKjzV(XoYMQtXh>$e!
zu6W=tb@vtp`33V$n;69Dq_-D+BC%QwlKQSbX+A|Y+gj(PHSFhbt4yxSjL86{z^9Me
z6Wy~p7fB<fG34-7?<>s`jjo2ehH78%ZG<;>3{g`bDD+j3^-RbYKJcTw7d<%9D9Vqm
zCl{l+b5_0V-Hjx4US(5#ecxp-3#E+2SsX@NnK7hTxq8{Br{RgP2h(=O^RhS`ws#+8
z15Z)=dRNA;%9Hz5m#~nz;*B{o4BG#==xQ$ppBXFBE&L|_UaP?_tg_dm;pTS{gB1o9
z)l8o3p1oQh8wEy|#doTr;QmxRT#)7yt{O+}?S#pPpnk!N;#xF$kCleL+bET7(jRLf
z{PHn&%JAT<UDZySb$*sQ<4bFFWZ+lcN6(;w{<{>^`nf$ezbH@}dLGu6P97tG@a?|A
zEKv<Y6%At*+ez^^A}?P23{NTSQvDPo{_G^hvd#5~p;@1%OLJ|&@F?;&;GPm&Wx9>;
zYaTv{F%|OsMK`<3UtH0c0-;8`o1f2y+q!cfZL<<rk>%z{MQv8t+aK9qz#2H>Ed;va
z3Z3=756L-4A9FX5i>R5)ajY%5Qk_xx-Z#;c>j-HpX}M3zt3g`y-7R%Bx1jASr!wE5
zIUVsH3A2^;-)7n8D8(NNdgj7CxxFa6loz=A{Xf474ATm<bq|7bSlu!bkdN3!co@tQ
zQC$AN_7}1IxK-gbna5<iRZQvTv-g51f%<P0gp_=>!mX(+12>wLY)XNaMHN^atq%*c
z!qwhuK|4FpH|VG1IK`W>B_f&1Nz+L=DMfz9(~U9eRnO-bRH7qGY&~fr-I<igWFPTi
zpEGhzsYm>%bzXjU*0x;|O&CVw?eWj!=d@4E$41fRdXwq3<!)Ob%GJ<CizLo65p+-Y
zE!%UqhnNBP+6hed<gcywQY`>9G>6r8#6K12s;-llZdME38M<;lm`?4vmt2~YzXiI6
z5@(V5MbAb0`NbT0@6%k|(rOu$-uKcT?Ev&y7y3%=YGu+asVU@Xl1CD`(l64i1|Ek{
z{kK@`BD%_3eDS-redq#Ju5Lt^qzaj;AhbXHlq?!)=BJqxQBY6-#$uZSOeIDja2_YD
z`w)i>_Et6GfU>IvVSLah3Av=Y+ch)DjnFb%^JpC5>WWqDz%>a8r3}h3@Fd1(87uv}
zaZ85m*fSyT?iUN3Sh9HBr<Uef1jBrPMx%PhCeJinN0m$A1f$uQ?~S<nKwy@ySkQC_
zZ-C+HB61d*J+t9vO)hLpF*ZQaKFaCM`IyI2%!so@yV}UVa$yg`#s`*m&N8#$c(vow
zQ{A)j(o<JeTncVthjAaWxBGA6w3Caj9CfaLN5Ox#G|=Ee%f0U|0C%Tg!=KRUR5vlP
z`jO}DXs)-iRbJ^jpLy&@rBO4myUD67yPfuA1xr?o;Z@mmsW)NyB6lM61dY7rHt87f
zJ)rAZ{PX6-sb>!m*mQnxuDte<Gqgr3&}{PI8U_dVG4R+>c<jF6<3ZzYszkhT4!<I>
zj)EM;W@sqdii=1JQ&8tiJQd!GwM8$A)aO}#$acVox(|9dPNJzxYgYAbUu%UY>BaUP
zJtFcj!9UJm%tXuwM-MYb)l=BMEoeVw>}P&v)ob^{wB^yeW5IZwoxF1MtKK;<{mmwi
z;Kn;AR8<*_b5`BN<ct|zNre0CRBnvqTT)X#KuneUSC96d;zi>p#a7!e#x>b&0&N~;
z!p_NxQDUmjwr<i`8ylO`{K4JFF;A^mXL9^`u^taphIZGd(C@|jeVM7$HjOnJY|Am9
zZ+M$q8E09KSzZaqqclR1!yD#!9?gx&@iGXzZN<vI;VO{pw5gJH@?tXhSA%kQvDtqx
z^yFqJI`RnP^f2*ZHI)8)b5NoZzh0ZudAo}NV6@rV8S}8VQYPr43Tea;O`E>3wJ=5|
z+c`h!Z2fpGR;c7naZEfO=cuV%W|1$Ma$`Wk!LJ}sz3Sx~SCR~kP^E`B-Q1As*!9@*
zjyAoAag{ART(NgjOncs!Os=Gw6j0V<N~q#z?WWLn2=2X>Z2k+1cSLyeBFS{E6f!nj
zNxOtSiZ$aeieuhl$eJ>7k3WZH(pRay340Z-K-2p<=0+K>J9UYLpt|}psiS!$F74hp
zIsYti1XCtcsR}z|hf&=+?qi56st(6mCA~@pJ&05K_*wG|M5~I+i${A`7Or}>CHioO
zg=OG8@EXS2u?3?VZdUktcSGv?)V00+?)M_Ga(u~8p1v;9etpI!I5&BJFp{l)3vrCv
zwxHD536GvhER4jeqz?i)+%IZ2k$bkiLxev7hZL7e)@k5PH;@k|S}8B?wFRv1us1o6
zWsKtnr1IDd=iQR#qn@0)IU$1YtQs6!$xKhbxBqR!0&?vNN^P%;WG-r28y36F{qc@m
zf36OKRIX$y9q|VEAY!j4r3jp=T+P1Xy0Vyw47AU31{7})Sy}7ZI}r_UT_r2oV~*2K
z2MF$mlbrM)J*&w~954zZZR%&8U065jl+rEvjPLw7Qb@{~A=S;EwPv?=dZ#_E((svX
z!V=BWv)KrA`4{60VqrQx8B{KKTrHa+yTCTA6606h#21Ibxt$<6_cp3F(+G9*N61{U
z3mty(!>AfP70Te5aRcc+Z#hZC`MYCWwX08V#Fm(6X}jIHWdAkd%cZ+_-Xp_o-FqHO
zZW}w<TzhhH+RB9UobvT)F!W;*xKsMDTetUKxGwF73DNc_>!i+nm5CKosOP-l&U`D9
z?9GGm+aog4RoCat$f*=<{Vpuk{$5S~h&5p<oU#pu?+rw?^@pA7<9JYo&^M+&)2H23
zM|zXmL|;OVRC7+fKvK>TUtGif9m%Ke7g4k-M;aFQTC{-jib)8Qp4zxXlNjmC8w(WT
zn4g^^xL@U#TlE*eSjvSSU94jZ3vvF+Jt_T6%}0u3n@Vv$d?ok#80f7fv%pnT{Op)m
z%D7TFHUFts`tiwG4@H<dxYtuN2inMEq-aCy?|G>xu8UwIFvjiB({1-i_{)tZOHGD<
z3e9q3^yEL@&tI8m5gzE@i7w18Y|x{#xnim2hc1Y8!85ummqmCpFgjhNz_s*cDA{6l
zuPJV@(I+yrDCbkfN*m?$L^B0f7eBRcYwal`aT!aR!~JYYnk}x}+DhArj5lsSmY-lS
zbsAq>U688A;qfhB@ImZ=dF*lNkj!ri+8ZpMoo~5_nz5{Am4BjTaB#(eGt~JFCqna)
zjo+KDrNU;oEjcge4AN?$&fmo4@m1S7`_G>`+!TYs+_C!^oAP_!wULL<%wdPcx#=>X
z3{jy|^C<Hv^ZJT&C9gKp+T?C$8F=R8`4TYI#-Z?2W0UqC$pdS%xQyB?wvux-0@B6;
zd9PBxJJ|+bD*Ck<W%4**<IPN2<m4MMUec6c52~oh*oMA{$?<Wb{KRWg`~~_Fm-$Y<
z&XT{c_PnJf>Al%8r!M7qpXSC!dSixIErkcjAK8uPMaXQjlzk#zcBc=&!H7%s$L<U0
zW6nGOZAbnGp#p3J{?FCypYyK&>n*tulvzN@3T<QS#!NgS6OeUsaB|VTV`gE+Y|Jd6
z>}YA_X=TYQAZO))wy@GslwpR!;eZ~2KmfiG#UQ^)5=tQif&xJiLV*4DyhwN$1%Z(L
z=1d?EWQerPtpM>4_z?h`K`{hum<hkY1J?+rAOuYi5F>yXN+O*A*yOW=@FIj0d=n6W
z`hcGpa3<)1?_~l3Mkpk58vt+sfgQwrCJ?R?q9B&wCm>}290r7$|8iwX;31?z2+klT
zm_V2!k|z*2h+GVSx_~fFWLp6KE&V{4g+MTq1CNgpJuMR5W)en-%mkevz(jPLNf;y$
z=m_5-Xks;b3Gcx-HG$9#O!f%`cS06~&<|o>6IQ_Yc_JwS;T3^EMlga9%s{xc`d`j4
zYe4uU;A+?fneY(V8a9c!SrG`0>mcx%NZYUk0?6N<HpPf+3e&^{b%Y(r1Tk=o5c1oL
zB*6<1c@Gg|utXw<eMk@ZriQ$MKwg6Y5OX{DA7G9kRDko6hagNq6WV|K&HO<0n^^~9
z{>AV>ct#+sR}d3m2%m_4GfRkJ-$LSdA;A*z6a>~Ggs+fH2qX=JftOE0Zrtyq7eX5(
zf|x9TK*$OK0R|#{1UQ2U0O7dbelxv(b5eK_6J-!gA#M<eGYCgO9EdR~gbNUB5CF6h
z9uPAS0DKx!5EB#P-x7=<5JL#jgC>Ds3dkfhArLiUI7S70gCvT?A1DH03s6<afG{A{
zP$RNyAVK&(_>%z)^4qUw69`8FDh?hHKLsJMfS)=<U!}<q76^nHL{>l;z&9U}kAfBg
z8G}GBgP#NqK+!=7f!u;X5{W-|FM#hi!~-V)VCg5us1Ut!0$L0-1pb?$oIu$7&zb}f
zJEjcU%~i|FMb-&($H~#k(T!Pz8L)~As98DMxY;rTFOY|r!GgO!AH8rCqR>|&{FsY1
zJD$SmtPBdJM?qV~tCL-&lBZs%l=@mJ8)NB2Nt1`pwH*mBRPt$j@$=o(u@~1AfA}-J
zrMF<<6zzX9UpO!FUb{2q7mK26r&W|e)K^2XGI#9V@g=3H0cb095ZV#*i@S3xiY5w4
zzc}T3Z~9w*<yg!w=Fa-4#i-L!Uws)c^px~742w)I<I}buzm3QE6<OrXaCS~beHEt<
zrVka1a><qI(0-@g<@}uW=V;Ux!!|<?{i1*~)(z`nvZ~~t0XUy)XOt9wNJmjcH88vv
z>le7I=4LX-wX8JN1O2d(Y>~nGlS`4clQk-WVG%EO_3rqm5m3FsjS7q6rw>_wo{u79
z&}Tr3^-s-xn{dv0n#=mLD~g(do!(HS|H)k8r*G}r6EVLiJKskM(XWg2e{lcmJm_)n
zvyy+njD2TGR5bk}lUw@Cw_fLT)}M}wlAQxl9#LPN#Hhr}?hd-;mM@IVam{@LVxUzt
zQ}pVTiu$@mZ%=<$%<*on)VTJmzLCnwnC9vk#?GQBCWb|OQEO2R=kaAF|7SCzoqJJx
z42!p1=~urEYq!TVV`olusz+%=eZ5JK6n`%ET)cm3o@<_KVd0Zf%Zt9Z8%a-}u=@IU
zdURgzysh|Sk6xDkyhw;>Khyl>PnQ=x2V?xOPajyM&p0do;H1|S3m40D&Xt;kc0ors
zT3CNlb&^GKM?GLzED#M5w-z&X$@L$F;wuL>fY^^j)zUkO<3#&gmg@#L0%p_{e~3o)
zL`5@fF)T{C-<$u|R@oZkmu(Sa@$hLj>rca|H&IPdN29*-()-Yt&`*i?KUui3Eb>Ad
zNWrkvDN2goU##EB&B2BK)3^8S0&60#R!<&R^lbRs{PhQchCuxLMEUT6vX+^Rl`FG=
zD%#Q&%tz3F871Ci2Gf)~=nha~clfVc9Vp_z8~n<;SedywxiE97o4MU_05w9JGkXYK
zg$iC3<zu#WbGzdzCLn<M_usBMx!7=%3TU}FS-M+T{qwOqme$PXW)}9KoIhEBq`wP5
zJ2}dkxmhuD$%(-PVF*Du3;`7qg2CXtf-p`&K~C=fRzFV{D{E3g&}l_T1^@kFM!?}h
zaAs@ff5$<ASco5H$N!2G5fv5$hwuN06A}_c9!w`B1O-FJ!E{1UV77YTSs|hc;lVhf
z$?HGjzz^cN@_{&D26iwGDJXidTtPvY;K6bQk>KBfXN81BL=V+P7>+oYpAa0#^x(5_
z5z&MB3B$m@1L=f?pol|pa0K#Txxxq`=%I87(L*v2Mj~KfmGuv~z=ebb59S9K7K9&c
zBRE1>_@G?i$iwXhM~V=61OHiuh!FCi>=A$(>rk99{7@SqL_~>(eE-M~yxO63NI}pd
z2ht&-f`SKSj}%6T9+VXlE==@m@{cl*BCtdHj1&<$q#H<4(C7!A6%iB^Jy;hJm<Z9+
z`ajAL5kef&0}&)3zB!N%3WR!4ub^-^;$XW$;ev;B19V#9gYpwZ0{?Xf$`C{fi5@Ih
z5DAAKECcjjqLYw+yoVsD-a$DFiU=M~Cn5wtRECJK=%M-n3aLZ&6NMh`tD<nhL(hte
zzz(*DAn*Wpuv{qU=Lge41re}=`9Z-8A8bpg;NkuYg~Egn>J^mOAO~axg(5`{$`1+y
zr5sEL6C#os{zJ}Cuz@+84sl3UP?#ui-EiPpA(-f)_Z31OYB#75Xt;yV3JXFH>Mm3m
zcBmggg~5n$=vgH6P@O@OAJi+D&|w+CV4`3)`R9AUV8TR4R{xL-Oc;7-4uB%Tw00mJ
z6e$Eh^lnJF;2}99!Nh*(*}t@#h~Qzp5)nSsXP`iz56M9EaQ}dc9-b?pqM$(z)<qO?
zsLwz}5BEWspx~h~8zu;#^at{Tf#LpO{Xp-4AJlso7}gHT3I+u&cQ8Mw(BWr6gB(f+
zhS-Dofhq6s`T#0?sD46!sf!ToFJ*w&J@jtE$U|cUOjzXby8+cWs6#L?Bp$3Y41Rd-
zfx(3j^-CCB<dCkx5HRGyaRY{cA6i?$fLIRpUl?(6JScl4?C`Tlz{_(eov6s6I1%Wf
zehve}=|TMiQ`zBn14H&9IRkw@R6kLnLu)AjRYD%Bi>Sz<_Z1R^9hw`31QCa1Dg@RM
z2kQ*hVTaeEaFIiEC|HFZ8aKc?O!#1%gIWL3SS*Zy9nuZra^qn8f_2!TGKea4P=4So
zzzX}HV;xwB9g-;+bq}>0amjG7zrn%$d$2vgI_%JRj{rmLp>)K>{DHcFb=aYFU>$Zy
z55O{8<e&_|It+QRZ-I5#p|vP@jYIPcQUv@vP#3TcJ0vTx4m+eTU>ycKIIe+p*daXt
z>##$8Mg)w-2lW7m<-f1d-CWGj4puI|-Q($^y{(9wCT0O0Cnw^LkI01%&Lyp#KrE;~
b`1RY-nwg8+?;RF#r7KLz&MvR1K>GgxiMm0c

literal 0
HcmV?d00001

diff --git a/images/fig8_darcy.pdf b/images/fig8_darcy.pdf
new file mode 100644
index 0000000000000000000000000000000000000000..8cbe6c3bd23f7893bc85e2a09147a7803a1d6d7a
GIT binary patch
literal 121079
zcmeFZ2UJu`voNaUtYlHb03tcfz>ss6oO5Ofl3@TrP=e$jIZ2ivN)#nal#CJu5l{gU
zP?Cxy5&j;~bNue%zn*p9|K3~ct+!as?%CbDtGc>&RdrX@X3~(A=j7$$!(%F&fjn%)
z<Av}*T&=F*iHbtFb$s0r5N;Vuq@|Oq9fVuM(hlJXfr1WN5OHxlgo_QTqu_53$h*2A
zA+X~P+y?4a*AUi7h``BDx$8&;ZKNd<0pUBjp<#(cB0O9m{HULJ+}ie*HV!U!5ctnl
z4_9k#1QKElz{<)4R1nvZ5N;)BfP(bTtIW@<62$a3ba?+c0TkXS>^%?wyA$-ewGf`J
zULMw9J}CSFd{u;vgQc|VbpVkE{0Z<vx%i+km=Kg#P=Fr-E?hh?D3ni7KnM;80J&wr
zRKa+j5TTRjrCeNG!7pCa!@rXU)%=T|DhL-lq&<Z9Cl2xsPJjXsZh0p_7FmR~s|^A*
z5l^HC!qOS<de*GzbR4yUN5DqqvI0p}lyB><GvaEn4UR!M&iD4$*cFQIOz}p_CWZzU
z5^tCvJY;8NY<y5-*PE|OjAr{{t1qUxi-{5Ty>Be-=<C7`_t92YNzbkC+na?ywtq~A
zh#lTOGN*a|nfc)8`v`4o+fgOahuuh_79pEY#qXLc<8I!1eyj3@TDJ%#o7>pY{$%G|
zcxRGCUS1u`x9HCN52Y6_B}o)#F*}-W({?p!6lYp((Hv$jbfxqyCKJw;rxWEo{Jwbo
z@L_a0AEm0`YkTIq{?D&0SuIw!wul}seO_8fk`N@>8K-YedezhN@McCN(JkHq^}FOZ
zk3Q_aSH9uDU$-C-?i$ycH2`0>PrfCZcIWN6*1Xz=nl)baH#)fsyy3#Sxep>+{GvyR
za>YeN_ox%^F4WKwU2dzP3_lVU-(Mg3x<N~Kw7WP~DY3U-)6*kCmmA=<yE-*@H$>#7
z*TvD&yowf@OV-sRb>Xf8@+;3jumpK5T=yZ+n{c7Abz$5XsSqgNN#Yg{Gr9VtXTGz;
zyQ`r{eI!X6FAVEEjqpxY5$(;bo}L~%37XO5=ACYf)Ozh)3BQJevrKZq3&BUi3zks^
zXIJ>5N+g;yjx3%hb6%W_X*C-E3Zqr==CbtTytO;<CEUowt+q_}KycwEly_>`e-p9S
z`KesO33}MVhpsgdOk^JVqesh!kH5sXJ9l$IOREh+KGDdW+vI6}`28Tk*NBTPh@HBI
zB`ZY0fvuLz{JRjTRWXHizPEO9`)spCkv+MTa&<u4jHxEITGYJY0~T-g?37ULek-$%
zuU}sBJAHep_o>>5%X{H&xeLZz_vdA**^6%~7WzrHM^s;4P}w=}{MxMJ35Jndi1KyM
zQWwtNIv8yU!8dA{ar@m{yKBu_HL4B8wK}d9H!K2v?7Z5Kf~$2gN5`#p!-_<y4)nDo
z@(4D<VpBYQL(A#v!<kyVg4SLNRdU}N+kgG>VR@}JoB4XTz};D#{&L1q?M9|r?ST}2
z3hnG*&WU&CuXvNHKQe6(Av|o8R0y0iYx?#|_86)3C|+B_pDf)eEArp5HzccgZEs87
zU@7zEy~Rt<(zK|(Gz71eaFLr9PMUrcG|wcp=h7n%=ckSRnU_edvdV%u@_no?yb)@|
zeNBo^7&0T&NYh-w`@y&N3$^?^3iBPe0leu7cQf-jZ#&9|6YV_L%{lz<nRx%0X`SgA
zS_`wf=XgWH$8q!WV)xv-*aC`G9I3y(gf4Q4sAive{@(i=Z2CF-T=C&NlJszZresF!
zX|eJc*PEBlAN?F3{>YwwJkpxzwh)1%5Un1$CcJHnQFGq($DlM4&CR;=;avC1eAcq+
zI=X7)?A0Zzg!OC7O>bUb3vgYo6E@Itp&^~Sw5e3BJ@BT?-l&J3qZTXk$~U9%xopEP
zq10&Ty0aNYL@hR{M!wzO@77wZUrUvZ{p!?Pmsx~%jvC=hYMF8VR@%qSPdSMFL#K?E
zry+=s^49l!ZVWu;znSQ<5OKo!A*rRLc@9r14zYYvs<gO<1T7iY1wXAjWN<xi_Rt>~
z|2CobU1Z?rG`3<~t~yQf+GjNGXI%Y+VR2obkbUV()^hB#pHtA>xR%j)JcW$f<0&NN
zjH*Uu8+CIebtzuB!}CaAm~eeHQPstR728~-X}mpcb+n;Ai#Nn|fPi}4CUqZAJ>#rr
zli`;V=a2IxQM=Tw$*bOLqtV}AF^N-L%AUSkRNhV+b639U$e-PzE==m~vxlx9V<ul{
zm|=1+%$tzb&bfSD%fVV1%^F*|FBS5v>Dt3@*<!DkjX&?*#gg&Q846vyh!sm*na#>;
zCKm3?)SMihlwXH;4o12CQB*Z_I+5^_>64e+Z_Yb=Ranfxse{|>I@M@yjJ4ArM0H)H
zjAJcfog%AYl1s8U=ugBj{5(lr@?#=Kl3w#dcmK*J6aCE>Jg#ww94*7JQB|8{%^dUE
zAmYf|iH=tXSh$Q|4+dr_Z0a%#Anm=Y-qp;j*x&9L5zEyYy=zSUYNP13cK?I!zQRCE
z1I`Q2H{ZWmH*j&Z^{wZaYG9>&%((T4$6qpab@O5L6NdGTn7sI|wE+?f<KS~@5sx|;
z6ES4hnC>Y&7_u}bY2{Wb=F^Yh$J4wh&VYZj3*$3=So~Nmhow2iAfCZQ^WfnX<xT~g
zcBlNT^n1+)Q>jer{aRVMG0OafW)xxPdbN0r{k!?p3q|2_O83-8YbzqWf|rb+PLGp^
z2-|SlDb|^!+D!<3zsg<6(`D3L9Uz1DAseP_7De8>sdh&1g@~q~ju~EBirFhozw8;`
zFSUifOZ*D`8s9dHB1t{OKBrw~C{%nwY4H9&A8na>rn*{Il482FEi~i#vN<G^*Vo1H
zdt~P4h9B=&26A(bdR*U%AMLF%yWTw5tE-EaGov``ikqtS_-wHnU(p=8bEykkI^%?J
z?hgy&0^dpJz6tfI4#Dp&oCK|JQVG=CWX(l8@_fg93OU!a?<j9m^b1ii7GLPZem%cw
ze4iJ~HD*>%?Q-!*V`4OE{?>WchRe?!b^`^g0_Y)5ce<wQ+2fk>8XE*lRVr*LADu6m
zL!U2HEUCHnT)crMS7z{~@_aI1=*N$%=<e<p#UVsiuJu_|!cACDA_h}0)<cM{U{66=
zRYNNAwPWrrq|&FqD=@+|xo`vVp=~YmDsH<ly=o`+v!Dd8i1x&C8}{vID|Rm`ie~vV
z(&gF(?fQ#@F7lZ;3dvxtJrYGvg(L2$E7Yq8$Y@Emc?+ve{~~tvV;!?sRgc|!Mm-vo
zGYalZ4NaAjoYz)77~RU3$i13AWLZc;{7~pVmifX|!j*4XdwmtYP|XNlx)B`W?x7l3
zl<lER2FcZ6->r!F8Kn5FCuGFM!jvRKJwj>|knxw)?|Pswo2k!#M$Y)ATJ}m-#pT}{
zeNpe^`IeV}ZaLiv67!I#-0f3`UoH*ln_E5Cp`*hMx=58y1>tUyGP%b+9o4L5)}t%C
zGff**5;L%yLLEMyLv3HfZ<h*=zzFG9GSaJ3ZKnfqmg)VvpC07|t$AUYo|hfs^Dnf6
zW<Lz?P}mSWIuqU3veTtwuTMsCBQC+PhsQt9I_k553RM`7_v;-ZSlEkNuAZ|4-aYBw
znM6;vRM8NR;4-9xs$VEK8<et%A8AXvB{k>qnP_j8lBgSN(jdC{nFjIL9vbPHXjf72
z_OdGXM>*nUx$VBwefelUD%gOBDdZ+)a+u@Q?5F`Dc_l-4rM@uu3fc!*b<6r<S;5Y(
z(95js6|4>qMugIsz-UE-A2n-3=Q7b$EgtB`z{+qQA33oL%kx~UVD*xYzowj$Os-F+
z!2DEZ`_X5@NwV8KBUh$6*~@U<sCg5zsJp}1qk0%ZL+ovo!2>ROgAbTMCzgB_VL2^;
zVczCd>1H+nkELDp30BkY+e5SpR<}Dz&$TMZ^)T=n9quYY!E;2J{X(oS@f@WCbEG%e
zyQ3VhW;q8Zek5>|4om$qfz@Z=uF7gd^~fsAQZ6sR6pt~q(Yn6CCS3|U0U-k(rzN!_
z(#1qkMoK|f#TCq1wU5*nV^osIM7#INfKnZzi@Yekl;J_zcEVg{u-njx7Zh}oE45|#
zw2rvLZ=(H<d>qG<1x1${O=bB9k$`-mIUSAKPs-{G$*kupMudWMI^0z0d!VvY6k(2d
z{&a&<4s=u%ti)sIZlQV=7@QL$&zHw2n#<J6yKj;R51xyfx2>TlTC=JzZj(23wN6bY
zpCpt0!DP%mJqku@rC_{*ssvR=Td)`^8Gg=q)I|QIAta=T#)**0W&It&`fAxC!P+j6
zR~GD1h-fqw%)x6c6+=i^^N<-;V=k6Cb95PL&ql^dabw@}PqhW32E{ktG(T>jNNBRz
zm25e0HgQ|%>{~4BCp9&Vxhrv4noMP~WDUw;cY3v|rL#M^tCmDW-hIzlk66?R{%ls*
zNF@$YM(SAbER!vG*IwW8oF(Sc2<^@$7f&miV|;{R)EF-z^2xh)9@X+S*gO6MlI*y}
zqQ#;Dqkij$=I6T}v$(~*g66jBskx)}yAd4e+_d{`k}Hkb4L3?`d@8w&68)4-2_7V*
z^3iE>r!6*cPR;V)Uc_od^W_S{Z}U8}A-%!bw;t`seTS)OWgTbLF@`~IaPt!tby+cM
zSCn_C)A;8EY-OLM?bxre`Xi}f=N^ZmowX-hiq%{Sq2-vSdBC*t$-gXI0LWHV))bq8
zvm;6R%rU5zrC8#$az$>~fuHd(f&ChpRzZ@@PM^0zy>yt%4@!D9lq}oBFCjFr|Nh;k
z$yzb#VY__7Fan6vv$WYmkAJ-1e&K35<gIX@Z1AquZE*|G(5Ke*9b>Fmy>%vWH7<ge
zRN9I0%K!mgeDN@g4qbM+?NZ+CH>6K6dKm4d8ZF^9@I*@O5O1y+b^L6Ge-F~fwZJIT
zZ$OqXvmzBv$LoM1$1ETRri5vbsKGqiCS=L<)oZ5NfRTyRYNSB&B-vACDH|^;@pxC<
z&9HZSf@R-qXc-=UKOCFQw|X>r729h+&S6)vCz(%IVI;1y)}L%;-CnGW&l#~z)43TG
z7wLU7xN}sKg-#+4>9a-U*xkc4_R_C-j!{g8JJo``3ny*p7WIk?wB<#5x}07b>b`(A
zwe!7<Z+Y*JHk^F2VC6zwdpQ%_K=4tLU6@N9@w{r<;~$R{m^FU{huCh^F;j8*@Sz8P
z@MXMmwLgj-?|IhzIE7#*e^)|q$D>3P`<Ka?t5zgFn$MIr6U?p#Z-hRX2fme_@jHUa
zWKqpV!w+**6)bK-ymSRl{dkVS%ytIOfiM$o9+~s!`U%~@OPQH+@0wC4Kc?TABpnx2
z({h<y0s2HRkbGKSF*Xb*+~pU0?p2c-r3WvYgZDJml11~16?jj#;tG;*2eBNb^PeNx
zNvjF;$<l4L`j3T`eco!Us6TkS^R+3&nRExD*rQ<D<=e=a9Bm+5+#gk6=Dz#ZO_epB
zB!P$s7fdWlU|2iCb5Rm*qJ4gh%r(|Y8O(7=Ug`;W`AL{5W89TcqHj45GuY;3D!G1g
z;45rmXA-tMDA7=2afo0RFwrb167h<c(EtF>X0jP(#MuDZ{7kD`k+B`fh8-^1m#F~z
z8SJFk#|Z@b$u=Lxtjs2Wv|t@Ou(3F%+wIr+49Q8^Gj6IGgvO6O=mku)p+e5cQe6!I
zn{7)MKB~fFqPeVK9dZqYUP8-*N31|<-xO!J)ujRQ_@%V5(1HyR*2x&o{N`e0V0n_K
zs@nGz`=cH*B5g{`c$LOcH0cbL+7~9A!0>QVj^_j#WOzhcyC}tGS9N9mCU!|tX`Qzl
zmXEj5Yk!-brAMN5MNKp+n8@_Xe03jK^MLjU`xUCQ`~DL_DPwaxDn259CUS3@?_009
z+}~t1zHY-%KCl^-oF9$Mj(bsvd40u4)u&0tj&#(4)6Ec=f68jeMvSv6u?}|l{t~lm
zgtKG)ToI4CI<aj&8+6sC8;KQ!WOKgxffPXNE*&Q+tM?z;BsQG!Fsio@n&F>b<K<*a
zHYfMlpb}@mD~>J^h<)d_G5hrGkoOG(`UMq=@G}=h8E~&etGiKNE5G5hv61{~-Aisj
z({&|Eisn%&tk9Tiz|***$q`4H0Er20CJjvas+RmF@l#9TRu<KO7wM$2>?(r<kWVX@
z6qZsyCw+U-GxBM8Lwr*80i}BpCxg`BW>BpLMxfj~nPStJb1AFdrPBUJnFXALboTgS
zZ%96DQ08?S(XmafT@CZ7=!;y10@F@f;9|%QRkhx1t8xI7wbD7djHq5kn>4DMrqs}z
zXFJc_NFBT>zH{}_bkm-fQ<9u_1~BUcMVP+K5zHk2Xd2f~oE3+RN(-9H`Jq~N@h013
z1*KkWyeV!;U6bFCUTM&F8|Xrri8zjg&h_7~hWo51tZi?$;@Rd=vW0<1+D3)3TRE_V
z{rA^vW}hZpGyKTO$Zy{~;Sm<|8sY0Q;O#?bS*@-Q=@dC@Ahhx9HP_U7^u$CQqKTMP
zh4`cL2jdGsLb;#C?6%1+<r0<E+WBGEL~|vroE0l!90BB$MZeS!ODl`~t~(6Vg!pG*
zYnCN)J-}qLUjBS$|3licvOAqZ?ImkbxmOn$X|G!BN)BE36N8K%n)=1x^gU{DdGwTG
zk<7gyY>x5AJY%X>ppILZM4U}s?$<J@9KLItigm*SXWjZm2lI~J2{g^Qs8Fbd&g|RP
z&pf{^g2hf7t0D^p>c08?gKY$mHSO`<TE=e)CdoKtk(JH2`oPN<l9ia^>`-3-A-m0=
zU|5Oeh}Lo0?%rS<5H|LADr9{z6Xv24IYce(Y@msAne)XL6KD2as;*#+MoT>@1Oi}%
z&m(1r8;Bfae{i=lkOZ3V<QZ@B>TT<H@)t2&VAZsJ2LN}C7@J6$NrKm2QVG%>{Rs8C
z&(g@av7l@M)*3TCfI_h({z#CI&@Q2V^3@&=6^`Rh<6K!YY&Xj05~VdiXBAM8hRtP4
z-xx>Q$f9Hp3yG3^F#{ML>793hk&eZpzWCJ?*Zo?Q`N*34K=dZ+jjo{(>Q94Ts9=e6
zNxhvJ`r5j___94a<)W7}5U@qjUi7`7zvlUrjF>=mA_R~fNsSM5Yk_Q&KFlV3z=@I=
z0gDflfT@U!oIo>@dScT>&UATHPdCTas=h#0W(T`qume!bcC7frdpt+9fNZOB-Ivw#
znTbmJx(+NCDp=nek0MZ(shpB+@LN+LO#qsE_tX6yLV$?Oe|R;e=RQDBNK(JlQ-^Tk
z_S9occ5D=UZ2Y8)$-r*huTE!+#pvV@J$Sv05YaOrUDmMV8kL3~6wCUw`i_x|8{ZWO
zxho8|A9ux2YITJ0Qi9^GBJrWwcU*FELxoFxxmfcEzO5Wq7aewPV?lw`xordHiJTmR
zMTZV@+CJ8?A41SYBI53BS5M|fUvoK+8*<psB7)))Z2Z2Dudn)S*wx~j_Tj;!d^#?P
zLU6<iFmKowOb5(+Nt8RUc=2NNn$0}6+YMxy$Wp_kOzM22`u#_9Z4tJQb(B1+0T@Qi
zNaJL9^N!2wjio2V=BnKvbe<&;0MjhE5A71M=!F{sYa7W^>&Y_8imt5TXR}B8>x-4R
zqTG$e??w-KANsmeyLf$tu2)W{s%$gO*6utZFyRwc;JsDil9ukU`K?(c==*B<P0x38
zB(HGZ5(F?d_a;?rD)#%ZMFgThvDxzbdZYe9HnXtoHMx$u_Q^{m^ET(xN~~BU4)V1o
zarrg(^IdzQ%v`ZdRS2+xe9J74)V7}36?NJ?@cc5hk9BU)RRptsa_d^aOzZgoCIn%u
z%m%LR-nwXKrLy*?<mJO`<?kEL=E?@f3L}X_U*@idnNxNfHP$5(PZ@sk+(@XZ#UUo0
zx88FT1y+}o&9!$L@6(CJXPGTyzZ56lOF7pA^OvOdL%);bFvRnrsb)70_tOi!C!$|d
z$uIJ#mB%<<`BZSBuBfzOm&0wY%f0^P^MU$SVpEdww3y{Llm46M2URuScA1R?VMKN{
zM?M~k-26ljtvcsMETW3M$Ppz_cu91aeT$+PhWzl>a7Xifk#;C9T<WP-YX|yMY5fEI
zwa=D^6L%O{O~q3CsRO)bN8bgxl!m2hJSVqo6LTFqH1AVN@_oX8eNR@bQvr!D*0*e5
zgMUOjuT1#nmfGtVxSG3I^E3Eh6B)*}D>I8dm~JJ3)O$U;Go1>l#DyEUh`z?LR_%F#
zX&FjRug;~=aHFx{;{rnOs)uJ|JKNV#@?}$9!+F5v*C#amJgghrh3mo$#&q`b+(W$N
zgImh9ov-F<KHU&or2dw=g~u+PO`uY%at>}l!Xrg*mvV<rz<{_ny4OR*Pwr)pST-To
z$43Wv>}c7(JR|-1W9(%W_eXGdOtPDY>pS*|AZSq+Y~ao9`yVfeMJ&GT{LWs6vw1e4
z?BmoAa=qJUD3e<1HP7oA5RaC*y-Y$iYH+fWe|vX`8qlLxN}}#o7!!R-sTI*c&-Nt_
z++AE+nfR#<EOzO@kELc}mzz7H;#vIfOHEXDM4bu9(oWgQx>SbaHL>x4kevgUT*9}K
zPcno&=moz9o*@8Jsw7h<Xs@8P+y?|vAX-5rBWgpI;ZoISJWi;G@eH=rn5$C(gtf@a
zJ!DH^S$%PQv|jVEJvb5HVl$+K+6mKKtCA9TXm^uy4{EWh?%nwYBynimM{Hk?7_cL=
z(_So+0z0zn_C=S69Qh4M85ZA0*`h|eg~O~`3*@&}UdFo}4Ad4fpOH|GZ3Ijvud+8z
zuBCd&ZEXP}dq=z%DbUG}fSa0KWC21ud;V()dl_n59;)_vk%1Gflbk8R^J6p0>H>E{
zIaKL8UHdtGM7TJanx8B{tBA+?>ube4HDeH+y@Ov`t)}6X^>1C~S_EMVcrV+YJ}3Io
z<TRGGGybj=dG}hbg!t$Jwp$kd56>P2i5B71g-6dPE^Ic>_qj^AMv;Es-P)_X(?^`0
z`!?r@hA!af&ceCMqwVk3U%alpa5-E$cjxfiZVz|v%^!V}xiq;)2lHEB>vCz#pC0Tj
zRt_B<e(CxgPG{b7^YivrPf0F~S3CFH!`=D1rOLPB;s<+ewR7cS*lN3xkEm4CXn3Fc
zf1Tf(Zq1P?b|pH(uTqU{Mfuczx_^Fp*N%NfDE|>0&d2x5<#z03LftfmnEtxQ_q*Tg
zr=v+w2soGi;A9eul_F{5!I0Zgo5NAW*;zq04u5xLSDMCr<KN<XO_Al^>+_{}q8DCS
z%@JC)ut@b*PbvjtwZ671Eysp0G2GkZ&HtW59i{4(=!7U*q)T*b-#fE4d(rTpGvPyd
zz5a_Q3<`t)3k)?xJTU1AJ_&`!1-7PtjqfXb<#Pn@xT`dmVla)v>SG~IDIvt1>f+xw
ztWiiQE>qHRZGozLg3g%R)3SPlcMk3zMrlaq&pdFc^P@MHF;=BLy*k6rl)HjQcbD;)
z9z5qrUv$B)o+?H-cTVcVS#z|S9r=azm#;J)gkkViJd)ae8R5O>CT+$SKHeDPsu8`N
z->^K8R|ezgt9Q<NV)%aKdYBIUMwtC}KsMc-1`#QF+5EIwK`wmDMk}0>rxXzdVwnx@
z?`LAA2JHCm2D8Xth`tr+hfY-FyY4$Hc;U#LBb+$k2u*odAMF&Pp`5Azg=jDs?9W8w
zPgIWU<ROsR5enrx-?qQ!nL~tCqqxzU&D?~UsK|?mESwc9>T?!#R(!!Ub@yPI{9*L>
z_?<r6tK*JrBayuCz2t5`<H3!M-51oY9I(zIN2k$t`urCC8P=1jXC%*b2lrf`^gI^k
zsGfMXQW@{Ad%m1#YhrG^lJu_YGr5{;k%NyYI#@Cd6?GAccD-NlHiIRUo@|6Tuz7M<
zCS#skEBLsHr}-i8e5#RO=>-2UnnYz^_3&_-lTZ5ow@+R_^55SNFsHa**bsZAbUDat
z-#fzfiq2*w$2qZt7Xj-WBRQJfz1}REk2SM!#d;PE(b!<Sh|ke8-^t}6QeiW)X;3k&
zQBP%0DeDU@qgaW$>lQw&?hR9OS#oj&UA6s##WOh9E{tvCBK_Z;7rvbF9vZtS^di=;
zVq?~iYq8NrM=$)aPh3yz)%N#uju^hv|6CQ=?@rwlC;74Gn_Jq_6LC^gkkL1g)nk`M
zT(i{k(zbN*<W#qEa&Y$oj%axY4^O0wy`=|)2aj9D@@E~&&kve_Q&|?_Y3<?QhII9S
zz>a;>5N>TRE99{&9t8`A$E{}R495BIK!9<iPn_ADyga;c2q%o67s3mN^8g1mTo6c&
zV^FG=NDqf&k2e<&4@!Q3zrSiIA2&c!132P6A$-SfZ9Hx{7vQBvx#|B75BTdAx2%J$
zEdn^%QC@Xp2=JP7D?<dK5N<69FA!tgZYO?vZhZ$Eq`fBub`luycOb#>Y=80k-&FmL
z9>+-kdGbz{cEBwUKbhlyO9lwHl&3W+DnJMdL?sFm>IdhsSdy`HQ$#q}*&|WQWbmsB
zVh%twgoCw|i=7h!(2H9eiE!3KRa7mnAI}WJ3*+bcEg<1|o+rW@&cg%wKTz=gr(?i)
z1;I-4Lihk52m*4$VQ@SlfUJNZ4+IL<3ns*KT=)T=sCHC;7@YUy3g!X&|91uNS33;!
zMHSQ-zY0GLFdz?#0D^p=fPsVrAp!#6Hw+5l2fzhTg&zum3i0EC0)g|xA^iMc5I77X
zzz6yY0t9$K9d$*u!$1Mi9s=Nb)R;m*+rb4-?xC*7lYt4~p{^(-P?JIxI4|t@S$;6_
zlQBSF0Qa~K;{${cJTCkKLdRDj0e~;K59ft~37){^1917FfG|R+=lCG};3^1+g}NRW
zD5@X)m<XsV3jXn;p$G_Y0EERu!Q=<e924aia;WPu|DYi8p?>h7NQ6QgH8s=~l;d?l
zfjcR9{9ua5Pon7icLgALG6eJlIzI|4fcY;r__bWWu3*XVej##<6`uevc;I9mQGD<p
zsG{a{%uIlxP*43e3JNJ69=zkWp92WNg}@7WQc#R=!UHHi_|I}oYrq#Mp7^aC^8<<}
zewAZh`N<O~e)zqh@H+kt#z67LuY#I6oJSC>A;1;I1E&-r0OOc1cu|!4yZqvbUsu2j
z06#vw<14EETRC3qlXg^}zY2;kP^*f%{%y6P<mxY(rwlnZ;<Qi_^VnJfH8%*~Nj%lx
zauUq@?`M966v6raY!isZw-d|I<H&C4RWk(!N{aQ_c<i<wIZ7s(*w9$)l!^q!Ylg!*
z?dJPJ#;W<;T*+e`aVi<Na8%Kf+Mcy%UMIjmTVk1D&Gl9{RktLiA~QB;@~O4dONTUm
zLg&{(U&`-Dbnw5qw|Q}uRvNpS1?hq?!p|@eb<7eOyf?UXQ*GKu>_U0*c$t95)TEg3
zz_^B)(f8Xg>>vMNp5$)gHKPk96T<nYs^$A#)&4STdH+0D)#puwZ4d&C;T%>`w0B41
zn#l}Pt+9l}`PI2d=4^{_JQsHZg2y7%<-6nB=>f~MB#9cHv$6&-rq{O%&G!d*I@1k$
zYbyoxD?C~#W~ih8i5QR`|5ycqe__qS_yu%%G^!q-At?^~fcHT@6^}K{L{dB=WdM_O
z;B3vH%3vUejIvE?WHo&}!pbu285CX}*w0{qC3(?Fm1uB_x`LpB?+iaB73L{8ow5f2
zdjF4m0N5kGpE!l3o`MrWAfJH)k%}CVK9>H)Gp#X%dZ&Os#kvPl>5rhr;syxYcyMGk
zRN8Uow9&rn=$`94oDB2#Yd>e)TaQaYKzHwTXbQS(a5b}+g{c`jxikfp&HHH)%IK@M
z6s?(8N=ZjAyT6gm7g4>MeeUtt^t;d{^lvLPtEXUiiYd(tgzKMCj8`V<gaA`IOIqQ~
zQQ+6dV=KWkw~PlekRfE&1KhIu$kmkap6=w>9eZo_+ngqg$ct*)RCl7AY)$h9ETLnr
z&6y2tI+h79R}1zpH0OUUvkkA*h4J1N$RN3B!RF&}?%TH#!L{kccqe_!;p~frH9Ug}
z2V&>7J%>Fb5)K&6Jsd5EGd@sKaz3OgN2rXfT0U^%B={IB<<tLd+^^y*5AnuV^tV#t
zHm6J(6>9lQy8L{3U_i$FamxH!BBOVua6YwaFQercz8Ub%>MPv!Jc6T%kaJW?qm80r
zXIzh@f1p{h%cRa@#=PnCR5UiXrzzfOQ>T!w9`3yG!=UC0UaCAt=u}S&9n<^k*A6bB
ziBURq#Hh#<T}F3romd+3OJWUw8_4IZM#rRdt^l*ixHFC$AFAl5)tQ)mP*s7cN12c7
zX{~yhu|%)<!`>^HNjItW<@=eKmsd!4N`r|Vx~-SWn9f0|)xXVmRn~nr`oR0`(F4hD
zcssQdGi;7b4r87&`LcjJr7BI=$e@8|)3Aot`<ABgq$IPQw50oO?DSb(MjgB|>V_X|
zN~Cag%CpYE$|hTQ)W+m-eXcb=W#9hxb?|b`G_|+h)#7#`qIE=)P_Rv<$Q7rKh4WwE
zhy^F43$#Xa2D7ILP1@{N)5%?037Ox|ddONs&U7G?B3eCv@hJE0_r0$NhuASJHyKY^
z9aQA&e_b6Ofj_T~Sfa8EIxk>I@#DSSRL<8zmd5lqx2BnyR-&k<DCDlCHmVqE)5h~9
z-M+Q5=~kWnMZ{^y*7luIL0aTu^3pK5)p~*d)S$enA#>Nq+qS}W%bG%z*l^Vcxeqyt
zX1T5tO<u_{-X@l49?qj3=jXx|K<eK^u<}_y_<n2j#z749-8B_cC#{D!=tRwAb(fd1
z6(Sj|(<qk~q;OZRcGw$5r1;38ORax-+<yaiefrI{-bdJ_=`TcBZL2;ZwYXd;!|7>z
zzuezky!XmcdT6(booP$)RT#{JdELJI!+7s}{NbBe4COl&_Vi!hRk}=YSu|@4%URi|
zd6YRs>#FT&kc~BTJ|#H+%}Gv%)idGcNAu1X_>QSg6xXlrW76K6y`oH{H#L1<ZKGUt
zYIujvXc9?x3hhy0#{Y%(P`-bmL*)`w!C?f>?VX$g?#&19^~Ht?wG36(TM3^xUuHK7
z{eV7(Myjw$BC{HqLP`hq=U#^T*Fi-#g{Lyy)azYLIuV^POXGJUYy%=@GCs9h6506=
zHZBUi;nLzqB5ZQ~@-y)V<0C4F4Uz0=UXo+U>soUcos5IYzFjS2&d%doChp(#Np|%2
zB2}-fey{VK-spKb>BXojr|VMVeV2)!5JoendeUp|J-GBxn9CxGX?`nkCNIU--%m@4
zm?y-)tj~TB4L+RIWJlSZsZ1*ur_YyOC8ET?8MrfF+p+_9zw?!HH`M3t5j#=9B%1iG
zGs=giSf>yVwR8I~!~@3qAEgQm4%g?=;NgSn5A#Fex;#)m4ITlQrXuhAU|!F5jw&Z2
zN)!6qxQRnS4+rP^-(5vN<0yPC{1o`77(h^9>HQG_eoZBpXFLQ=-^mZ!&P=Q~Gk4{M
zZy!x+^^@U9GS${ISy?lpar5p9Ma=9b^5461)6PTxfI~f0p`-kr5?N5%oSAp<z@=`4
z1QCp`IZf|HVRsTiuN+)Vlo<Mo>AWyc6PDL2+t-mT^m8?gTF>QE$0kX(M%gg>wQJw5
z1d}*F-1q!mhVT6SHL05SjgLx;q!CN0Wo?KB@}w>UEHTXnW!`}Jk52i_`OPf3Ax`4g
zB4pE8?A}GTx3dfrtv0OL&Fj+Jo6eRvTi=(z+B4QlsH&QXvnPvdSIf6fad>O!Y0KpI
zb87TD#HSGK6eCLDUmPO+S}=?Rd3h|nVoALydP>E%;a*w#H2ljrR*Qj#z$z&a#ICp!
z&W=8a<q&!wyBhK_mNPb=jhG|C31uym^io#-6Ctqw{09etV~Ia5APoLk18|T4U?4tV
zvOu9IZbC5-cz3a3o(&ekLKdl!XX7n#F1KIwsJAfkY!ik&(kK@)p)zqe<6b~wcM2}2
z7)?;HNBJW%{OUr981w`KzM<kgx)-J;TT4o6;ji{?H6~`L#c$I0jgiu1T+d)+tg`Ky
zHnM@(zSCCeYTbT(j`YFKJ6eY1Xnf1C1h<K@1(%#S$|LWTAp`6U_->S;+4)x;Diit?
zc3jh#)(%<Eg!)`!Oi8O_y~<0p4HS6t32q~6JCh-vI)z((anKLTf(gty(Hq;-9Nt1V
zi9X@OW9iA4cG>)b;UNX9z8h#4J*19IXLo7knwFU$mvAX2G_BUN7H^wB^+wV@VIlF9
z&XnRJrGLJ{R(w8Fqpap$o|dLtsd&k9S?;Yxa}&-}=yi&v2L)#OAL%8gArdEhe2&Y#
zdHD;Y8?F39PTP&Q73i6)8Y(wyVV8%AgA@pOlPedP%JV9MTBD^uyUc$I>3}?x(Sp42
zI~RdmErutM3e#l4BrFB2<J#nSv9eZ>#bVf3guZv+-S)hMSk+Txj(orn_YoGyn!|P@
z_c{f~S})v~IZ^CAWKK&fvacvNxnIJ$KN(Nhb_9ciq~V<nsjA>Wlaf{pRWkG=ZLv2)
zK$&RoJ>g{=)fZ)q8B=5G(;2(eZgu9bZPZeFkhFulS&v_Y2$47LEJVVwRbyW-ukMgK
zuyJcO(HLdl^dd=_y|8qFB+c#?)mxjRJ?z79BZgBbc#0(o13S+@Q&3CUrArcLdWp;=
zZ*=qSkgt~RZ1Z<lM;WbBw&qCQZk~Yt_=ZJgQxf;kzB;oCW6@%NE@Pt%--xE@SSIn>
znY4BKT2mxfwIGec7kp?oo9zAP4@UBLrBg$(<JC6v@jC*94i~rs+b63C>*vIvQdO5f
zuu6BkXi{a8ND*5uC6M1Q)W|jLc&oYoX$OjV%{8V7-<o<0_c5llv*I(fkCJC(SCe(h
z<KyfuleUu2+F4OsER8%mTS28Gn|folC!+Ml{g`IiXX5Ir`z)y{oO<0Z+EnHT$uZ;p
zNKCd;zAwpNhIMO(@eLw<Nw$R!6nB><oan=ZT_(OnF4Doepd>FWl!Ywv(-suoO&fX<
zSI{)nzd#1jrA)Y~JpOdE_nZ15a@y#*SF;CBf#jm9)MgV=g?#n1XHfC%SXRFRj;f29
z&GN8z%k#t&JDt7g7k_v(pXV!aWO!`AaQBIoY;2U1r`S`B36+g5p@~k?4yTRmiTp<}
z7#n@?>&CEapCr9&TE4o~=1Rbp3!G0`)89?)lf%nj2~d9@-^#msI77JqK9K|mG@N|k
zc#Bs+h!121fpdLu==#e}7Xas%fAHNbK&y3l;8i-ki;wvDF={;8I2f(Z<Fnw}Nxp~H
zkDl4z#lt=Y(^Je&UT`k;M`)^dq=?XYanLt>Lvtk|lGlgybk9v6nJd5Y9>b^Y3v|-N
z3StVs9)4+VWcu7&IXJo9LYBD}s}+5^x?3)fHgznk&ll@Ef$quII7;lVn<>9g?WE-N
zA>}M8PfMb5tzS>uQAlx4Ae0;8#Fw6QO5B46Vf$Z5SMXYJDC(KrcB<SyIP=1ZPwA8i
zoodVd3xTAnsT73{%z-8HeMx$=q~;Qt44I{)$$p|xAq?Eg#H7@81N?Kmx9K><b`$75
z1%6z*SuoXP=$F_xb(Frupsl&9b)U;h+BD+QP(JadSiU2PVfE9`LLB!pJX^5oLhCVL
z`Dd*Il%NgwKcvu;su6fm6B!kD)H_;r&Kr%0#?H8Wm$yY+xlMS-MtbH#U<Bk7+M^2`
z$#6I+)bIuR8et!yk;P=`CC%ty_T&j%WP#qZ2ZQfwK1_HE$Z&pncR%3szP(<WMd*m~
zH-qcuq2lSK8Q$xO(tdNQA`FAHc!f|APWC4^o_%x)+Lsv6+WgVCvrAKX?)ia9)+rP`
z#h?Qm`A3eBi)|-vgWzBs=}6(?;k{PBk_61D*z-_-izTA<+nD&ZzVdXKDOb$M4Y03T
z&uH9{d^+dB**AlE&W-uj>tUU&)G;521SMV8nL-lZBO<#i@%Md4th0CUt-mvho`U5m
zX5YWs&B_6>Da(s9-Ky;tq&Sxr|Ml?$)ON}EuFA{j?{F=gt`BGz+w@m8Ffm@9OjZwI
zkSQxZ;Pbf5P`s;zi|L(mr^ivbEOs^FK3VST&kNOC^2Jl+M&H&)ik=r}KJV`p>OG&I
zL*Dr4#yHW`rk{yo<3{pxdg_5AjUW!htOp*Gl<~07D)HNMG!?<@!Io8yTp?=+==jlo
zIEBeZz>ZZ9S0F{%QcFA0nfoQAk1>0xUa!Mh?a$~oMk{sP`{L)~UEp+2cV&<I42+1!
zqb-8Tn5Jdq&6(5y(`C8Xs2}W-nud}Gy)V7n-|+S+x>0<<ihJrN+Lhs^EZB`E8TEAj
zg5M_7s}J1z6%m=6xL%Dm+|3<1uRknFC*k;%pCK}{=`4SE?|$mqifHh*ot%e!%y_h*
zFnyxYs8I0yXdbQ6f{8%&yfb5UgZ|rfy16WFlkHEG%B#1Zow7Qo*qHqPf`?#mm<}-M
zfFOgyHF@BCXjY`5WHMZNIKNKBBp-Ox=k<G9fD1~fVO}7D{u4Sl$N7grDey0L1TbhF
zFet0|&XR;tT*3Qbi*<Y&*HRkUAk9UoNbs!xYz;x+W2UU&2)n>^i1Ya_2!(8QMkJLi
zP1f0j0n`?SX_}(%6nsuGD*67!*8Ws{QqSvgQL1oY52B5vy5TY8w5MR5X|N+?J_YP)
zwi*AwFs$VglszyYII=rA!Hj_i??scYB6u5);Dj%1;NEHXf84&xSWLpPMCQvA(D&uJ
zP3?-0ke<jTOfor^^gi9?YP5$U+Rri^Bd>k3M!c^d6T#}b^ukoA)W-c@jF*lVo14l|
z$~Vo~J#WM000klh-m5ZCYNvPo&Yc&S<?oiS6YWGo)S0yvy4E05o7l{;0VxmJ-Ljpw
zN0fPpFn&mrroWGt{6rAc{akzNJ<00Ag7;F8g{v>I;?()x1o{g!!QR;>NAnYVPmkQg
zM24PFRZwrt`=n2J_n2EHl6#(wo?*Se<j7?-NhSOy3D)zz_<Puk28*<&5S5KRiHV{8
zLv&hJ+x=5W`MZ(!e?*}R{TqeO$D_>y=hy9BgbKjXjy1X`BLx3)w1t!n3~)dBS3Lhy
zaQ)r*_{$^kFE)5`@ggMX^aL_D)bbg38PUauY@w|19armDPFiha29S^@(%|ve!I8_s
z;k8V&m>cC7cGd?ga2I}(_ZVJ*dW8%2$yxyoT@ES8&-QRncKmWu8e1a2<a<<k=Y`4N
ztQEZXC|-ZDC*$_b{9CKltkB)apuT<@oaZ04XZGMC1&xh;hlM>eWs^7AS9L8N43!6P
z>$00{C2?o8g<d}tlc2*B-acinr<gAwNBhspN=&067K4{yz%=xtL7U%NsU1bMa`DlY
z;@&pH2!)&$8-GS3E4NoNlcDw-VgJ-;M808*E;eu`HaYI3DyE%byw3rVAINrQU#8Z`
z@TJ)c-Nc8nJ-9?OrVP(?V<T<Mo9Tq@6FMW&^}=bZjUmH@7L&CQkDhZE2--79qZtUU
zs$v~gc-+Y~i@qe@`B{c6A(7|<|B=CuFP?;z+IN@}TwGh`&9X{~(21!NGn*Mr4XU|F
zh#mN)REOG(I0KvN%nmO-W^5#o+>U(ao~ad=-|FaAG{n8gto`Z~5}jfY3H}>yhygwm
z9vs;l#TFPhuWSRKNynR3!t+cn^~|$kCN#JitS+!l8LS)vjxbaApsiFMd=mwYxa`$?
zmM>dAV#Izc*7~|}E;(nlY(DJMSv2X3wx^(WilxB|Tq%DvHN@0~h(J8c^bfq7kU%ek
z+BZoI%khV|%9rzKFo^T6_ddF3jY-5Cq|`$lnf93OfG<{(BP5g2Pr8eT!ws$!6fUKw
zq%Urqr9%G%(@b%9f=u+1s!ecCPXtYUQr|NAhL&-)*Yer5^SYN!YY42X%NyOqEHU`I
z{K!9i<FSrRRLIp;{&W_Tba!;`*1F4vcfeVTE}mm2-hW1G0oU<A)DZ8#@xbuk86ZT3
z>uh8O<6{gDJrY%q$_qyxIWm=C5~TC=F;7v1B*e(5SgfX7&oSw!my2I!tZP&fI$x?G
zfT3=$LIBGuRDPGT(t;4JyDn5dj+q_bJ8S67CrkBQH0)l<D!JM|w`bD*6e<K!Z<+S2
zT5o?ac{=5|$J?R$a*upc+FJI`0+Fr=kGoV3yFWGx1x(FnuJgP+W%*81^8ezf<mb5!
z9}jk-e3)cvLZme6B<akv!Np+Q55J!xg|HKznR`r_{!h>#MB$&L1?NbA<Q%zpAri1{
z!SH+<%&ce<yi+#tq<#OW6njFUU<Hkjx{*S)-;c~*e5G1Gzj4@cnd54rY&%6FjYf%e
zgb0hGilTL*Vl8b5W2QlkX?lhZTaDJ-V~4Je)+wWxy|S@xu?LYWSULylA5D@sL2hRv
z@BRgyW|5E>rCl?*86)1cLs_0`s%>0Xxht5rBdbfNT81pb26yl#1$({{sssysI%T4#
zm<}-DNB-kPIkl8Mx*!D8o_MBtuwCr;q9B&<`qQJ@#3VU+B8x5F#jwb${)UjcdlS#<
zVh1Hd=PDl#h7KuC_X<Z0#7EaBa)#cJ<#^BgO!Qgs#>3CFw0mWPeKpwK+*3a1*tf@T
zBj^{ps9sx=_gIp@H>mQWe{kcvc424f<yQ;QN8(+coEV(`^234V?{h2T-t8q)IP9c5
zk5%|psfau%tfF>O_cXg=Ze-UWOgn_#w_WjySgQ$*EVKdk!gG#gOi%tXg*ROBnu(KZ
z+z*4R!=WxF@==WOxup!Ed4+w0SMcWVWYK!Cp<8~;tU!8P(seJ%8RWkkT?bRL{nVmZ
zozdZIDp+$!pl$oamwCveV7wG(quNe+cvz?+=V_{;J@PJTbK&iwZZ&na7Jb+!dLeS$
zQY$0<b_cQyE8J-kb8SuSOh2l_?_btGi`+as%i-zodCIb!Vp{zh?;#8Z*9I0Q4;o2v
zao8#TUXH;a4o3X=RBA36d}|(OE2lyWTPrLZLkKUV5oPbDXOg0yg3a&N$*&Uw=)ZUy
z_`zNX6YPbCSnDN=Hq~EzeefW<1soxfJ|$P-u~=Z`HXK!M8E2X<>U?iZx5HE|{pQYE
z=Ac&B4n+;w5ND;r5OEzR9)>2Vm_Y_NIm7tS*0S(@x2w59`Z#rDmzqPA&V*ds#ilKS
zK{S>myPK?_TIj)-UwJyX<3xH~iM&<Vob#5syfA-D%rIl%ZIW`)Fpa9(^4YHbE~PwE
zrM<k2^sBOoX`ceBrMJS`5=F%oc>4lZ;gQY-m{*o)i<kzVkqKAzpf%fOzSLc|=%5W}
zjnT)ixlil##h5gukfwZrYKrI00FSm+{#+I2_y;RQ@cQBce`QC+nr4z|r`vk!b03@$
z`@>5V{qL;F69W}Ws!0eP1luCoa?Av~%)XKe5w%5FXJ>K{SleGI@r#RW8_uaIvh41m
zHTw4ToX(2>DZU60!17PA^e?QDV~H5pNhSlF`7|HUwN6>$Qw$y6e-rvCcSo5B1B7|(
zWEI4<_0TQ3LsvpQkJbXST}Z9PLUn=~g7d|=9MQAM>FB9yKi8F}#>p9q>-cHuo$GrS
zUe-N8Ka<C?8LY$>Mz0Z_eldX);Zhek4JUl`C`G#{t}6N-&z<eZPUN)a1;z|si4q~t
z*tlmF8fkiqCYs(9M7P{3Jj;uF%4|-tNnjwV@Q+fBUrWdZm~Eea-~~VeU8XmtAc_eG
zt%RjhWa#cltz;1+9q)ngP@N~M$i2rYuSo>n`yfJ};r2ZwS<?zryx*)x|8gS(T3N?$
zhtaE5)bYOXy?bA<L}yV6e$QTQb>(6&%^g|;a>jhwHfYzg<%_8=)~jrdZ>Bo5-MM}{
zi+zH##{g67(yZWG)K0!H=Oe6$rx~eHcr<#E6gQ<l=PASnY+ukZfQ+nBE4jr)Y9s`D
z2fbD#5W2zPtx2~9W8o!Tetk)9Mk<IYF<q#u5xMntcepz5@KuaJt1#P&v5}$msQ9I|
z<Zce=il4z2^6NxT2tMCN!NJl?0unw%Y+^Td`D>xDf(%W)>vb|ogwJ_<=)V%>bW-77
z-4`Wmy~9LGlid53h%o<_IqkieEchF=4+Rp=<k&>>HJxS+LF88{9TRuXmZ~fVtsGT;
ze$p~INk_95*nP_4oMM$h|Bczgsj1|FE``%H#J+Xgw&bmK8hiNrqe+~8Y%IcPNu<$y
zUQ8~8L%(@3;h}x!TNrQfTg>pA?32z0?<I90O4b_u`QD%XwrF3ur{fMLO;i!smYq9@
zVVzm-n&YLitD8iOpI<et6w8q6D>He<L`tdh(vs1RNFoEu_1IHP0J0=+kY*Y0qIVHS
z62}*+NFVy(Zs7|IDUz59`B=CI+4myuJIFBI*!#Szo}A9+L#l#~!>a~mU*0Fvn!0l_
zQ*xJ4Z+(NKQ))VteUVgb`{8o#o9CmXx7U@IUQmoJ+<4yir9;P}>+YnBB>d(4+vbRc
z?=h82OM3_C<`%{gr_k^;(+`9W{*l2|<CTbHz#eQTtAq0XZCKlqXzPPU`;FFe8Emhh
zgZB_OQPE-d%UnpC<(N43yVMJ9H4y9h5y7LrdhutxQnLk|25H_sQ-dU)9Z+7hTKT>y
z(So*fJtjCLHfeM%Z4d_2J9~Ox4U@Kp>O^MmG(NU97b|FsT*c|CI;$V}qp>GQxns|4
z?0p&=lQn7hm!OXfT5ys4^G|eEJsw2W%-&^pBi}k0ky&5Ee8MRD_LOO#ViEqEv;%&y
z*9hbxkiDTkM?Bv;g-wt5s<lhW&HC+Zl9|@L<f1TfTyYSy)VB;X$kfVNJ-K;JrNJZB
zr=@b*L&a+kRWX=hao@bC?`Mwr4I8mICsDj{3pkTSv-VE}K@ieE1@ym(ff2jY4t5+M
zGHDO*NV4!1YremF$+htHqe@2QCVW3M>zL5t;Y$xPJHssQE_97D={W9^bxAS_^k!HP
z6%~%sC?xn<30^RveS9fyzIu6|xGB*#V7Oblk;y*rMwzz5OtCxZGa7!(kE|cF?lqrp
z$St*d#g{nCSCi;jPuO~6NPF_A<YDu`9_CXYuESGib&8P)1p$kH<TidyAtJEjU)>=;
zl)N0neO<kP<@sUj^OzAm+IEw$$I0{=U$m0$(=Td^`(<!tHO@>9UgKLzeaz_@SYO-B
zU7pw$X&VvJ?vP%8HdFMh%;d;@O&Lns;qfAEmZ}*H@u)hNbF<b@g3@Z~mm(onEL0p)
z&r9V<DV&Fx3;A2Y-uF$~+H9|OQFrQvAgr@`g4C1Clbb1G>Q_dP<k0bl`~w$oN#z(s
z_u`6Ql72Gc8-<dLcN3RgLvI%O!J~HO45|A7noaK2<eK--T&uTgu=Mv2&*m!Vr2dmW
ze7~!kzhlXP^X0DyeQ8xq&HsqdM-lI@$b8_3`7JUZoZS3pWIi8CIfL-b|BTFs{EW>1
z$IvIw|H1Kt0`cER<m3Gwk&lwu;JbByh2Q@(A|LO+MC7AFBs|?Lt-&YwfZ}ySeGktG
zVT=4(^*D}oN5#NcyE;2tLb&aH-Ru!ApcUca;A#T_VW-@F2oG00ZdVtOeE>eU0RGu~
zAVA#~d`b`eckl*vPmoZ+?TPS4J$Vv7k2-&}c6D-f0pY$N$R5Hi2Ph4~azQ9Po&Y!#
zRfT}P9k&Juk_PmI2!T5QxD|K?!fgY_00Tp~?Lh1?;BE(S0b@8pxPc!H0B{AF1pr|H
z+!K!*OvDTP296&e;7kL%QeSWZtyUn@!W0k0&;H6h0CW7$Z}c6n=C6R3zq#e~%!7X{
zE||@6#sLiaua^1$mW%@sF8o`7@GqOx_^*iZUy<Yg!|VT_aq$1~j03<w|7SA}Kzuza
z7vX=FaR8DjKoI}`g^UB}U)ctztb_k|GY<Iw`-}sSAoc%j#=-BlzAQ?rA1g9B$Z@1S
zP-*fYd*kGu5=byPsi}gMJgI2_YM#`zA;7(Ntb#1T3{LJ@K|mbf@pveq3zBz^>(&sU
z0#0hjYJeYQGXh8_dgeG53@9=ikVSEF9|3{?gm$7pK!n6`e_N0f^s|OiHQ+m}C$~}B
z2mVtXf)B|4g!NN>f%QM`<p4SM5dyGI;Nz|*_naZXM|j-o0#b}lYObinHE{1l&4Gyi
z<MzLmCD2%Z-#O8l$EUtv;Gc>T<P9D7@IdLc<B`BeW`9CFQH)^Ck9(kWCD3{&^<%|+
ze4GG=LP9{g&++{e6$|pEjz>aiU6Ai`+~Nfh{5e%02r#*i@A*QG?OiYeN>xLIPQd=H
z8h$@El81u)rIW|xQ8{79)xW#`QX(k3LW=kIgulPO<jXB11s>wIwgiV&DE%r0{oi&2
z>iB23-xL*Uia*uv-*8cQ{NpBS%D)t}5=cb)Ni-!W1nB?cnJa-Xnx7<70>Lyt*G-8Z
z1lRoR0EYlK(J>X31R%gnIC%^td;MZ}kni<#nUp|=HT35qDS^Bp=r4F6uLqbECxZYa
zfOtC@1z-XF1rneE{RI=?0g|tN_7MR2OTX$sy!~VjC4dSDH$3SBZ~<1@&pOD|`UMvt
z1CD@y-iLvFwO@5UASO|DV0!R!{+4ZuaJI4Zw1<GSpyP-Bv(eeX#mf_AfuY*|ru;Eg
ze^L2==kh%M1T*Bslmd7IqwHsDB&Y-X6ujUb+Q+O6zTB+jVuQGj07jfF!rQ?bp`{=V
z=nlhUVXL|+&l5mj3^wf^bot@(yf-;K;uuP9D^NH{x46r;xEc1?K%e+QibC1E;uM&D
zQYIx5C#B^01EXKcD=>LQyi|Y`hVt6P`i^KSklA_+={i0)lu(GEONr*MyKdHJ$rv81
z(B>kjAEQ8SN0%B6tMygybWmz{R-|%NAhwprH8GLHG>{bvmJtb&7P~Da6(%VYE+H2#
zt`sSz94V?AC88N6tQ{?+8?C_RD_|G{H;&;qjo~wog;~Zztz&r+u{?IM+zzo^&T*Ws
zaUAY(?4EIKK5-_jzHufjH{zHB;;sb6F@?ll4vl4ujAe+9rH_q)+=-z}il$AAVu*~D
z$2ZG-B`SMXhp{x6E-{8SJxcMS6XX351rwI*GNQK?IBw8pM=(7M;&P0m&4_Y-VIbCo
zy!;@THZzhoH$tS*OM%@_T0GQ*^?ID!3q9tWaSnsVbOm8@SVjt0yyaS570y|uy%ML*
ziIC^^mwf7>NbM3ft|Z><$?P8|rV>e;6?t=1&2A9T03IYyV2&KtF=45=C5L0IaN(LF
zjq8<LaaR52^l>pJtd+Nnd#&U-{dK!-HJ{nb3IzF&sw>jEDUcxKi7e&#ZpotQ$_R%@
zONL5Ghe^tYiz`NmU5yk~ixSa@64r_q(uo$-ixx15fg8o}o0!D#nZ?2^Vxd;Cytc7C
z_Oaa8V!52+I9=j6+~U}gactgkiVU76EPio{jL0j2aZJH+mv6^1M#M5i#nQ*bLgHiS
zlB4CIx7e!#APF(D==wa5{Wz)v6d~@kdEu;hAfZ{>0qLoM@Q`tJb^{v}kj4u(3a13n
zflblzm$t#@z@0sh#g&E!`1H3mD&HEs^(Pz*zT<sd^Ky0piOMJ@KV@{3#QS;l4pRDl
zzDj?6yn8KsCCyZqxGS=nyay-JiY)dDkwY+xj7`MZcHbOHGMRa5;_%C{5m6Vc+E_0t
z8DU`BbwXZu6C1~VmhfDAYiue~;<1kJxW`)Oc+2m{K9Se9*v_iH?$Wr>LY3Pa(#|Ix
z*&UXadV-g;Se?k$iR19naKU#0U^{p_xDw=M>?T~zYJv<VOrm6h3d1|ppB?AYI)*~A
zZ|CBeeAVq}c9VQ{#qDUJ=MG(~aXn{S?*5^mg4-(IoPW^3EZ2ebt4D|d3IgA!Zco~n
z2@X@-<lXBE>hD(GWF8k0Is8mS{EF@s`Kw#dM2kUO`!1}r<!#NF^!4|=cJR}1EMKLv
zWA-)*Z&n4yDj(47#kz&Il}eCuQPh9H>@b_tvy5oEgdv`9Yfyjn9Y_6**uY59ssBaX
zTSryZ`~knxDc#-O(ueLwLb^d31QZS>-5pAZG}4_14&4aS(hUL<2M}q|yV2+O_}q2x
zzwdh2I(setVDH&8^X>V}>?-3H*MWCVVe4qr_&gbrMk{Co*-!5^O2J;XK5<}ZaefJ5
zWM8WR`wAmNm4S(gNf;CZiNT}e5w#w#Gr!Alwf$YyqX|^<l7bojGn36Bc$fK??>4KQ
z5Z&#TaQGxFH&rZKf<&naCJohgY<+7JQD5Lt;alKh@K!?bV?g=0*-uZ7wlao5qy5Ej
zn2rN0N#>g*Zy-=DrInt@H_nG|gXuYq@$?X}!I;ql%(8Zy)q5E(#5D3p7V2AA67FMp
z8TjKw-sq^pOe)G#y0aHraBMzXVs~2_EHK2<(g3i0M?>tWTYJ`l_86KM>#)8BDHXQD
zDnqHrZUT|)qaqVrsfCSwZ8+A|cAxWI6a?%>nlZ2BAnQv*xH<+3;)KOBJ?B*GIhCay
z(!y1-oG6}e784Gpa?YHvuq}<!-%}#F3(QFdnQy%s&Z~N%IzgLWuJCM1L=H${bQFnh
zcf#}3lQERXkS@3t`brAvxhTya+n;4V-m(ZQ@?hp@_YSRG;7Kg7LUBx}Dyi#2qkzF*
zLHm3X=4-d7D7khqy+n&Eu4ol16#}1Gn``Z-R4_ar400|wCPCKp-vaITFmG8Hxx1nL
z7`Pf{)eotAiBRNlT|@8V;nXW)jAl5wI|8S1EhU(cN!>_=DT&E&okbg~=|9xK{-*=r
zckK;7_OnI1o`kDv^Y2l?os%5Yrs1f>f#WtYZTY9RB{`C^iU%;y<CgfJ-{D<jh$>l@
zjP}r_%ktR!0cUJ_M;};ho)PUP+__<JL|2?!a5-Ai{_|`=Ui~hCnYE(d@110z41fo5
zj=AWguaJj#i`l?C@gfoRn@%e~vQ{e&=Y17!k3+oq4nuWgiyxOLn%JF9|J(V7mVvV;
zNrYQDcQmlOD?-FX95X_h3NzO^(4Cn8EOP<MUt4S#5?iB1lT+3%Wnk!i*Z-R5xiLy3
zCA&Sn5v}S|@pms@1f38q?|ul<%Cd0ddk12GKf#z3D>6uQId~$nnV$jTiu3e9IXUje
zvi|$b8{R~)lW~!uNSmPtp)EYS#$~R?qvCy@BBvKYJfwRs%N_chXnVtP$<rpYSO`Ye
zqnV7bZxF$4#6&WfEt|7B^lu=2{fs{~f{s!C&Zga<*xIH<5syw5VvpQ-(*gwn9!BF{
zu~h$BB@f9iK91Boc-Bc|<1vEXzGxK^|HN<>u0eT)og=pbrVY*46IHy3F<vbjbR<)v
zGUuFNTW1L=RX}|p7`k1?G93-p6ep+N@1ts$Wy!w;E*#S8?Y{Xa9bA!t?%dBJ@s*v~
z*`6b}@^zX4BE}xmz<^Z&YfNm9*(wFVf4;|=T#CZ*;9h?2)=9|(weHluHg_LEb4k(x
z41sCht!b#Qouc5Hh-&<$8*4&OU9vFGlbKXqKMXRi!?5ArD`hYEpJD=Fvp3!PW?OO9
zBI?%Bug>YD()h<@(!_Y78ng>;Nfc!d`WSWq2Htekru}7asKQxpQuKU(2x?7`#q?Y}
zyq8r_iGz<Bcdpf<RLt8<sB~`SXG2Knf-Y95la(k(x7EJL)xngl=2+ttQ%Dd*BU$7d
z1#+y*-#I%=1dqr1Nt5ku$=Sy@ra!NJ6lXsx9qdPs-<Z8mW)*$XUot#NQ-Tw<$dq)#
z(aag#kWFL8Hge$PirxR&PYWa|1$`MsUp43yBf#xI^<+m_^`HK)=KI>cAUW~28*rf4
zgb-X4m~}*|_TaK3ssU#Yx;V|OVG=2{ytMb|jv%6yyzwyr8KcAn7T9(W(kOBG<7gLp
z_AgmIe}&#Ak5vXS=74$WcNsrBIr1Poq3BmJ>hWpe4lY6>-l%nff7~4z#8GqLMErfq
z+0I^=&|St&?5vp+SCzEHY*7-X(muM`&`-IJ<RZp9L2-V+YT?gF7RRK3#P%Ie<7|A4
zQjZuc<4z2iJmZdrhEdD*b6;$%ICM3M^lL)qN`fSDo8EAl>0JrD$B6T!WX>(1H@h_S
zLAVR5?4M^2WS>N+v+|HMHf5HKQH~RBMfFRN<h+q!fK39(D#yRJ&TkJ;XV-{<4m<{Q
z)8s?95O{V$^rR3q8mx}Cm1ztQ0SL7cL-SDB$~iZxn?8)1;~iR`4ds4NpxnYZ-tu+=
za~h;Dh7(c6E!phnh$YFM$k;#np^*xn+w`m6i!MASa~kjVDv%>bq+_Hy2$<bk5BaIA
z8y+N9;(<$CzsuYaE6V$EaClFw{x#0eoge&X(SaG=j2*%~HMPCpf1vBrBS~is-FX+M
zej)p-dsm4*?c^ry6cIjzkGdvr48_Q&@B`orF<AOhketGSSNV~^6oCjf$-t2i*_qo?
zj*w#Lb*-5ktT6I^CJ$|Qd6w0vwDQ4UzJ$P1d)}KVb<z0mv%&Gevn#!Ddv|Mbf@$cE
zU&3p7LJ6pyd%(BMk+fV4ln~;T{4(B-S6gU4LOG~cGfevaDg%xs)sa-+ziMwp?QKS3
z>Eo5GP37y?HUD*q#efYe6HBRCiRf=92-?3{`Bg^Ph~@bNTq%EgDISwc+ac)!SC@`>
z{p6Fr3`o|Ea{6URDA7`+$1b9rN{9~cLhKilh1&o3^E$@3OTsL!;V;>3b1g8-`zTv_
zETzYjv{CJ6KC)D^hM4{wX?Ala{>bIzAL7o{`=uae&`LGWPNj+SJ%RCoE=@26ciKx!
zS-?L5-TxgS%+ynyU~%;DvLt+Ab3#fH9(OV3xt`r+-$?L#$;}n_D-0x$gH3p$ksjg@
zO6hF{wQc^gLifYSB2=T9@S;sfM8CB734e4qBKJyP|AH%-J42>s1vXL)RLY%Mw+q^_
zwrC0nG9aNz*-9hlgo-pEaMO7BmAb~cgtb`^^SFnsQ8E#uFc0x4{!tih9V&a{y&i<G
z_SptC4#@>S1j5|91bQhvkx8S}eHDWgJpA>kNMGw;Q*;M7SYTG|_z0}Nj18=Yq*Kaj
z8fhXkFsM~|vNBip9U){>Qk~A6mKAJ8(EGbZw)HOb^?vR>45x>W!I(;cVaPaV&$qm1
z8l=d^c<yOgzSev2_u=yiKJD8px;%uIG{4+`;=O+{6jTU*)nn+MjlL4+b>;B$tF}hQ
zzPElk8Z17U?%4^tY81<gDWkvIb@plLqu?6+)74k-Sk#xshgSJ(WHu=jnA3Z=ueB1<
zm)i5a98LaOzCLTJ6J+Ksh2zg&MxXm*MiF8078{nY%KNmb=8QEnpl0z{d*;10J;=K0
z;q-`Ss0%%-0=?u2I8l$xxmc1=j`v$y3#;r`b(gT38ncOcg8z!P9WXvVbX>MAS*e|(
z8-%af5sff0I^HYMyuI%;7`xPy_HwN>(ptrqwSXJKtigaKEv%zZ;o}(Zzcr80oZsdW
zu_Ooew7K>Au4Lym46F`r!Rmgy04Jw*YoW*yFDwp<_r&i{nk{$^eCZ<=;%EsU$?=d>
zSZBqWd}D2=5aVx*sl=wcO$rijH-s2^r=CWgl1sl+n;tewF2~1GaaLrHcwMjKB=0_-
z2f;62N4pr$@!HOwS;{7P)AFka6tl(XM@sH@>3ySs(b=L$qAW?nBUp1ON)+O~3uEmy
z4wFO=#5tYG5Xdv2emTRlkbr}2JNbbJoQ;_{BbI8S>E2QYxwF22&V0@Oq8$hRG5j(+
zMoIML3oBT42`}|Pg0DLz2lVdE>1n!x?06#C3g&s3TLuvl7*ZvtxyIJ69whZWRO*cf
zkvOdVvusK<7FffHe9f`?uTGW@LD$HFoAJ!p0*@W?P!I#iOZ?A1B4ed6&?>Kda3L~+
zO|n7gcgK&I!!FKybHi%Tgo)*L=4;Hma#(eDv7XdL-x*u!6w~NE^}eEgA-&W05D@$s
zh-!*+@1YMQn;k}ZpM<XT1Yab^Y*M7@u{8=W^)@8p#Ztl`)$`ulsXdhWOmvzrh=0;a
z(a^GHe6~#bR3;Ymb;VPAly$`4_K_#ozs4VGJGO1A67RJ;FD&)B57_iN)SSABKV6QD
zKU}hr&@h(mnfA3_*zyGDCtJJD1}Mb)ozW<pt4tswT&qbURL%m&Q$H`=oC^m3U_4xb
z&<!^ce1&PLBpX+F?EH!UPGAN1g?O;});;w!UF567vX%UXQ$*`P{53{@RT{LS4=WrW
z>6_Gc#@NZnD97F}(k*<Gd$#<X>2IIcM0d}s(|t*0PS_NebtBW~2FlwEy2KVO>E5m=
z)i0YZtl)-OCnH_towjA*Jpu<3uW@c<Z)P~`KEmk8#2f&Q8#r%&wCC&VOXi~fsgZ#Q
z%=wU?tTqGjkJ#FWu+c#WrPy8~x^ZN}HGKHzvv0IcM3ad=w3g;xVLNsZbw=7jB9Vxm
zr+%WHM=*4|qJ*nsJS=?c^CpV!AW}dK3AOvx1TDE^HmPhu$5R}Fe;!`$Yj<LdwM|J}
zd(`L}^LAel4k4l0H%bkMw=kdYuIJGve?K0P;q`{7vfj!@LQQQ3tHJw$w;5VvjxKy+
zN=Mu996t>w5#dzi9*f$R+NUVTT8KdtD)^=Unul1Yc2)N({6@ORdu23{yU04-(O=w$
zsYFN0MJcclXP31>#muL~>sL%E$)}c`ya%`5L9>Y=eqlEmd2z~7_;_ClXJj3U!|l^e
z87X96<X*`&6+o7aS5}Q59Ka<%)rl{DtJuEhAn4Z*GaNToh?u^u04iUw97~h}KI@#E
zrNKcYzCkEbKjYhujoxJKI<l!p1QDQG#4n5R35$N=S7_dL@3^~<tX(tSW9Xw^?I1>C
zZ6}|pol(=q8n06WQRDACt5ot7keI0i@C=eQ%a29{rT79l%8NZ3m1e(ZqQ_zKAA4jT
z=~+<W1K~@H{S&(JTPaXWJ}OlM+!}qm(sg8BEx{rA6kC`G=QHVDQLR2@CH1)twtQGW
zwaBk6z}fsSn-Bt=xvYU$WJUS`m4OXpa&(D4Zx2;%M|(P)w1<UOJxpq@vL^9EgjZU-
ze^IuULe^8oC0U&)TX)7BOy$@sj9el)x^dD5M4sqleUZ131CJfT(s7#&eJK=XNuMac
zJ?&3E{>MX<%z&J}D|8A<^;tR<7~xCKm{vveX66pq<TO1^K*nLTnv@kK>GI3m^J;zn
z;*&mqa^H34#EF}B?c_P!=5}vtcs2+OljA3OQFbqFAL-WBK}x(FBu@;(%%qtb>+m*+
zo5no+YsuFocF$b%kpu@dZ}I2E8XFY#2iBa!p0c3DXeqPvPwg_oBk~O)!;~1_`=)8%
z%8yr}t<VGs6Q4>~qQN@3#GXNZ-X7LO_6MSQlZ-WfSmYuYFrhQ*4Zo2?msU}OCK)ii
z8$;2X8T;$~0?F>ZBefC+^U$gsPl<nhZ+1qJVNc?G7xLVmx`+1JX1B8p3q+$|zZ8E|
z1ucEEcD#AzLl}?Buqka&v70*NuEs6G?P#ISdYzB~0y3;ptdlN|qstOD&gqD4^9?AG
z0TtnTw<&R4S?S?z*8FW&h`Z&C3r&H>Vc>Eh0d;`xJV+}k#6n49orWiu`lkD9_oGJk
zw;?XC>!o3+TbmsD-foINV1~W1;o^RmM>plC>YIJ=*gVmkiSeV-c`g2F%Kf*e>B4Y>
zN=<pNzoSWQNVUDHo5>^W1%@g=?nQ)K+Yo6df%Q>Z#tqirJ&E+m4?1rk!Hw-m(Nsud
z_{stQQLI!GO_O*ID7C;yd+oyZ&{%lI`rxmI7-gJ^5qh#ci9%b6KaGeQuW;r=jP>tb
zLw@I6yg#w!b9_m@^Vlxo5qgVh%d~U#$21LP^tMxTG>nU=V=K0)tGvy78ij9zZ?Nr?
zbZFVe0b95Ve|>j(>=%5B09SXPB;{$eJH<4Fxnz$xT>=sg7?OK5Ehgqi=kvEa+<>o`
zpOZg+-Z+CLpN$uY;ecSltd@2e2^t<7Cr7xZ@sEU9G(Y*SRcB>s|BUJ!-kTt-%^+#$
zO;9?<I*wkAS;uW_Zwr$AdBSFfJBR9%3_M#HgeSpL*ml8jDDJCuI`Ur|Jq|?Ts@uP2
zr^`AR5oTgbo5{9(RjS3a&?mRtX`8jW#9U-FK@Qjfc$-p!bu=aC%F=kylQd)3)-NKx
z7)Ua{wHRQYgz>FZ!#!~k8aDp3_ez7O_?yB1QDFff9C9U>slceNPDgLZS!8`arRV&`
zu_LDHDIzOR#3B<94yQ;yBnRVllCo6<8LjAZ@5>)gA+WZ?>QE>*>I8uq6HjFPcQoC+
zYt#xbe>@T!@0oW2L^#<d1C^2pNU?y()Cs6rkqkk{@wTNcmG0oHTrSBeS3GC$KDIL9
z=@u77qG7Un@jv#IKjX>j7qJ@Q!%A}wl=J>@>c3gpFfMw?4v$8?1-1#z$ih6X?LJrf
zBHzn%<Z+o(N~>`CDE40;PG#h}ZHk9U%ZeyPu?rs=4$?$ke~HNKhFhIU#Deuf^r=kT
zMU2eSxHFFlM~bi-ns?c$$Yufv2HD1kZ$QMc)ElV{!-KUJ>-YDM3G6+0roc|KPBz8-
zPjv=J=b#$xtRsl#w8<k`8BT;-Mw?=mfe4*jxfFwjCSetYkZT95sqj)C8N!2u%q|X|
z9!hI$<Z`K=)%5Taw2!ClGS`V4{Mb71r(bD;puM<i3t2Hnfz3FJ7ipM(1?(aH%4%~D
z(!udJBF`YKBvfYd%EqifM)Z)F4#l$srS+JOU8y(bC#c;%r({?oJlrn}{l*Y1ygHNC
z?Ht67t|m~dgpPp}-A}uB9fs<ZA{(rCCj{5|E)XBE+Yj>rI$m2Gf4cY5FZr^yY<smB
znd-Z6S_22k*rRU>uKnQz2ejdzATW`NA~HADQVMkNn=_i0d#%mfkTmCQ^^I3F_yjop
z+&%g|`WB@FQT$2VA28bzaHh5X<~g(5tFyTSbLg=+!UU}gMT9>E+P~VIb_CMA#N`^(
z1S5{E$WM;ojg}+-fIm>KgHLQ);Nrbw4CZ?Z@;X|8bEzFoaUb7%=glR?ah<2`s!@cF
zOm8Q4^w(|`Qk@jv5hll7;(Bq}%BDgVb-T8rJ?7_T3$r;2Edn?U(IK*ShQaFbtmq3e
zG%*;@>)`kZQc>)rkqptPaIKUN?Gudg;2PdIDsvhA^=4X$;P=Z}Kd5gE?c7o=D9F&|
zJm1F>c<+VvQzr96=mUr=$l5UzCdnlhpY;mBk4e#FVxT9<X0j1|)0}6uX%bG&^o1F0
zRjb$L#Zv5!nEahkMe((KlC;oxW_kyCmFThNae3yKQ(2$45y4vtW4u(Ubk1v9kE37J
z>3b|E_3F9nGBLa#A~0gn*~*GfDqZcrvGMli*>QBM!~-AiJUgt!|46j_cPyX^l531T
z_PnO-SnAnuOT7+MSs{eGSa3x<inG?eyw<A}Xw<0vAX)daIk?!$jX}duJ`u}PwSDa9
z=SGALa2Y~j<I}Y{S+mo-G*ritsed257w_GEM=eo~@c*-m{r3{W!{Qro;G*CI(Dv~6
z@5Rmk!z*%pe8T7~cjZ`jEflxOC^tjg*O4Y3SK(Nf!MGRm^52(L&%vbMJju?E-A-Rn
zpSaLoO^6=ZG2M1C?pw0&nR9$G=GoGJvZf=ntSP#vE`Io&d0tiGv$E7p0_wD)%%r^B
zn6%P}q{{i4_JFv0FG#aXMC;qGMTd|MR7e*hpm&#z-1J1h@rgkluTc%J@wXk*N^TRA
z5>E3%cFTNr%N!F{>-WHQS8C#s!TkJcN-UMpE}79Tp5EcyhvdSaFpAbOg4Xfut9>xF
zQxLV&T@K1?N@qVxXD@OWPjZ(t*eefGm+Mh}H&WNDyG$oyS4U!3TSC|8gsx|Y&KCHt
z#<;FVxGwtGF3+%Cu0nCHV=$hYcsOeU*X8Y76%0ou498tFPHEso1vFa;G+QyW=O8p2
z5i~0yG)n<A3w|_nJ~Y$Y4*H8lB@<Q*U1khzCXA;H7#i1~gy=BT$S|ZxF(imFKtvcK
z1Q>!iXx!LnoERuf7uU(h_KZJ%7Tpz~-o&9@M`2zD;avm}d|%N#-_ZN^isEeF=G2V}
z=1h0&NPl2s!t&LMZP&zv>-$ywjuG#+0pErm|GKW=s<!aTQ<1xByd@3LT`|U-isY=4
z^pt|^gq*@B8O2d4<zWfcAqll}V9TJGMvv&zPGRjf!DlV}dN)6^Z{H%{rX$z$8CLTc
zS8$n@ahcuT=M{697janRu~}uAu-Ie**Iki`YZ{a7TPE8i2KxjC`&c@MXgY^)-^0Uc
z97AcG0;rsQDO|iMT<#i3UXr=ElDN8%xZXl(?TK8!od;ijma!&qwIXme$8$BsbG^$%
zHo$Sw!E({Ya#qK5QpI#qFmZK|2QFC?SNk&$%DYyoyE>xV9upQG6IY<OCay-DCawnT
zCa!ukm@3qmig!(9l$i1qn6h_yC^rKf_$IFWcqXoVSg33!9;hZP-+hVBPJRCGF9rU)
zs{Ws)z#Hh>XQUA$yUAlQOaf2pd);FCLxeH)Yz0f7XWQ3Lp^xqs)b`dFuwcY0MH4U-
zcO&$`ZSiNyKIKnLQx8;{KR<HnI;?D3Z|ZEi3Qjo@yV88$ar3ov&NuhG)9LkkW<AOn
zg6trR!Q^wxF*EDjz5=sx@OAK+%r^Y?BNB3Qawtwa;ty04!~k?x1WAOJ(AXZvjlGS}
z7T(_8*XbJ<8|oWX8&?~N8>Sm7r~0Q<ZiL>Fkdo26M_oUjcr$yGXV8K5KdufKfu;PK
z?=M`1ET&Z1s1fMV;}2#HW>u>|j#)uasMPqXarcRo+ZD5$kT-W;b6^nmt4+-x?|;#w
zz5&sIr4F&|Cz{*VJ|SVoC6T#j@fxYccks4$3)8{O(Aic@k+CR6U+oibcy7e!9VOt7
z+I*-F^tz!rMf^ya1j_S7X|yvoJ=rCp6_BwIZYYbHU6>~)dEH8W=&MR62=NoK_qsB2
zBbi*yk`4zg-RdJs7R=B*g$1p^Re|!vmk)efMo-~^7e0y}46(A{@Ia&z0oOdrfrg@B
zQ(?l^9&w>iblk()tn!*!9?2pjeLMeqGqmQ@g)8$gvI2~!kd7xoPp_78v<*sd+KmE>
zh((d0=nZe6Vzvu~((p9ed!X!K*{{MKFTQrE2JZzsTYUE-b;#m9KpeFAB;Nq#X{&IX
z7e65#$2zNibb?GV1l+3NFh%(*as{px!3aDwom0i(J1!Mq_Hybx!8uW>WBa;nANEu%
z%Iam0w5~lD35nTD+-$=*P%G-*>c5S30FBYp*o5Pgq!E8%mz1UDd5`OVLu^yiy1%@d
z9Rzd6@tj1~T8n29B&K!74~DS%B_gC|T-krY8m63VLs)7^En52mZ#|BPU|rK%fkP7M
zVlHkto;{zzXqkoDIK;V7Y)aTSaSaLo^OjP6UY3W4s}{j^%vS_PV)0AHi`gPDZ@cCr
zu9eUNkf7}=JM1rYyoJ!o48}xb#Nf>vu~a3PV6WZ3FC3m)2sB6!4&!avx-PhZ3$a>=
z*kk_)wtXop)}~6<fYaPgG*AemNlJGRnF*CssL7;2kxc!M5UrxOSCVk>L~yWk@DO1!
z)n+wW<CAQe?(*AWF7u37gB60Er-Wyo#KxID$)p2I!Gh)}Cv!|EZ++7r$MMA1cMnTc
zn!HzFgw?}u*NXG>)INR@i7tdFvk(D`gI_GrqOlfAS=fvrX+`irX@mt`9u-x9H6pdh
zNzVCBCeC}C4Qa9(c<oa5#2q%(zQG)^mT8hW$&ieWv<otiN->B3C$NgliXG$}JiCG#
zg&a<I#KYZ9skuLE&`jQ8EZ0lLnyO$vHZIWqpNxW*c727&8G<*96yz<AT%Eb_g4fiz
zJ9)Z)--Tp`7g;r*%?R&<YC|MjlV)(#o@xTa8eMfU0!Lgr-yNE6upkcZTfqC3`1l03
zrUx?2e@uaK;F8$-N?W}6?v*G1Z(k-E%E7I(r?xtv?C$+NY!RC~ethqrh=^A2hPpdu
zzK*B3o6${L32Cg3;>Z3wV|w$@m)2ym+jGtqV<Y^;vY{9z{L;ZK#7Om^Q6|@wVn!m?
zKiUShemNm(GrAt7bMwAH=tXV8P<JW8zUkW-8Txzn$A-b~ulh%l75<TTK$0}G4p$TC
z-cIpqqsNKM2d}xsz{bqo=3BZUqi(+{HMKT23#9(MdK+Lqn%7(=v@&TM$Po&Eh{nq0
zJ<&SrZPvEfpG;BJ&gtHvDdf*O_-k#(U0!!&y`|4$pozvRj=(4Raz%|4s{tljdCYWL
z@Lp<fRcjlIkHafl(B=I<!}F&N#?9I)IYD)={@@<L&|s~0f+Y^O7iZbKpWtO9iK^$)
zkodgRH{7)H{#6J4tV2^g6yw8%-7qDkcwru|$6Rif4c%L6C%v}8XR6YoEy$Icu{uIc
zEWc&Zl=ygYZVt+TIQ})X%Keph@RYZ*<Ag<xVHE+1DF4Z3$G7#aD26tofAy0dP;ljY
zNvQdFbYW;2F3RBW20SqVQre5hK?rZ*Q~gGWpvr(u{4ulDv6s$Hho;)ME#F5M-5rI4
zlPN4QFGY*cgU2nni>jG<e7q;3S0^iwVx>R)+XF?Q2imt22kD#-chp(C1^1Z#g5RE1
zM`W6)^R9E6A}4E>d-(S!jj)JDyOx%gHO3FW#sWmxH6Anbv_E-q>F^0YG6p`2Qx8?m
zN+^KP(wXlWE6`iaDyYv=!}5~xiOlD9F&w+WvQ0z<kFcJKrjb5Bk>J)RdHzR(L=EtL
z7TmZb#zp-_P8bqEzq9i_TNM4gocs<=OK-DopT9J9WDxpLk9{HnADfOms1>)09;|#c
z$mYO@X8A|KS9$C03|q%ZqSRZz5fgWuW_fssH@5D7mN+(T%s{QICDFBg<>mjcGihmT
zU2}<R9avZxCT-o1Lg>pH&_}QICMsOCdf#@lpw2PKWSvd9gEed#H@E6~yvSKq2_6g2
zj9*EyF2tvF&q|KdYd_47mI4je?s9O~E*8vJFv5$++VahbV6{GZ@B+uvIjbvczAbR?
zbF5{#zu+t`WRaO!@OX&_pN)WT4C8ELH4gN;tUp3%_H_Pd1fXSruR%7*wN{W5RI(MF
zvMj4BGqjj45a_~U#oafIQ`hTvt<5Ms`n)I&+;UOy+b!yy<V+1edCV=VkyuEt9Pcef
zs7=q#6F{kbqgTaTJ8dQ6g&*6&1bQ$_vWKp6e$4|HF#gkHiV{ylyRaVy)QXYmWaG{s
z@kv}C_giMYexgLj<HRdyNDhr2FiZVC1jxUgXpXNCW#uQ{j?o#Zs6@|CWw<S*W)@*Y
zoW#xa1GN{3M9<Q!=kXWV-6;U8!KLufl9w&};cEN_>)>OWAKupKI&j;CbON?=!MsnH
zdEQ%w!8ov%W70!(4dT@2E*(1Xblw7YR);;<Y8UwqV}#DHwZ)^XL8N%v*1juF1PJt*
zO3zEQG!{hXKMuB@BMMfiaR_3J8NC6?K8V@kQUke>;fY>oYPXQpHEE|9DUU=3S^l~K
zc?)T4_h|x8J8Ud-CwrNqnUIJwwF%yjF`?l>A60%kY`s}1e$T~Vs?;^EdBl!|W9>Yo
zXDM#CJ3|XI&T0Y15&;aQ;d4WpRRIi!fBHAn;WHrt=g&D*{;Wc;4l&36ZDN;N%?M!!
zPh?Fcc#Z!feBsvHl}|+Mh|}5hJeTRfi_(BeAN+~4-@&TqM%~6Ja^Mc}OtE^_rFYPz
z!GL*sN4N0j-P6sDxd7?$wKE4-E{}<Q&y@@M$p(WdO9G^i*|cEB-wvtH?4;AipEn}6
z%B0nUF%==7H(p!`H7?bqvR6b5p)a$vk~_j>i;JpQIMF2TF1ElhSU$CB)v!$V5QxNJ
zzEclgpR)pN{)jnfg7inSd8I*}6%z26x|AwpJDvHV;GR(97i3>dPQKcm=0E_KTu93U
z8xH|#=B<!=%*XzoBFzpEmA~MwQ8zacw^@6}$eH~qNfP3qa*)vLc853Fb4;J)*J15l
z-%=rm%T~|9X@n1>4NO$kQo|u&4<rz(;jo3S>ANySJr8u5P-LumjUSH}S0hj;pG{^3
z;}&bVzr=OD^oFtd)mK8%P@S=iTVs>|go4bb9e$|ZJl@qk)RIVP+~%F{M}j9aKI+kv
zlT=9a#n*?%8iCJ11s?-<3uG)btVEox!G^&ecEhIJzhhYO3mDwS&y9eG;U7)oG#=cM
zvgfd?=n>pT#DNcODeA=X_6ORZ>X9$uJzwzw4|~AsEkRnr8rDoe7k&p5+5HzVVK;op
z;zr^RtFO}^R5K}1<DWYVEZCYj1@}C`Tua${Ng{T#dlv3#Ck8oP2?yD<>Z37<XYRSe
z!;6F8TC#&9R!EJ&%Z+yP%`I!MF~!K$c(1pwx_{i9?>!O0AyZv+bhG!2M?zNA#>A9}
z#2tsakPS$ik;pN^+NVrEK<Sw$oyJu3lfESU6T}_YfUn?QpmfFG&@OZZ{t6fzn(4up
z#v>U*FsU-_8M^kCju|4J%Rbu(i8ox#K1Vrc+N$1pq5ph=X+nqz{>yk06!o{7*ZW?f
zo=Tn4xCv}@1;D3q7}oD3Z?MxK4l+Md)TV|@gm2dyMY$3lZ-8o1?1T?;03St%?I#q1
zCV+tP3!*J&8j@gS)xVBK9q{kWJtaM|J%QaA-RE$f{#X|2J&OdI{1R9>DBk<`!Z-=s
z!twRHAt=PoWBUo|`FLPukOJ6iOveixhBRn-C{|4ehHH(TYRmGhS#RKQl0?o$sez+L
zUPoaG{^5DkxgoUiVng^;r8`TaeFp%Su8}f_njq*OQ(Yyj2Bmf7JGP<PiGbu<i11hi
zD_aZ$IwW=Ins#|~a5)G1sqlmIl=4(-d*Bi2H;$m-k9gyIUFfdO=1IREQz2h3@FhCk
zXk$o-1!akgK{hrzdb67d48dzO2li+j5`{u+fH+t+!kV2Xa;87}4t0izBlgkSAQd9y
zN)m=yq9;0?JgR|j$GK(iRvf?9V8GJx){b>*baKWSkX`CGg_T<M!VUmOuZmyh4*!Kq
z0Y>*f>yQeUg)yF&fwPYEULn86LhqDBXe8!C_b9rAy=^F1f)}SggxF3Te5NJ8SGlDG
zIb65W0NljLgMIJ<zE+Lr0X``MQ*fOnrIpmbSKt-6=JxOBHb)G2?5*UdSXYx_ueU(&
z9T$D{!<8rad2X~+>OR^VC`s!fLhF;;DJJkQMQ|V-Esq&;2HBCoq;@;P56X?`;Cuh^
zBc^V!5d*PrFJ_G4=2+fGL(5}>Vf4X%t<jjuk7@@G7M0gSNciCgUi;O*8VJWoe>eL7
z-JU7(kR(6UwVnv`|31y_cd_dMYX3i6>;g{OL}vjo<oi7a04e5f@B=XI&218Z>IN9@
z*-f(PP4bCNih*@nfXnV(r|Vj00GR5QRTI{xRrc~_zLMo9)P)h*i=qG<{s&4Aolym#
zbbv?)Xk~y<4xUj1p!7dPy3MF5K%`rYSo|T<0YV(W+I0r({$bH6UjVE&Lqt3Pr~{Pt
z1A7jA1+eD;2n_(zBCTG+tzH0o4iMu2)BX>8-sJn2J$L%ep4YtwfM@`ce}J`rv*%So
z0Kg5f;}7h4SqQ+?)0Tt*96dnU15Eh?q5eRmN5=!qIlxu}7&ZW<f88Mk2zP*d2VnD+
zEs~`zlKCytPaBjUH>id-r~!H#0M9$tm>$^dwl(IO6)pfduUg>&Fn0ieFIW<y%8CX6
zcYtUIsPm*b+4wm*fHwzVa{%xD1DgZ<Hh5AS0L=kh9iZ6(T>Sw*2Pks@iU$aD{lVvd
z2y=jxSMPOF?R9?O%;{bN2tTkD0082FJplmC4iM}Bl@8$Vf7tQ|up9#ZA6VY(^8l9H
z!~<0L16W?~{{WVI{07Tw10G2E2gV(s=b0*lAIS3Z5CFG-Aj^xxft>^ZJP$zR09FoQ
z`vA=k(B}Y?{(rxa^k?e^K$-t7B(2^pmpn5>a)SqDCevkeM1@AHpd~Alc_lf}+3dun
z#ybd<S|i2m7KO(!THuE2PCnA6QKQ9IxDPcwJU43~KDpY$j*9fVKQ&vwx;yIYm_HZu
zdwt@UJMQba*%eX}s?(#|^L3^~vkRx4<of6Bh9m;1iBkPcWJn@niWvEOF`sWccOm9j
zYn1-<*S@Ds8(SM|8!w2sBtmPDr+>NtUPCEwZZBlk?c2dd`Nrl({>GFd_3Q6TQmG8*
zUyFf&$FzsBN4|$Rv;~<OdmMDqelCIEE^__K&F&PX2OH7uF*qF)tUvLRcnk!+{|WoJ
z5fa2y8_BdnK_TL?GaMa$9!efcjG&hk&4!4ZY_9xOT@r_e=aY|axX~4MPbi#r7pXmV
z!nY0r`*cD$hG^W<Ym3w1dnv<85h@C^q|fpLWlQQlejBbGjMvE<y%^l>r!GBvAzi2v
z<Uh26x;ME<U_`sEer{`vCC$t0Uk|$|_itYqKm;J)F@L_^r0jXpbAr-ExkBjnWZXQD
zT9w~^nC)2GL6f^(@@X5e0K?t&<J)L*IsMT$@t!tu8rKWk@~5-+v!vH%Tq_PKKQ5A3
zcG3}Au2wcud*tml_JYh&s2|&(BqH^h@~j}81HbW{C67Qb&16kWjomlDkc@kOsXG2U
z*v52_)(dohMIO28#=SP0a3?JI#j?|N^xpANB}-^p{xLYzKT*(&@-a#NJ0V0#YJXuj
z!nX?ro)bC2zZ#vwKWjKO;o#MA#eU%$r-ebH+ZBG24}8gf4DN9w9(x#RKa0_ON@Dr;
zXsr;{cZwg=LfvMxAFoqm|6o7<g=mL@o=;eGw9ylaGNmBm&pqG*m)Xhzp|g;yfP4WK
zMYSNY!?(Jpe!-f*h*mmiC~b9dnfMcE(dSVS>E8ZgO4&=TQ0iGlXDz5o?w>%h^8MRc
zsuhpGk~eI@DX;OIROoNT!y()dx>CJU>7StM(e7|ryVKr~Kp*<Bw;F5-W7jY!TpfV*
z*4mUyOBtSyJTnUC?Jdq(5mfQj*g)pf$RspgA*ID*?q8)wxg*8jENr+!q-c1U(GVZt
zXNT?5+NG0thF)dyX1DHgggMt=`#ErUfH+T30Fdnz7n!N6+6++6m;BUx8@61uSZ+{l
z(0G})M=aXBCZb=SZ=*t2E+-yGN<mj(`Hkkjnt2G1SdEouPEP6<gVOA{)Z`aw#q3TT
z%s*p#W#nrY$aaeHtD`3xDSPhzYCW*)+E?+7sTkFDb#tgm48EulYrowqr+LoC><iHy
zee3eMd-im$4J>)SYs0{Cc*|2tFdbQtVBxxqI)}UUB$r1x$Y=_61{--ZG4yQk{#wqW
zc-D;=Xif~=)7}u-yt00yTyuB@?d)0#SK$kLYI&}Vpn*u4XB$&N8DNo_GB@FpTWgT*
ztk+c~Z-XgU;_FrSbW)kt_0iH<4>ylpS}81-=!@k0+c2vmz7Ve(%N+z;^UNEYEoTbM
zLSiu2^}HG@YXsB+g0b6*v75d6Do~Mv44&3e#r6tcQ|t^;InVVS%fMOQ42Yb_61$3r
zonHgz=GrWe?1mB4CZ&mV(?xwPWTfi(_!-Tl8f$p1T*Fy#X)4CGSSxl)eyL90@Oun@
zKG*acjrN9pZjZ)T&|c~$h7<2Yi^dsyuxTGV?giICeL@>u*^MRd2PT8dOGdM4Yw*73
zRqH|_!}h0<7sagEa&eV$qMbqXq?q4+Y9s|8N@DQLEo9`wwH{=<_bRa#%;gE(4=^l=
znoYaW)TNET!&oCtXOmC6)9Crq_L?0Kl})aUJ+2J!<wDvWNdD_D9~n`9Q%N`zomiU+
zd`}i{S7{tIuHzm|HolROjTnboTS*5m@@^+BNpV5<w5>rhb5G|Y$Nrc3ug6{yikEh8
zZH)(J*UvtuIGC?3e=_i8fHPNPyGX!p^y!s8(A57#lY7}Ca6Xx&0XUgOJu+9Y4gx0>
zbH1V-)fBgB7{eT0i41JwXa_!HWf*h!;Za#ielMGC$QP)8ZGYy$Go8#CEw7*CY}Mu#
zt4nL4?(b%O6qgPX-g-$b2Y@vk%H4ClU6^LD0I_W0nONQQu{&9I4V;f>eKX&K7NE^G
za}PG@I;%N^XS~zL8(43{vHUDYOv;WV!22UnMW=1pHhr0q6feH8R`ov48b4PBxp#%M
z$*G}}i_|Wx{52j{C4E!F3xa|8adenNv59@4orPr5KUNeZdUE8le0;*jE0&f}WG|(1
zB38=QUxuW<`JN|B#;qH3Dl9?3=Q2sq!M%(ip`jd0aj5~-rt;dHSd&N5bT$q>Ris5G
zfP&M~mKI#jE?)G-&OJc|o?Gn)cVn`>ZCk9P0Lo$~^<QgZR{P~AtPDw|n+o}dVv^T%
z*)0wms3}i8#%@9ru~Fwe$A{yiSd>x*4W{_A(GcgD=m~+ZamuDz(~Rq@SB3CgXGZ1P
z%vb}C&jslD3U30cxPtrB+PS`d{;46_Fp&?J`**$)om;z>NkvPnNIyvqiYN&pu}g^~
zZbw+yaZ)WWx64cI#X6A8SER_9maz~eS+%)zI)-T=heHSn4kC~^4?VEs4c3y#H*#3o
zX$9D-UnzSDqDVG$eyN*AYaVWj^MhajQlA5*ndob8$T~h5d!G`4&}-B=6!X$k&*d>x
zghsE^+DqT>E-Z60BGnaB>5NA~d!ah1nvef`synS1Mr^)%>%n~6cpqD^>DRhnJo%E?
zB$0IRam>p6cB^&batS{6A%4R>1>&C{U;ksS02grg1CaRCVtXVz`Rh_ACT&g;z9P+%
zF}MJx$sDS69d@N5qqrzR8&4XA7!8tA3f|?Xiq{PVAC{BBvr5Y#qzVo}s}@}y<SXSj
zm|%a#IH7kD?&?1_Y19>o0#%I+-I=3=RycoKEAt%iWla1PSfS69*TQTxC6sLT!-o0_
z#U!DNV)#jae^@R~lK8y=hsx*Ak*}t^>b(rIdw&?=s1wcK8Auff#4)0OwGY@k>P=Zy
z7_sqWFK+-2CYG!Cl^bFskWfh0>{$EqrZSNl&}3K394P4LdRN01%XAds&F7j!8%^~6
zON!&0Y6Cyh(a)WoxJ;CWqOzoI#fJ0C)}H<)7HeUAp6?v`!SJTF>$?%%p0&5CoO;@k
zNS8w&+UQwDzn8LD$qjt?#Rot2HE&7}27K@(y!Jn0@uIcsWkF_p!0p|a3ax`E<fqK+
z(TAujl&@y?KVS?!emWD=1gG87@aVX*7I>YFado4v^j3x<P17#Yr-cce-}7vLUCyAZ
z)<wwOUYIRSdELt}GmIo7?WpOe`|bJVVE0Bq!#BC42E@QE;~>9nraRE4mps~6@bZht
zQFnR5&9VCp_X$!yl+QPuQ1fe(B^w8m{fwBFNe@Bq6jaC^MP4EA43UZB?UjaOBaw9{
zFN)Z=B33Ud92pf3Otg^w`uH*6cvkcvLy%>d5==sgXT#GizVZ;8OstZQfykZfyPllr
z;KZ^1fd4i)=;^IySCbN*J|8`vVHp!B!mRPq!jS7W2q_d9bHA-M@Nr|LR`!=Sl^&VT
zfRD}Jb%qCGF0ni|bs}A1mM2qf9)_299iYU(JdeH?{GgIbM%<6_M8qE(`L8;6LcaVQ
zpA5f|@V#$NZc?7lRG1A*GQoKjdj@M;RnPv(qvVi{ec*>Hn(Nz4zF2u+;a63TbMozN
z>}qY3Q=QhPUad~*w!ksO?48{3QwF`g_Ll08-5e;c15*p1q1&Jms{e#P{^$4EXBZA`
zeS$tQYOg>qsE~hst+wE_UdURf55+LbvgXNElg{q_-W5DpuY+84-5*R>*J)fabFKUN
z10}I$I3Ed#mBy8!5fzz0VUcTA$f|t(YAUnu?kg$&Os-7K81jD{i_}1SLkl1!hlAy-
z*{HKw3vXfzbUBJO6hjl%A>E9)%&CZ4xE1KiC?>N(l|<9>cu_IOc1UkV^;xvl(ZuR4
z&Sd60s-QZ#ac$bux36Go`nPDSv}_(@bGOFdp3L+w{zn!86LmgM2De4C^*R51SneL3
zjtO!B2*>Jef|sGap3WQ`HtG>wWI$vP-U8_}cXNVhK?lOJI@9_*;U?`VE`B9bQvxp1
zK*h%rhA~gUY9{J>zVAvcC(iV`?m;W=PvRs0jRnN(fQdpCs@nfL(P-szq|W3`cc69q
z8ty7sZPsP;?0pxuI5#=iG&nd0w%o(=l|$LEb9!8l$`l6o?bl1G{;1<6=v*Ky44t%n
z7i?;2MC{8r#gi;$$N5DA0)_~^ek_|pYxj>$v{+j_H>bX*YyiFQSz^d1+$l7hSag~!
zAQdHzNx5zmG}acz-AS30Q{O?XE7=r|R}pwtEx>t%oRCSLHzv3YUKL|A=OwYmyi`Vx
zBfapMfj>;(2;(q!;IV|!mT-{5h<;mM{PXd(rq!S0tTRmGZ3TxXJ}-E)^xV{R>wX1A
z^qGEOiTHw_s(x>TrFrGh8>x9P&0<Y%N@Ufmm(i{Bd02i_O4N}-*|eRGz=62}diBP{
zl}2$mC=i_Gfw1@n8f(`Q^@DYss(zUC!9+;{$wt81V!Ghs`l8jcO{s?eF{;lyd#tpY
z#_Ca(0G7Oh(!5B#3OqPowU})AgA{jX0+aK`$YTeNd1Z$sSOKzIn$5m;Y9dEvtF4l*
zH>*r@<ptK;XhV@G$FVE=yo5KgeAnQI!3+0+xn_Yc?*V^&6vB+tH0!{<@L@+FEcj7#
z>KkH&$4O3h3U4Y0&8-q@lA8J`Y2I=jzn84DWo18xN|)sF&N$l$dM-=L-82ecm{07c
zS!M6PhCG`c2u*VNK5%t#(k&@M^+(2G0^i0(=e})9nGBv*C3sT4o$H*73JQ6F-NqdL
zQ^llswQP;&`FEl7@hMx=>&XT*o6p%bBAV!YVVmn%^k7iuZf`+{#(XqpXMw1_;s?uU
zD&&vqQvp4^b>)bq<vay4rl1xfGu{<SDp<nr)CEWq#~t7U$nOL`p_j2r_X>4>!!WiF
zd-t9a(v6-wH%{RPt(bl{=JUDO6*~I~o;>AXN9!5>djYpkAKdD?>gOGy;@>k6Kg_H>
zoz1=DH{@4=Ix`MCa^B3s<1t_vlFZ{IGar-(fTaIpE#}hhpyrs@ga-z&Ni@O_5Fri&
z4d-9c^udjfZ!wzeb5hdGd&%AF=)2$NarGVE*iKi;`<C+}R;}b5IDbnn%)T3G6N2xI
zV11)kb;#1<pw2b9XpIqP8kzi4LCQCKYwQ)CQ{;bC8T+?eVeBffhWaOdW>Vi7Nn#mN
zUg_{p5~VZ!JQp1FwkdQZ#ofKJARH$heQrr52BeTN!kXi2)DZZZ4IE?q?K7^!%ediY
zH;VM(t`&*zbd#ObH|VL~z@)T89)C4!UO8~6X5YwuJSA{@^A&okpu^dwR7PCDbpq7|
zO^X1JPE`*H(FhTnA4Ik(CWrB$WDZK?Z8}^}RE-D^x63>7>v}s;5+>m}5_Zn5Yg(_A
zyX#hDP$DwIxW8-V;t4*2@&0ipraUJ{s>ZOB{=93#C4=WyE^!8hM}CE844Zy%BDZ%z
zL7s$*(<8+5NeN`HKZt+i@10)Mygbkw5Z!|}{Ha46-M4y2RBg7A?Y`WPHuLU_$*LlA
ztHCq<BFKhLwAu8DWX}7P{)>z!e;d2JgVvxBy)}ePYP}3DY7Fy#m6mqGZMsd}Mb)VA
zz19@k;6$aVlGWJZ8nd<I_&)wo+dE9J)zndWaQ@0?=DuuAK?^*q*s(K@w&7l75^t-(
zjy|eqiWe-F+OMVo!y>G3bc`af(qRXI`sP3Z6LowAHpk##n<-V8rr>z9)kdRX{T3{C
zogReVS{rsju-xPqKhMpS3u`9!xZoF4*Q$^*P@>6REq;sJ`-*ax^&@4o^(Rg^*i##E
z;TT=@Ur&_>PRz|RYE8H7JL+6ZXbRGfz8<-Oy&)ixiHEU#=pJ$)apQB(JU)gRDgh6*
z00CjLSFQ3wTTJ-qS|<F;@iDW-RKMu;N}j9C6L2_c+H>>Pe=B<vMh9R0?&T%EI=aqv
z4I=u94_G2P#Z!>42kN=`jz(i97x^1_zF0r*0u#&}0e$%=@e2stYdM34<OHuGeNL8`
zmMsw$TqVA^l&a5uQn_5(*g)G_J$D)HHJALA=u3eUZ&)!|UylZM`u<W{)BTlMn``$Q
z4?i4glD@ODe7;<zTu_9WaXvF-AvxC-?Jh>drf)U2Z&l}aDa5s_3o5*!|7uEU8Itha
zLgQ)x%KsGGmhA)jRL+<D;g6|P{ggv-3s!YpXxuEHm16O~g_<TjTke!x^K_YD@3_Mh
z-E}oE+oaSwi^g4&vs0&267UzLQ~Q-!MwTV@A9Z#dy<hDJj*s`Uk$Lwz`=^-!x-0sD
zQ)#lJo0qTL(;q3fz^0)6+q9yA4mS6qL}35*@oc}qsPhX1BYnm>g>Ub4zUjsbN+gZ+
zBWiLXRn+>iiF6t>@RmE#J-UA;fU&BAKlD%D>=)nOK#UYXerS-n8k(L887+K$0=|z#
zP=(7u{SF3=GU~QAKR=9iw0%^jsy}c46dIsVbanJJ@<iX+;RF-u{&~8)>h$`rvbW*;
z1U}zR67(8nzDkgl(wQrdLP9Yj<S)nJC}BC|u$=7QDeT4UdNSpQYmur$NuA-f38RC-
zS`fTHgslqBs_yN5Aspn1z_TUSkbGf>dy5)_Hk<=L-NZrdA<r{6$}~z=rfyojDq%~+
z#qZIP1=TSBcrT&1B2LTYDjce2&+H<hS&`7gy;hLe$x-z2CD<IzIi!T;Q>xJ$hQqnp
zPZV3-P?0vo?}Hx{w^%$iE+;adRsE0~D;K`eGE^+ye$1+r<&}`ebv35z8`&lhQdbvT
z<jF}5%P?D#zK3knRwa?Z+OG1^-CIf;`c{FT$o~Z5u3{slyOa1wh^toPr9%On%88e^
zP>p(fcoE6R<NOe#WM5(4@@G+73>D_ugh<WI@+e{RXu^Kvbup6;y!G+=7ShTY%0_&4
zm%0T$>#ZD5D=LRwaWt#M2EWjG-RXy`3jP!C_O>@HpPU2;@+_K?nRa#N)Fjmi3o@Wn
z#=UmUk6q7L?MS@VP_8gKVAGYibyIY5HA#w9QzkBxk(t=kf)G%n+t|-y6S>6g6E%gk
z+9kBflL)OPNHJ#KG%Ae0ep*EE&egG6J?|f}0Lm%i52<Tx@Ca<KK>2)DMnylfxgyS4
zf^v3?N@(yAUvQ4wG;5*J6cIku?6a6QM8N|hn{v^O&dcLOQ1oH-+QzET(h$95Wr=Zs
z8woNaQ(q>Mg7bxN)#)B(PDhI3YIh6^Oickx7=Nhs-HCoZInZxp{myf|)4w1ui?wWQ
zLb%ZV!Y+57EiGl5DgTN5Z49f}8!GE)U65NwUYkFijIK}>IfkC!TV-qqvZZ-i0zUq+
z5*dUm^x_NwQ&ElCCF>$%LrMdSHq5`_JJl*s$kaTY57xF1IX>l}H7L0%Rh<1ez>e^X
zj5fU)f$O_c$H<E`Zm)%Yf@UWuhS$F9jtYBP-Lzh+>1+_zdC(RrIc%QdkvuFn%gaQM
zujS?Ua6e|npQ-sw7kRb=fA#lndKXAsC0o%DLq+X%{Rw|!n|jmG0H3Mm6Kj;x(A#n3
zmLWtSOV;M{YvX%t?R9kca~0FHu1de~vEjQ<773s81=?gQw7vIYS;KH81SBg!`@N{)
zmE!JGBL`emy3>DaY$ZUA?X?7i2jUTYXdz7R!%2hl!PjnMt7-JLg&;y3ym4wKMbEkT
z*X>i9r+mdqOiXrRkup^nPH<OiA~Ihzs^VjB=AQ{Ua()|>L(z$<-4f;KdzDL2IVdn+
zHR>pbYWnJXip+mRq5}{KyO0S)Fl?wK)c<;9!$o=`J;1pvOPfDWdqH^Bs3(%{NLP8(
zbT2$VJ^$t@wyHo(rOY$CrjArph{s`qCj!o|cUl}(Hk8jdQ|rcA0>7QFtK<zNQ6Z83
zZKcB%Fn-J-n#eD($_e+7r(zRP5Vy17y0)H5Wt`?;+rjs7a5M;wWVXTy)$4EtXs}wv
z{5TBC+dlk(O0D!l(M7ZevdyjAh$4M0^p3@;gs`Fi$b5iSm0t9IEW9c74YoNt2NiDo
zON7<tzo|*rL(e#ar7`-j(P@GPY3g&JW(wl@k)ahtEQkY#Vx<C^b5j1ThkOzTjts-C
z#bQ(!_|X2z1unf}b<o|O1IQSy6e&2nkD|;YRt488n_^0-0R3$0_<CjS4O8{P<JKMD
zfg8fURgAvXuRbs{)srKiV2c>6@o4w}1dQ6DeroLR;B=I>0hG{$$A_EHxb8$Z7c~^t
z?xHSheD=nS#dfUS&zn!RW8|{T*O#J^NJZ^e9|N3V@H;08WAr1IespweoUwis*az$A
zV*?$VmhMaC$7&A+hd-r5ue<wI<Ir5J&N>?1-un0Mi<9WlXNOn8-HDb6ZDdXOc)g|>
z-PtC?(^SYw>bA?0W#{p3=?bTCCc054O{+$j((F^@T~$qW<gSVa&+NIXE5(SHjssXS
zghB)xLB<+AH!9T}v)<gEg1c3YpD6xq_VSkV3cUMm61`+1qhb39oS$-yv&Z$yXqq1G
z_)Vpb->{sfdQ=pez{ml<dOyjp$YVM&GMZUB(=G94^UrdhlHtH}+OviSE9IgVykX%7
zGFi=Fs-vm<r2avT#|fN+@gBn}1xTsC3lKm(_6}I70P3;eiQZ-6YxLb@Calj>OXFs~
zEHr41A+=}hqWhRrB5*gZ%o=yXlw^KZ!9x)$yHyvs!XFZbr_o1}LMpM8Yv17(x%r4t
zF7H2zyge(km<lW?kI_9Ag40w(#~8S0pZ&)eKg2i~K)lEj?2{|`|1kHK0abl%yRWpg
zbayvMgQS#zbayBror^}gk?w8*>0UI_9nu}rB}j<infz7sdERI5_dOr>IeUFybIdu%
zJ??Rjd5!VAa86jS@G}v=tPuE(!d}!|O?S5V97d(tm@tX>svRGF+4OG=hOHWs|0L$y
z_1t{tKy{v3_M*?%J0y0?Do|dm3n}xeem^^Q+CybAyTM()F)WQI+>`MnqzJ5tcF_xE
zEcJ|S^7XA;`|Y1`uMP+YH{<Pjm^28uTU^U8g{GV3EudxZ;?@y;RL$C+Jk}4<!8>LZ
zmgAgAV^-X6R$MVRnkl>XhtZ6!qc{{)q-c7zs;fKAbhSxOkA_>dYspP5MoLmtmg)`m
zO{+p!*L4`?oFOfd*?b05if!}zQvvV|`U~<U=m*>l%Ld+m5YO+0!F!#Yn~js_;iSl4
z*gTg1lk7GC_XTjj0B{>1o&%~ffB^%LY5<7~P+I}1`6tBfUM7zX%beo@AZ~zC4v@os
z5!_%j0JR$+xZTU%|A^&)`U*(40K^SYVgZ61Aa(!L%K<zbpqD>D+yK=a5XAv}8vsfJ
zXmJ1u?!TqC0qn8=7xcD!1^o}b4N%a3(%XXW>1}`nf3Kj&hXMLHAe{r!JOE((18~a;
z1a#<M^fo|v29Rn1!0ji!?VdFEU-51CQZ#^o12z%>@-`r8(|mXfNaz5*4N%d6-3I>?
zd>bH&KPc(|xeZX%0dgB4r~?}RPfZ=5wgIyGPc<C?=-pG>aNpch+qirH_5PmPCiuUk
zwgG&%|3qyA#P$C~ZTl&%|HQWa6xaU^+ZGf4H?|Fs*a2xDz_tM@`~MZ>wx1-$e^J@f
zuiMmAv3f!}r3t1UBUFlnrVWH6+0}8p44VkgX)+v>Re?6g#729mmCRi@k!Md^9aFkM
z_{n>E`}&I^(}jKJWvluv8OrEo;f>t(!EIXgrNhj8m*zP|rA!*$NtNd@l3fswNGUc$
zx0js`oZzRKtKIr;h)TIMDm|7X?90&1;7nMz?i(A-?O^c7cinSFAy=uZEX({aPFn5{
z39qeQ26KmSu4CJ^T_w8+r?Gf3dy#p~*=9EgpVZd+`Y~2HqiTSuT8|;?=RO%99Z!&r
zJmx!ILOZuKDojFl!3*ptR{|sZ4ir1PN5NGdVc4Ke$>!%)c^F5#_z9n4K5^-X^Pr-1
z59srwz=kA+$$3UgjGh=Q(@lYlirDHCCp8pZnqJ}Dd6{mTs>}QNt_&IpgftdL?Hu^r
z^398`u^A=s>vb+4BBQJ+q;5IPsqnUQZ0Ep79ypcJ!7I5M7Nzc2#0AA0_Gmo#M%ftX
zWCL64AJ%8q6;JDg%efF+?UIFsF?-WL{BB}N=<^-(O9L-hD<caTd<iqjCX*nZmj*$>
zqF?nGn2{=;#veUXta)CD8I>qz`B4wrIjI<P!|ZCa9C}ZOZkf3Zy=}i8?pu#BB-OP5
zwMX<Sx;7YP`bcaAwB0xyS=q)wU15)&?3iL@Wh8@m?9^-|@gx$>s6|r&!8bh&s<^aC
zewulS^Yw;OR?7kA508untwp+wC*DZQbS}qQb`dT*rCPObu+a6%c+ihzHBYTAXiC#h
zJZTn9F5fk_5fG-L3~)cD<3gSj>t*P(XTr`qvX!*A7c<(4d(VEiE^y7rhPOgRl~@(8
zLnMNG6lzKMf>Q#T@>}&)NrRwE@>Q5i{Z*{6G<4jo*(HI`==y9pEZeH_p?@t#>#_gB
z!5!Nr=(VNWHs!$V#{>g?g=W$5$9|hgXHiYLJxJ>YmADMB5}`<kv>6i0SNPb2<<irU
zmsfGe(aIFv5>}w&<(3;*A35$2taTN;^s920a$yx{F|(T3QS{jSZWErsbZvgaL;quN
zZr-pQ@hdC3>#s~!>gwP4QA+P3;q#DGS#Lt3eBVNZ?0C!L@KOo~m1mHkl6LrO_*3$3
z!|x08lVhT568eixeAyaIY*X=2_%8BY;Hp`;`#2N_!T;_Z>0`xWgt@0@AMtE?BsBje
zrmStFI3>0CQ6P4oEQpUX#EqG1+&GKW_Twl%s^aAxNK*?m9^f0tn@hqUROlV{EqS|v
zuC9RfrYE}SW)b+&be}?Y%b}5=nFSrLSBnu*=6JF6@$CxhykKS%C%5mI9L1WJ)8Jpb
zk!u((BX;oSc8#iiJw{FKCXS-2ps6IiX*>2lPa&yX3{RCW4Rg*KlW~|dT3jL!_3_Y&
zadGe3$=uidnR4%USEW})!j<xmmu2Q`)g@|@uQ3}7ax{`#EFOAj&$z0MAjcE~o+MA*
zOo?t@(W)jl!z^f25B($t6*pgvGLVgeK(K{kRf&{zT(iej2i1g`4o*@!vi$&Y-2$>3
zH(z0@E{zO19Ba<F$iEUj@Y8iK=?tWaquE0f@VUpwZgQ;AhtH8*#ZNVjo<55oASdvn
z4L4EN!a{S3I?U1_WL+GD^EX3sD)i}ni`w~JCTkKbX0n6Z-?4sH6%8Lgey&5SXCzuy
zSc@?&ch!nvT}=~yAHDe*E7S>f=gm2>ZN|2+Ar<UZ*0Lg07aaj1E^*n<?Ots_dhoAO
zk(|WqRCgR}sxt9D31nqRm=TZ;WZ4iZGfMV;3)=s#!|y9B_nd0t^kGQr9^RD^yktz@
z!D2g(b%k&&3m>Z>^)(104V}~YE>77qhU{7EW_Ez7zjN5+Z-Lp>j(57Nff`A*Ch@%+
z9*@wdo!XR0fe$IJ>wSA#o5r*6+Khb+rAvmt2Hv~1I}{$m{tp`ZA`rB=Ta;@(Ka6;w
zy|*YIbrQ#?ljkT~m&R=t_!9~|uSqiOiC=AiMsD6DAzd#e$DUkNp!Q9w3bLG&nx2QZ
zpz&CNub;a;IxZLy!73j!;%stt^K6P=G{O$crC~AYZI5d54$nFmOF1D96q$L+Egv-M
zI`wX8F@}z6o|}1~oJU^EwL#IwxNwpBBzZ){r?%Re=BgEO(WG~F1%jl;4?8V-eoL@g
zL)02=Q2(RKteC&i)T<L$)aFg);ut&p9><gZS7X9<_NlYk%9~aD_G+zv0&C=c=o72h
zMbH%vG9#zb>e;yr8BuNJ&GL|;8@l5fyf6{lgO}g9%%|7PES1JLaE<b(T?oQShs7yJ
zJ;WI)e;97*M4sN4Lm$fD)+Bei7H!x*edEK*V=hM`QJHr9@ls_p!?L9p5(|sMXiz=Y
zDW&S}^`z}Xj^ic*-!A#$*npbJi5II$!WgnKHp4Xpkr_7C#VbWwED_waFJEehWYg!r
zoo23ZMs7X6vspOU6o?3%o!|wL$$i8tl0IJfk@w2)^AB%tg#kM51DV$eBQo;h4^7k)
z$KL9e*F66be4M(8r8)ZL*!#G{)chS$x7*ep{4AY`BBS{Awj(AMZ%l0}%6*r?SXWD$
zdUMYW@a3mYv(_QKvUWxp=l>=qjm9r3&#+KUtq5J?+&K@w0y0uw<pRGRx+Uu2;tx>*
z7aHO!6l*x*6Eh|`=3Upizo|k-_%+NvcUw7Q-s*<<7rd%tvV4E>Rv$^3uwXboo&xL8
zMEmnh8O;J5a9!Ez+MibrvP&hh@>W+eJ*&>DyttlQCJUP>PMXIGJA~)ScgA?l0I3CT
zpLaU(oLS{sFuYM*T#2vTBFiXKw<IyzrKGm#y{79|=(s8a#$#Fc{Y2~J&E2BD`K{(D
z6CEx`_}q1i5g8LFvTYwj9m>m+Jv?np>oLpBlu;AA(j~`ViH*4XR@X+=!GfrT@zV$y
zu;mv+CTOQGVScNvJB<Mf9wEV<<MsP%(w+n5_6%p`&&Q$N_B=mdI|#Ra&S1Ci8+ehL
zPdB$VvW{ocA9DeRbb<7F)mLX9`uJc~=0;~%1c<QEQ#E<6H&%yQ_hYYq)XMpW_6A%f
zFJ>3f6_C`!aDnWPiKxa%wXurlt@zkKJ1H*Z_7N&{qkuv6TDP?H@S5AWrhNDGw=m1N
z{&|@D)U&Y81@>&dU0Nrt$CaK5CTeomtNdynh?#zjZMwx_Uh0C|nT3&xTxG=se&Xy*
zxD8IyL(s5yLu`oQq^@y}{Z*C_iF?;GN@YrSDHsC(H;2f@jP1|F#+fvq&~P7Z50h+I
zs-*$)me~(2u{`O%5tuA=%{#qu?MxOwnPkoyXP^7&)%k9vey+;Ud^_{3Z)YlQWV&!_
zWeaq+vd3tgYLe4)-WvCWdo>&RS$s?o%?kMuDo{0@3M+CQ7U=0bYC6_?8Kb};<7f08
zb3fbQVXld6YU>I;VZIw6Dx<5iryC7cKS(W_RY;+Wh===r(r1(rJ=B%uO~#B?2$vYD
zA6jcMQzkCv6~Lz4<<j1jtXcTIP^ge0AUz=ur>*zpLpmjL@|NtMU^royrE7*Xrqg5N
zxAUm$$})Q0oD#bhbV}Gj1!;Wy-sOXf*fVNkoF8aE&_SUqA;YQMHmy>NG|RLVx{=9s
zgYeNbG|Hz{o{J)a9P1bD59!aip)D*IM?S@>B`18!c?bHLWa+z|KIg3X!{K#EyG9MF
zgs`?ymSFji@{mM$&*0$15DXaXTel93ts>hVg$6UN_sgR+3fmP@g1++)7gf9jCHv9K
zYg%lCcEAgy`o=&LNQDqpR*K2jaUoEoeGADtYS>pbYH=yQs^Ag#&}x={rhb1!rCaDD
zCr~SH8$}rC1T)0GBOQ(=;24jUzK*huJdWWT3ex#mvhc5Q@$cPPf0=dO$7=D%8LG?k
z_BZmYdhN{E>quJ_Dn;p((V##(G#`!`Y@hCu?~;C%a8=+EKU-(DP$v|eh>*kOB|nY2
zphqc({tE7Nq-H`P+~&N1MB|@&2)H=d9LO4<qsGNdmrYMY`%{TJMra&#qN?m<C3Hi(
z*DVp!N3g;#V?*3iNuNtnUU;0^of4g5ol>2mSKgOhLYR+TT7)m^5pwvUH@|ESRa5!s
zp|u%aKnDg7>u*1PNPdz_D~jtGFF(?6E}Ql3p&XXEwtP?@EFgT{PBf!LS;JfdmRzlF
zp!j5ByS=pDw%)ydv%a-1z7Dg#87nV%ZM;6Xu5v0aviEK$lIPtMWW}+ayg<j9DU^rY
zPvq^Lh{D#ODefY^7M?9n<0d`OBhOCwoZllMNs0|`E6*9&E&LHcvWOT2(!M$j{>Zv;
ziHLVJ0|T+J0s}8pfVw&>%V|8_-U2D0z)&NTDc<e?si*b(B>_FaEZG%gNzThY`zc1~
z@E~L=H4Ce{X5_$J68)teS~oST@o@k3x?#t8C1#ZDau9T6iLGV1&Lx3weTA_J%J&z|
zy0&y))JANBOGWWryuRwq-s<f#f4`maVR>_mT|}Wb>gI6~(OUa-BZ`s9%5E?G*(gW-
znYv$N639OnMz<DIQX!~bWD=ywpb#Y2qp)uII<2kG<V89bY4c=+tufq*5tnD)Fl(0K
z8eEM(-@Hur@P?K+zuj4raYdupkp^}T_DCHPE-!bu_im~WA(DpBl;5UGLA=;T%Q25$
z*Xr?3B23_IISw5~3@}e2s5mU~HGge(X?p73A+|XcsZ5G+{XG3g&!c@BwP#E~qPm}f
zBwwTwc|;1Q^7j7-t}a<1GtnBzsWE}v&1R2#C0pLMAw|y?@Dc)^y-$YiT|)PQY?Kk{
z#v407gU0Tj2m<bP!cpwL7dk%99*F_V8uDewJt$A4XUbI~EkdKS|I~6}y}<PHBZB|@
zqGB2CN9X74w~1-ApJNhsMW~d8c7*tz#J5i>wLhO!h2fMCmLN_-yFu}JrWFTjHXx3R
zTXcyvcuQb>7jJ;alL&dpgUYFhXMYG?6UH*F`MaatZO?(J#)H!%hsUt&b!#QE8Y$x&
zUCYA6lF2VRRCbwgBQf0_<IET$yA86S;b<G@z$T?<WE>?4$x6L&R|opgz!EfduG*4V
z6otMvZ0QkdP2SswoXJe!;I01o3+BuYkKy!DU6H1*p})MLN{cSXz?C&GYuh^=yeh@Q
zsmRLLu(@;fepI+b)l@vj1(@@m3KbLU>AnzO;9w^0Pp!XzRAjqZx*qfPz5R3XBU}gX
zM0qL(PWLZIQj$Dtfm}udY^&!8DrT_EkuH#0(M-x(-#KzBo+gD`Hl9EnCLIlYR8KH?
zVj7*E3jA*Jgu(KUv5!xQ&0BTMJI2r?*K=&|y1IpoegLJ&?|L-<u8iBJTDjZ2Wxb~B
z`Cf9cbSC}wUVhD$=M^0%-J~jfZ*XRCzts9#_3J6g`L$||15@baXF~~2D?^P;H(s^^
zotC*ML4o@+=%Wt_bOGqo*A<G+rDi2b*z6zFEuS1xymhPETB|U7)g}Er2dw=#Jqp>F
z@@s<fKoogF99u3@*lQF##4od!QL3(%!dKcrT8PIcWS8))B4;Ohi1!xHp<CVLoy<x}
zEy-SnX-@MxiqETGssyNdR8W$GWWu^F>?tMr*gBH(u`cUY%aG2VL{>_bmo|=_2w^}7
z(kDsvIM?u|GMYZ#BvvfF-WcdxYK+mO3T-6&74V%_&L%^*OOXl70~I5zy+dQ{MA++C
zu9RNwwkX(x^wG9Tjz$SHDQ~Yr(C`@(-c;8_5(&>zD0H51AQrq^tL8mRQl)3Sre?i~
zXwWdIOOu_6w2gYq<X2Ey@UV1Y2i8MhG;Llx8V{_l*Rh7LOMY-}LAzM5{@{%CO&LR!
z1+xo2I^um#DHEAfZxQl58;fu*ufLvKR5yYWs4p;%H#Ph)JIOWhLRRQAW|Jkf&nx6p
zZ_7j(S<QzTHysZMn^9-K3`5zPKBo_cvge`Gt|&zBH;-9sHM~T55>D0MNKz)uv#E7S
z0Jv1x@0>CR?vN14u0yP-RV|Wc9A+r;CR}*)YqLm1yP;?p<fMj1*4P1|4?#ZyEWfm8
z&`Zce)z1T)Ks9qk1lsGi;^2NLL4SeAMV-t*?X^+x7Fw}^f;~vHH*$`irMJfD;$??&
zGIG2A5LuVe#@u2m-pSgys}5#*U{aJNaju-W@Iy?R_5k7YjSgFjB-(3lDF0B^J$-fz
z{j7Z8OdO7e2n3y%7L<WSR?+fw+AoxjG!|->QpQj4nN9pS;e_Ke!gp;h@8}?K*|B8|
zf~*`A9c{~SO@|BBeh=ECB8%#45<6$7^lp=ud^GlGMZCS^FHtR27A^7Ehs!?K9RB1~
zp9U4J)od{c&CVgv=5(XjYyzpS!hnwxXm;!9UIQW(6uLx~2<1|TQc*;q9;Hjqr>!H7
zfr-~W{2Ub5a4BS&^!(@*TLZBxH4+qgK<50*WxV2QE2Yl`xTK`Zv`R5#19UY-eP$9G
zES(iaH#v{wsRD)BV&q;mJl5^hQ|6NMvrPN+Fqlp+LHxc$88t^^f+8jvL_ZMh7OUu{
z;@qn~19pR4NVs%(NQLxMjMZvi`eVvP$?rsUKZ;t4KJ$u)Nct#k%v41b+F!baZvjgD
zeTUD<x-s?aSi_?!oRqEv!iYSUpId-i`tnO<X;TsEDzyWxx1G(L_(Y4Qik_EI)&HCe
zfT1y$bORoNa^8cY^INWFL=8n^Mo@l}i0Wwpa}W^`2eDT5h!2@3F0aQ1H)qFg!qGPU
zVchC+0bj{*2rdJSwNi0Cu1-5x!$;<~&?8T8$hD6lvcG9%kijq_X2Gdif(pe)hJJL+
zG09}eUQ65!%-7zp7pxN(4m!p!KtG^9u;Lm12g%|0(L7Fe-~iokIMv^#JpYFzho|hE
zKjBo#_q-y2`tt`)1rVtIz^V2v|Atcm5URi7R1gsG4}7YhaH_w_R1a9H2PPGOz51I;
z^$SP^@QeT^6@bA4uvE}cnEytmx+#6~-@~cO(0{_IZc<@?@~Ix+R2P#%f5WN%CR1H^
z(f@=~{U%fWS1c8PiTbZ(DgYt{z^ShK+5V?|Du6@vfT+^3hNFOkA%cd&hJ-+YfIz$_
zRYg7q@K^vP>=&%c4I5y3-NUNviGIPV%&5-RHUHvO{Rdc82HgK1Rt2EJ{vB2o4iCVp
z{w7uZ3#JM{mi=!?RhzmGq$&Vx_5iE;77P1tyea@b^*5~QfmC%<f%y|wbshEiZ(h}Z
zB2@wGu0OD<2U69)W2)d`$sWU!z(NziK;uF|qC-MH`Tzf<;ZNtPf73wf6I8K!=?177
z24kK)W=9_fi2E<4yT*cz%qB|BGCqFx<&YVEihv%fZRpP~fe=S$_F@r|y=y_1eZ180
zhuA)N<?E5>s7dD8v*WE|mn$!?CY|xx@1+hSmrL%M+pdyn2y#%`9kRB3v#{T8Zf;C{
z*xQ|12@W2CeARu`eZU>hY*CX?VS%3>q8Ex6gdXY$WSf!~@(8TWqc#|@^Wpqgi4*D*
z>=UjNloRU{niEr7W**dLlJ8gtbJeD!EA1;CK^>Cqk{!M6ZS6)UHYf15ELSYEU|{_v
z5Ba^~Qjpa9`5n`>O=K3h+Y!V(L$sRl;YTwVsxN!yDZ>afe;^Zs*uqKU4XFa?OWPHh
z!I9X4kdK)*<Q>!q9L}Rk&esERbeB-yS;ZL#ggAU0;dW4LmmrSjd{RciByZQ@Hlg?#
zoc;RJB}yCi>5RlNYi{My!sJMoAex|bKyTfhv%Z~`Y3Q66b_cxbwlvVR!%0FUPAS!Z
z9$Lz<7EojEr8F8&kJDY3i^1w)hR%fi5~~sCP3s+T^k@m9jK5ugU*XL4(kP0F*|)SJ
zyF1+grK0o-&xLgx>$98|X!t0P&|+7vMnIP>><jk}${5jV6Vzfg6kM-sA_KFd?KlZ?
z!#1>LB?gCS0OCUX(s4U0*g`ROYcW~)g-#QcBV5DLqss%~;q4_P1xDt&{O$k(ts(QF
zP<5znX8Ivu`}P~qMB!i~2BqchKi76oI+$A!IfbfPI-uiT-cA?+XJg^4%Y}w<`_=mz
z+L=~c*=?IF@Re5(tElLV5oPhWJHa)W!W9c0hmu5@eikGhm8<S#KG#rV)Tl5Jnby64
zs%l!ukDzt9bRG-i2g6}CI$UOzqJ8>0gJ-LsH1VEc#~OZ#Y5o40zGi~zA^6XA?0lM&
zG#Qzl&Dg1$zQco{%qfZ!tyQL%_<_sWq81;Hi6XGK@G$r=5WT-q<~u`Z(iR1U{qvY2
zpk<gPS`gOM%QqnCh|BXYg$-eyT<%QLOD`x!IZua{NJK71ERU{3Eipy|J_wqTK@R5#
zSc`z(9zD8`nRNX#SI|>hSP5IK8f6`^h#~{CO5v`$?LFBb!So6zC=$DwFO7$mh6%_E
zWo?M(bVnlCKVRC<o7Wa*V_p18%)o5o^I0N}<4YPC8xpKZfNjDAE2!)J{INEci$3XC
z7QZm)?LLa_=(6&eYdsz&R96Hz*Lunl=zfB%`Mxv5h3`=rn5Ik!)wGte+48gfgMlB^
zOfL%{)5RaUb7XH6Y-AvInQH>ORHS2<-97g`14i0zT6wkrvX+NH)F}blS~4q4_u&uC
zKqSXvB8GEtnsC7N;JGo;H;C@*Ic!2>+fc}??rj!QR3y$khnX30LpQ^kzZN-|_}#O|
zW!KHAWn%BqYVsLb>k2l)bhxEc6wiD=4x{+^m$ivN=I)hV9nEFsbJIExCJs&v_C*Un
zG`k2itF6q)IkBv=&^}uR$~`AOTog9I1pA1;SjvDd5NOGgb>NN}tR(pQwNx(m;mxQ5
z{U9S9g+I<}EWym`dm0b{KJ<!%AHuc}Nyd&h8;@l$LVIuFmsQ$bq%k>Lt7T>P1pF{+
zc{wvd+zgX(9DF+O6;Z;i_>QLsYc8@fhMTJ^Q?*n=h{EP)_y+@pnVprx=qruKovw01
znQAp!Z6yAQgQc!lqh2)KMBclmCcM`=Hm@Z%vQ0rAmev;IXz3nq-`{@}!Pa#Y!{!t!
z-Khvu7AYw<uDsS1oXOAmeft@jXRh3wK@vfpCeFIoO!L~&CLYYJIg)XQx%RIVRf|8u
zh9$I27a+8Db*K_gmm~D7Z^Og~RZBgDA@KP1bgN=i@DU>UJs;Y?s@eOjEt{_yaaR@5
zs~QEBO3#!i#lP=A+4t6YRH$1*>;2))!@ILCxo&pX8`#8r8Tnr1&0@+0&~2MOkjO|N
z_Nms^4$W|t0<uLT;fw-XF8`&$5eNDYjtfLZdB5-7`oneef`-_Jv2qmtWX(_?EbMZo
zDURo2*T6`QXGGOE%-8~UoL<e$@lx7_uhp8-#f*U`)(`zn1ibp*?b$K$=M=ILsXqHM
z`95SUJCS-puU0-kd9RZ0Gbxg+a{!$pC$ny5uz93rjsTv{lrj4G|0df}HTUJEq>TdR
z1VY6(vM&db5RqEwx2&ak!;WM&Wb^kp3IpdOCgu?MCwW;EG+QmA>h4N|t9c6kx%o20
zOUv5rrFsX#neG@0>4=wFCJpUlt#KAIFe@BQoJ#NchTm7V6shO)rAJHe|A2u>6M!|l
z6&id6v|ebt^wnY1y6m!<zpgLuMJ#oGznxATeyqq;qV)01{2;S$dDI!bY9TM@w=g&5
z_c@d6JWc0>?`3HuozL2zCIg9_P6x!^Xj(YqzWkE0%Io&qS95!$(8yE{&d}Eqj=IIy
z3zGc6|FezG+>|Tj3YF)oekAf80*T-Vvkc6<Sk0LM>V50P8@Zd)U%8y$6EUAX5RW&0
z&VOShP+3IZowqBS&Xx2sU4nk{8<P?pwFBzN!9$nH0bQ2*sBDxiJB&&)4!?I-rz=Gn
zczDA=-74heH6l;dsFVW(!E_Z<u1}hEN#NnnWx|D*S=$doocoi<vH$_0uIOE0*gGeD
zBE>g(!*n21dbfm80f;heAmXH6SIYyv9v|J!;s4<W&3)Pr*gvX+@){K^iQdNqeSg`P
z?qTjnb(=>hA*o`U*T2Td7e6eROKOf1-M*RS-V6**X5b%OM{~%k86e5p4Xy4k8)gwG
zGRXT?JCd(0`W7}|s4Hf(rG@CWnYc>A8S9=j9OrqAIWYjeli2Ar6X0G~b!P2>ssp9t
zrGt|vp=F{GZ+PjI)~@65MuxP)G)(bM0!!O~tx5kiJ&=>rJDuv2-7jX{M!^j6rX~$f
zx9C{~BTy3YC$cA=cGc$V$k4kvYr<Gt)3KVe5wtMDXzfYd=klf2e<uEc5wP8%MoGhy
zMg)yFQbF{{;UW0AT+I>CO?!;ox6Fu^b-3`DAfNVg*s}WjVGDHP?qc=+p1|>RUieGR
zYL*q~4Gtkj&eG|MrxbLo)bm!E37?W3Od*GtSP>l!wK4Diq||UEx1OP^zU9hY0N0uw
z{)setr(&w&>2s(qKBcFfw4mGx?d-XdS|*qgGi=%;dr0|Fc+4HSY%uhF(V#u&THiz@
zNw5Bv4WB3hU&#X6hm43W)fK!~id%P7+z!Ps)`-|6^ruR>m<N(^Ip-Io*ELmIXI)AZ
zIJi$cqhyrSbflc73G2o&Ow0HPQrdz0Y#2ny;|~C)#3hcSISb&S)Ho*!!yyw$a(zDG
zD;gO1ld;>R>*=g;Sze}puPGY|q#kP=bUcHFzYj@ZAk^EA602^xUe*xmAAP~H^+(U|
zdGiDY)?}HhrDAVLLI}O?={NYJ_;`JU3C5F)1V{%%f)=CDBg~)GRNdX#(U-Sf@mLIM
zr5XU3hmr3a2WL+ESav-}ZlIbD^vpn@wgH!=j5-V-<Sy_wJlC4|pIja!DrMw6s|_Ra
z;ki|t?FT_esfF>M=b^IrE#zfC)r0JE%B{*hS}YL`6gL=b=lOt(3xuQ`@YiT}XPuVq
zB^;;>BowH@L>7H!Jo5K;C{a@y@Hz%k+TGty&~eR*N{2m#BZ-?UQ2RPQ6%};`YbgmJ
z5^Bu?LkJA?{rkmgi;`!@D9A44SCASFwrip<BDc)n=%C~cRkTOdg~9|nsx;LGaOCnW
z6`4(?BQ6|R<ZAg__2~Pxb68S<sH1>qm-(lxi%$o=gL|jE`7Y6C)GuEqkvV=-qv-t_
zr15JlLk(`}FvR5PrcPOEoTKblsXAt}1(RW9DyGAbVTSH+*erp!0aRn$$?ndwz!T*|
z6uupW{1`+TG)18FrlFnZnbnI%YnA%C9ZZ}u)@nM?5i)72Zv~c5G*}P14ryVL-ObVT
zS9PgA1!M&LXY}G;pvS`YQf5*uKJ>=#5yKrE1IeD->`R#28FIUqqG2uV!7odudii|u
zBdOB_LH;g?FZzH`3v0Jg+63W1Q3m-3#^E!wqCnZ3N<((_;Hc^Be4w?X3D69q&S(nL
zlhi)i%!ia;9<5+%edK?HbRPu-ji%~ADiuI~2H7kdz2b>T%1g<i2gk^Y0`s&hD!bk(
zx3nRuKLDk1W+$TP!0PE`OaD?6qkdBD;{`qF3!S9#bWxzjvWB`m*a0$tyx*};Im4G;
z??;rq?>dm%Avd0qKDU{Ph*=jU=AD#?Lu%B;V7W2VTOGkNVOq?G4BBCCP?P}C{j8lW
zZ?~6ZI*vQu#p(Ov09R1=feuu`orrNmi%L~e(vjjGz`~gij_Ezi3o)%X)kg8)x>)>(
z*jabk8Gh9C>wUuAxLzus;GV#V-(6w6-Nc2UWNk%!_05wm$~q1U=V@bwd(C`sm1N@r
zipNLY`XE#JVh)Z|--@NGOhbz!@;?g_MPPnChLDG3fi8daWfHEvFPcJ9I^`KjpT_eh
z#UL{~vRvy_9VrUwDp7pJrR44%w%uW4f-6iGxVR-w9FwkfW`eqhGU@(W=qSffnNZ#k
zUnY$qL^n8vn^c~5R;;gMk_IH}hQ)LaS&L-@H)97bR7qih;{hop)!G(94(kHsynmKH
zo}9;X+mCp+T2Ytt`$+6Q_XlmtyhXCv${FqTu_$Peh|2(dsd(F3Yh)P)0op6OgaD2D
zu+>Ol{*IHn<5iwxO0tYca*tRbu38*bml5-BtcT-9-xi%(Yx*PywA6MkHbPvUG_w2n
z@Y9Sf^7?cH6cwR~gAjm~6L<rNl27i-FG$4kY1I8NFkeKx1^{sG%u&%FbdIA7A6t+0
zfSci85aZ3hD-C9TE^u;`f>^zHW4bH%Yt^zZbnNvwuR)lZG4_q9k*L?e>u&MYM}r6$
z4K})5;f69mGe9~67I><|+v!N;o1*WK%&Az*)D&zQh*jjB#PtijL8}c62uON2Y*G))
z!MgI#XL1?r2_@+)aLy%?!YyQNpz6ag5sq@R*1-)Ef#F+l-DOtjQJ{F1s;Oh*eWV__
z9L=@983q4<lJm1m`VU|1e(wk7U}fWe_+oc&Mg4!8u*C!5<bUF|fUUwmos>5>aDlDD
z0B39EH)`uAXA5v>{uk61w)rpAR@D;YFWS~W+lT?+*1yrVe(oLyT$%q{+7_^r_a|@*
zKwJF{+yeZb0bgi<x%F?rt$VZQ{|elyb_dLu@6De76L1SKd;YJ$t=vFh-|#Qs7T^^P
zY#avsksq*I0CQ`56YqXQaahFPw5^{u&;Nn8l|Rq<KLKt5*3JNJ>+kKse}G#*ot+=H
z2m?mV59F;s*e!g^U)U{Ri|}vk7T_BFH+k!qtMecD)=yXG|1o?E*dP3F@U65E0KWA=
z-uk~{TkuZ<_kZ~$w&V`hQ&)wt4aGke7ALjG5NDPqDE1Xc3zPEEFrp=kmnnf2N5E1j
zR<#xt!LJ}iP@>CHMO4#{5jDdII9v1RIeumu(c0_v2%Nm}?(6`hKb_)m&@#j0P&Vkb
zc)E(%A<*I1QSZ9~FP9DwG3Qrj{1Sx_^ssrhvR7Apy-|r#<T9SQPIO>&5I|zxDW4>-
zVs!NSzB^jKSg>ik4d{^Zdj~xOtqzl^>tY80wRYR(w{@FcPRZN61YPv97Ez%`kur#z
zg<P~wXndfAaGNdQ>Y?RP?nqq-kwC{JM@MPf)`rV-vD((ht+;6@){jTv5`DqGEiEkq
zH?`kwkSb1uZ2|m5!0IRzjXrj>K;Kup^>uzI91j6fb`4?Ddi{p>1%~qGFVdpt1*9;C
zEzG3mWs>8b9VL)(i$(jW!fRf1Qs(Lxg14S0YmeebQN}LfR#E*5NmdIXF@-p7PcHrb
zoD#aMTU_?!<*96c_LNLExLVTJ2AUfN1UCvVg)mAxlnPM5sv&M&P9C8x#ts(l-%_&E
z*Ep>}Mk)s)gUb*#c9d#ktl%)$X=SD|XLn+K77Elp>JcpxHn1Q0-n`Ec((4nEJ~~pe
zEWCZS8vdtI?xkfkhKmYc95G=^wEE<;;Z<))kuI>G5VAjN8{uMu0SR0Vw`1LUXPBGE
zAv58VT1M&t+*o2Q1;P;VN9n2s;CTHshqAtY`Ag&UO7GC(HljFiH*-iUdBxXd0G$*F
zeuVYUNk+k%t&2#8dAIIKgvJ6K=n!PH2^%<axNWbeJYZW3Qv9`dXBF|cAGa=jkD(E^
z$ql=dZ|&l*s6H_qHo=7Mx@o7qu2_|lI~hdm|E4JUF$Y(i-ccyIA3Ylbdr-Gjk#hb>
z!$tqZ|DP5Ck_>PpS-XC5ImB8j8dKA_P#&hT#RvMD6kZ-_8NZqK>bPC;rjNp%oKj~>
zIg)=}lwZ|2vpCvUzEXbVq=ei}Dt0c^vgT6BgYi}zJ62^w&@Rcifo3(>P4aEB?T<!b
zE;K8?@Vv7O%s(s{cjv)FB8ZZYMAFeq?#C^cccv#XZx{9&8M3JPs^K@hVdNASC*)Ej
z*!qKTKgu`dXhUJei$eRudvbborr&<CIh;@=+wBwpNvQ|g_NQIv=TWcOpI}nVzR7$=
zbi|A*iann}vP1pN#a8>F^N1;qE!nw|#-^^zb+xv3#&ab{q4Ajx<8R$N;QUD7U#(DS
z)WqNqWARl)W~K-;w^AuoAQFxh@Z&**@o!}LBdD|R_`Pf}hTl&r8%m>AF+l#rY7H;X
zyai7+ITZu-Jl%^{%JNha@mOQ5{uT<rru_zQU0SuaoUt?-zQ0>55Dn)8e0JD=K;HE7
z4%n$|?=Sffq9k8^YHu55e$7O`zMf5N6|=eG!B}@=#OA#64et60Xwf+Z|4L5!D}v0|
z1`>pk{7lrH8W~Nds8!CM^))u3-CccXiBY{)C?9{9E~)pX(0>kC>eT}=^jf-Ah*S;Q
zkM-4Tn+_kw`;c+Ta`<Ho+?7ePOsc&p2+S9@L*%5sga-U`mIwh)%Q73DYlHLIsFNuI
zx>y_Wv;z1)1)}g$LN`e_64t#tD2`{o(=`|>+hL@z8fO-^um0#biVSV?yHQtSfc$0Y
zZd!!;Va%bOeK{srgS?Fy{sIv~*Tr)c3FS$&$>v%g#9sRCdPF%(TwN%Wi37gTxQUSS
z)F|OKH;jHA>Fi!jC=6%c@dgyANP)FWs(By@_vn-{?Z$dlC%M`5FA^T{oQHeitK?ES
zRClNLD$XKh?t?aH5+rDJBG^|Rv;rHL-P(9hw<p>@@5wRt&4<i3nCf3?rwiV^5YCQF
zlDqB1f#=7<f3xLAriOd72-)*w@G)ZzOOx+z(HY7WIB0}jG~k=}`M1A<)@|@GouV@m
zW$sn(7#W{=VuF5Qz~l%tqe&_LSDhzFhOl*=OPMf-6J$B`mfI+ftBl^$jYOODW!W;r
zAVZN(xhE7M^`9+cH72_ncXcLc0_}0)^o~ACTWG=c=+&;ey^h)WlW62^8e1$vLq!{8
zOXM-sbjb2{{G00Gm{&uSdQ`>Y6&VoN1&h1*7aCWjkTjpEO~l~c(9zkU?*-d_)Gv09
zN7OLQA)w!IHs<60T<hcK_2rXljhug;mupYj+60Q2!VDDR?=CwV5o`wH<k6|<N*(qc
zmJg;TqY1h06PBpzY9Bpoxk^z|BQcd5$8|6}ZqHjeKZTOa{Ox*QRG9uxr|-K$BSyQ^
zPr4KG)ZJYcDTeai6e=>`D31H+AG+Guo_j(-DqA#~vc7OSL9^?&1sOK*bN&M)=x3@2
zb)umK>Ag`7fk8V6al(SzlVCkUIseKKnpU9*8e)KgTle2Le|ZM-Wm5Up@9Z}87;UmR
zg_ZuL!Spg{`>E`QEsdSns|Yy?gO^)gbU~*b!Jh$qUoW8yCsDBicD%XNUn6iEm?)e$
znC+h6aD-rGrX9?bL+dotvEnR1n1oqxX0>9|GT*RC7^+3%%;PO9szuJz7{IgTq@mz%
zXgGL2b_{Jw>#WFk+LGIDJ%x0v+lW9#>x*?#o`F75j|Y>WhW`zP`vyE%O)oDw@h$~l
zSNvmw)ajvS<EhmT5WG{36GdHgV*XXk^>*a=c3Lp!-$e@{_?|dBVN^<(({_5Q2ijvr
zT7HVrDB2r&Lz8OOMJ_lN$i~$uYPVLi=p&kDQu@~;72aoShP>(`0s?jY!QFT-bdK+0
z!fY$pJFC>V6Y?ruDaFlL-XGCNLi0XK2Th~onFmQcKA|CaW-b{Cus(I&2<OU_Dx&)8
zx5$@1?W*~4`6Pe9K%`e@#hEdvv%q<>gLJ0x`y^+Ft0~Eyp4l<SQ4WP$gD4q#zq2W!
zb_1hrJG$$u9x=?L59Q6D#HXXB7M(cQW@mibQHg}V_ZX?*T2saBYq|I0NaaD<`P-FM
z<$G~DYRUFyy%+T!7J`L;A2;pFVf2*jlVLj1(FiJtX1np`$Bz-Nck4o0hv`3JI33=H
zr<=523uzE<@%sD-zAbN?j&9A9=@9DMe_CjM%aNUSD0FZe)V9=XVHx-15-k`-{2NYM
zX3?s%dw(~=_8rUP1hx69JWC^n8*e5B*7BKERdvOrH!w#i+rY_s5b8Zd6lA|V$8FQx
z;-CRn>Ag<1oH%&5eMtJrnR<nAs%6B{qLVHeJ6CE;M`chGi>q-mK+ySz{^z<MajMn!
z%I+&9MLtw=iUs>tTN7>`MGa*}JKOv?v<x)l4*JM_lx(Zn1pAXyzXlo+Fv$+rf$SkV
z@s#>71*JcV+3vja8!A9Vg$pGYr@<+r6}WvzO0tpn3X($Hnd&6eO5JDvkZ>oiWyD6I
zO(hn$&+>4j#tenw4(zxTBDo3ve&G1d#3sd7%dduSA~8rp<(g~f&$P2LZ|_c1W>9Kw
zStEl!NM7_p0-h5$48}P_aHo0c7^$_Qon0)%(^+!hi<|+K{b}rL9&(Lm+I)>%#Aq6g
z#kr<diafcQdHrg(Q^$`~jkIwD=N)|UK9`ouR;#Y<p_h=|{4=6gY(bO%;3Xx2fb18$
zehJg>L)xik1hp0n$#;yL;uw>t^nEwr>n<#u1+KcwjOc-dZRdsLi_SxI_p;aI`IQSP
zuV%`&K7Ye3doq(-NMS!md7E(kmYc;^^n<^xH}kSBXvVhw-9LEF%<Ah4xhE52*=X`P
zNCY)G)#S?+kSML7RSTiq15^KyFDD`0mfJ)OQqrRJHX#;#+eY2`BTSWE#Rab?`mH~p
zLGGd7MX|^^Rz{4RGJ|sHcB^Z>n4ARi;tMSP<oKJz;d;<|sI$d>xvldTsduQ3w#tl7
z`q-r1DVULU`)#qCPZ6eA^rqObF(goU0`^!t_oU#<Mi@`ZJoo*jbT#5?wZmu+l@lW5
z0vzP03_`TN1>K+sSvY=f$IopNeCAlZ$mY_Z{SVf$mHqgDyMAFgnNFB%NSZYzQMMGV
zwWsZeg+ahGh{0v)aLyRA1hJ2!Un}A3j>|Y(Gx_%W%9%-nAE{I386sb!?~$rW<#rX>
zAv+YYlQa_kAlPT(yRZ>vqAX?3kCJ0U<c}O{r=IQ8-$uS?JO0GD-h2iUR4at(o0KA-
zh;_=`)-U@E5CNoWkO?idDb5ZGJz8w-f*1aev^FL#yxJUaq;qtKlf>a)P8r}hi4kn@
z?Id;7(I&43qRox9$#wBTpkP@76agvc4;p>)EfOV{Jw(Skou7aFg%5BaJY0(R@u_Cf
zP{?>EPC0eL#(iX4Npi-E@q}MevuAAN*$}L08(OLE&C|(t>3|_>JDvdzMgqZ?FW2W;
zrk1moP<Ic#h0KXg!bUE@xL8%sF(?;k{EM*GLO$)(IBe}-+_(jT&$^aQ|A~<{$$5T1
zAzg+?<Tl<!ABjrl#$mkZSD(X`1Ri^@&gVmS@nNCp@V)hOjutowR^@Y#IzSViFlJCK
z2{U^iDD?50Vr%`kw;#$Flk`U_N)$=5hJBc`vY&DX&;WkyM15nZHK9F!JsVJ?AC0uv
zFJqGO?V4h*SGsi6O5^Z(QWRaBhC7GIc=(IbVu!{_u&tnb(6KT$bl_K|3~RY^X#sdv
zPNIBSakR0WGQY4cT~iikU-(eA&)=2<M(B0=TO(x*nle8Z7+C#^l#9>lw*$@#{F(2#
za0hCK8Q{s+<#6^(oJ=7*U`&FkAo4lO3QJFCXIWRA$6$O5%g99y<K_aYD{x;-%;erh
zLac@&&O1HN9@|&S6LSktK0KajoWjzmFxy{*Jkn{)ODr#SE|XXH;QK{4J!1PZ@@?V5
z`fKsB6$3U%7mR|~gj+K{nR?RY(=#kI%+R%=lh5|HHwd<sUZdo=D0Xs%)bAYzIPa!k
zHc>+f{he-c{HK)9-|pB)dBef&9~5dmbw6w8T3BF>5Qx9&-AdEL{WIX)y?_A0@;T>M
zpEZ_%I1H6NkBtvi8hz;_&wAF`c$-D#s?+acjgj{JhYNdX<=4`)xe2JD_3lmNFYMNj
zWOiPuhsOu+NrDpc-dlWqq_dZ#3F;XQ<b4%`(I{U$tv|u+2oxR<wfKt6q3-J-sMh${
zkG(?B#rZBMtu$9lZ<X^UYYz?kn4dlmwj|QZ@H4g1*_q9QrfuSj%E#X#PMHs?^D6$J
z0!tLX;FN*lc~;G*J3mvQg$WvBM*OPYC-?_7;%*L<h=iCQ3_>Xr#zef&Qkoaxk##?=
z7p&Sqh0e{v!Jc#E5@&rtBqkFkJMUGT*}uBAj$*F>SGh{YP0b+$wJth;?fgcG`tn%~
ztKqf_x4L8{SYd5%)wz18eYF;Gu~2gJI1s$iwIukt5ezKEk?TR}^3!_jp-U-69$q3e
z``4U{SbZTo5<-m0<E8|rAaKd$wl05{YO!JR0ij|wOQQ2C2Ct*1yKVk}M$n_ySf#jp
znVv<skqbmTm%VvKBF}{~`}}gvCr9iuPfB>kXaBrAkX2&~n7%@;J3Hy4f1QrZw<9e^
zg<f`%M9*&7wo3_^)5__ZRWM@TdsnzXh-hLJ>GU-@7FTAgq8w4xoA*3-i_PsI`hj%E
z{xM;`Fz`rwJMN(~gKH2)Iy+>6%48&|I+~py)KKYPgxwI}D?^?FG#hlVdwM`KwxmFn
z!kmZgu#E$jlacgSTdISmo*-dp@gCV-xZ|fEAhXJ0PQ^ZP6m>*+N*(6BEv}%B<-ohu
zLX2du9+d0I)*ct-Q!~uRJgj%}F!c5U%2BTdFwaju)&jqBzZndKx%$^V=v|z^tTO^)
z4ffUVdAhRZ+&|D`Qv4=i4X0|MLay(Qpt6EF32kAM*TDp<ro+2^YqiXoqNS(V?8KMf
zK7VpE@<|Wf=uZjkHK5{^>c4EO7g!|v2`HWh0L7M7EwTIPm9%@Ge5w<h8*-kGJF%24
zML6(%p2phKHUEGDAC<O$U?MjzIHaQa95~u(LQz3p#B-`lQE>5Na57+I<?+0F9;|bt
zid}xX@!s0UIjDwo%hxzFFBR@#fxpPa9YBuff{!i3u!Di1l(%>)wE^Q|>j_o+iHk@=
zL#>>DUkb<g>xl+u$gK1dC(R65e<jJNy=R~r8@$!X&Z7@rg0<w>?D2z*kuN1Gp)3zi
z*uL)DC~C&d296=~nnW>#bpDx7+>L;EKacHDEyF6UxXASD^WWlaGT<iTL94)EA9^mo
z@$Ty`nQ28C;)$ZVifxv0NmJS79MS4~5@dV)m!(E(0jk*JxfW?#*?J_4oE7}%`4-jE
z3JHFPkN0NHTIsF-pyzIY8Xgah>SLCu)>W~>0Vee)B8b6&RUci}h5pE5iW=4arZ>^d
z>7PFae|RJ-C-<o4v)`o3*B_P!B_xtD+YZD^$&uYiSk(IA8-%x14ssaJooopdLGO4f
zW5V{-)!okpP=A$a0usxb$sj)^z8sa5o{-8H1jWRvX485&j$gDB>73#(tdS*Z^>b&O
z=YH&Ait4mW<Z&#Kgbmx6)d#xbSW(4)WM!|oG3T5qTsvqxA)*VL-Gijs!JiHk{_x_n
zv@%)ps=qVg^FK?kj0Jml)AK@9t&28m`YP%uBHf*~<6bBnTuGoHXeqQr2&r^V*U&C{
zRoQBgN87T`MMiZ{B;(Z!6T_=>uHS@68L<fCNqS4}Xi{&NKvq}mW3A|ydf{`kqJw2U
zkn*ID^1?V6<GwkjA&1M8=4zU{g=NhTolnQ9DR?IMj3#Yh&n4+DG7(emZ0hZU;*BhZ
zoh_brdle|K^*Cpv(tw5(3~(S_O`RQJSTn!6qV1Przs{Uc&O?E%5t?@+w+LvvjW3tk
z(~|ip!aWAV5k*;L`=`tHfs)XZyaF==Mx`5JPY*Z-MRfuRF#|ips1N~*ljpb682ZwS
zOt@Bd4fCZ%@KzkBT{)DNYQ&@LRO?qu2;^*gd;G8s+LIXV%$lB`iuCQ0>}qmVmoikF
z{AyE-Fhpli@2i?DqYN<O*$DBRwL8fD<a_%%mXb6i1%yHlwjxHzI!tl{O_AD8qZtYU
zW>rZhm4w}QL*i<NfI2n#TCD|cxmsE>#I18N^<j8s0jlU8^4(U$5K&x^Nr$djs$!kB
zymgSDE_{7`4C_B_{RH6y9|4wnA+^R&MK^_s8fDujZKbblM~^zobk}_$;y+kAszGJu
zEfbU2PQzHX8D55A%;h6N)26-9wUtMe7y7aKY`2*Jwf+3LCnphTN|uzO>2WCoc_$N&
zk1oHo-Ji%f0@CeGvas#An!bPg5iMSbl2z?`N_*qsiF$5(a1|RpWnZnP*l1~}T;Gva
ziGQu&I&)$*QTo?Tb4N8!GaLJ%{HLzhpVQuqz1M-o5XGs0rb8&ZD9`_)qI+9D3ugb*
z5b>P7`(<K>0~EtivYv^nnl{|V_si{xTATH&y%y)U8S$YLv8xj8AF1^*a;zn>o1Pl*
ztEn9$wb-ZVZUz~v;i#am@Twk7WhM<YmOthLWy`S8wS?i52cUg>hrZ~f_yp%1?8f2x
zCoJTF2XmJ=85h<ILAQNdl~1gTYhsY(K5ZlV43kx@Qzkp~$D8(QDaMydc!nP__APgj
zcX8He!#&y5keL#nydT7aj_Q>&<WyAeYsy&QIi2i~wgh`&R`I(=2ACKv*!QHUv~vF;
zJIVlgLqOn4*x(!;tpc`)7bm%>kbT1jvMc|<Ta#4vQ~BH{tmK9ulrgjhuPR?C6xM`{
zak=v<ftzxDTF~vl^JFTGhJ98)PTRRVxdgQ|Dt_6wWuY-&Y*_rsO`b-+*aIzG^ui#4
zxKTlpzvzd+s>?<CBu`hz>+L0s90hJB>JdC<ygX#f@~qZY<#-gc(<V{|Yj~LMqvDN$
zxG5GTu;4&$4Xo^&CrSO#b^0r<pI4j{&9O?Ht`ZT%1^L3K#P|7@lbo_6I`S62?Gm+C
zwDt7bUPiAS9sINKTCh3xV!Ntb{UQmZ{YCpQ_6+Q#jhEERn6$}pPUnngSAL<a1tq%g
zdKmn?9>2pWD~#OvIytSileZ}1;HDBqol;KD-*;H+Z23GN<&dhb_^8Ma1=oy3c8o6S
z_D!Ito8w>gt_2YKu~0;dnecjqv-Vf_7Vds#%?zZXLte(DaH@lR$KY7TX<3I?o^%={
zQcIcIeVQ^WX#7Uz4B?>Hr9H10rWfRgc1K*bNiES$>8=zLkPkSXfU@Z$GmexshmPaW
zU<W_Yy&(Uc_IvyIZ>Cn~d{*wx4hxwazF<He>N2>Kj-^dkjY#fK;M4gX=O7_7_fC7?
z-IxUy3&2^dGEmpXICjYU_~Ul!Jo^z|BKcy9u7CyoB2jbC)K!5jbxY|h>-hBEOS=}t
zl;U+(&A+ORtAqvcC7ciu?&bRqZrfhoxlc&X7%s5Ow0{_4Bwox_*?Ahg<x^t=Z%VcW
zXky=FdeAb<6S8Off}UNl5&GFxwo~WrM2xhZ<efF?7Ogb8A*f`_<aF7qI{yH?9m?N;
zRW$4tf0&%xg3KG-*ME22-5U`<c^GrZU8zBqvMj6^%Bj_9;p{T>mr;1tI88lz?LNSh
z()-@F;>}M7!If#ZtbL+dLXePt!5I?ih}_1-S_<#8Q`@65u;U+E)-)xH%6mLO+^S;r
zw%peNV}Pg9DbR*lgY$P%{t1k?I`+r3KeAUK+(JML&WvD~>Y7W0nfi#Ucm|8F&T7Nt
zKDDL1FWjcG@m32={2>#Kd_bJfoLp{Ntg$OAGGat+FEWZ#X8MJl)Ea|H@nlZdS93*m
zC&&QXA&uETpD)XStU~i<>_y3>sJ{pw(wpYPx&>>1kp--w;7GKuu6%QbNE?jSCgHAz
zn5R5HF+U#J#`*qz9intiI)X<*x9St#<RP8jHs^=w+LZZvE6do5unP5?rO_o8g*K0l
z{7mHgu)Ozucyu;mUD?839BU9265M5Vj9m2GttS0+s9mH`fZs(;SjdaHf>r73hAUi!
zJvV26Ul#uk9Ovm)(A_hCLa{oXIaAOYY$={irUTS@m4{uB{Xq^g+xcWLqqa)TF1rAW
zzDD0m6&#D%Q4Cn{n?Ffx+p3}EMt=<-XZk;A>c0=X0N^c-2Th&#{{u~(gA0L{zQPNj
zZUMY4KIJd~xdj+hQ3OQ*yeNR=1Zdd+O$y*V0d%dOK2!i#3vfdMxLSY+4Unq<EEj;&
z0_1jpy(LBAD2ZkIi=xHt^PJyLRKQ<EBvANy5J2F%_o0#r0eq<L`B|t&0KMyPiWY$1
zVmFKc+_L`oP+9#Wi`zv4{#pO{Q2n830kZf{iq=1lQ};ep(c$+#RH-3=GZlc)0w`2~
z^Af<N0;pL4+UqAW>!&0R(7ga;m4I{zU_Ax6HUYG(pX{o8LKe2U1d9jY2PH*l4Y)Z0
z4pRVe>mI2ksYB}mP_O`%8*s}4^lAWv1yHa6(iDK>0&rpgb?Tmc1-MBG|3$u%4FP0u
zeudDVo>Kn{@|DTIlCOT+N;w0>uzOo6w@AS13V>PN+e!sS0H#{^wo>5{fV&v5_W>YZ
z0aj9g<o<t!rhUKrLy7cXHSNO%T}e%t6Ko4*<Z0M|0wx7tEXbE=QRMV0{s!S<_~Np`
z<6@P_*|6HAK3dwL12VOh0d2DuxAp=Krt+7rDSBSn{FmPx^)3d7_^M6QZ>&B?+Mqn+
zSv{Ov1xyhWBVpluyE-O28dt>t{g|_X;Y#6z`=$de(kbCgcUR-&l`U@{@;f;E9Nlsl
zy@(!NK3twPBipCAR>jm<d(%O_>^{|t`n??M>%=1;+HpV}Ak!4^pumx@mr1?Qig`EF
zn*i#jlgf50PJ@^bz-4BScrQ1keNWg<GL~5f*i`rak+DAFGXIG}R`O1ZkS#s7L~6mb
z>}BTTQj#YEu6FkAiC?D;hjqsmVg9)$x4??I9=t@qKg&dg<GSzk5?)+d`kXogtQCJ_
zNu5P9cD2?bV|{^6pBpt`o1W3Gt#4LA{U%**e6C|jU0v%bXD7V4!B^&!d=t4KPLPNL
z&Upjkx8$XB50D4o;#5BrQe$o}v{bBCnuS!&nTiCG#c@_U4{ajfU+92?i-bmn(}#aj
zl>Skz%l`ji?k(f0>bm}4y1S*jyQE9HyBnlIdXv)92+|-DDh+}(o9^yrBPE~$8<bA}
z3%%~k>$#u%IiGXhJpY656xW(_t}(}$bN<Hsj_(3HD=g>pucpDCHS<TN2!j9RY3{`Q
z3}}U-vZ}q_-#=@!nYNhP-n2p&#%MCxyb@IV@#sn%0tGMKj@!G~@`I_RsGkg7<usQx
z)LAv2!&jGm(KJw~q*#R@0v+Gx{9^Ard$P6}Hmaf-U2>tx+x<-#SJk+d$j}J2u2RXR
z1)61(kgLefaF@5y+l?I_g7yYm0xyV3idst^OvFX*?==?8v7rk|Oj5hcL2-eG?{a?e
zAdZZEZueMpJspqz?WQx2hgs#+VD@`Zg<Cy(QfXjjar%Ce0G&DBSNd9hLf1~>HvWw&
zE}R&LFdAR2fbA{(FdZ*tL6C<*XK>#7?^Z$&PsbMO?F1`WTrFOc80MbpyF0`VufN5;
zPly+DXX$^p@hm{&xOQV_W40R{L4}x)B0<W{XGq&jg*0$V{M>1_&oEnfl(Q;U#fz99
zB>fUxkiV=p333hzP(c^~n-F3cZkBOJC9^5{e0?6kp@rs6{h|gCuA{p(;6L2cU0!T}
zA}r8fL}_h8m1ca)_c_7VALR>L&~v~AgJx5c2ZiI4pwwr!v3bU|z6-K*%KOSztdi;I
zh@hF6Pq=+O*3KRxDNB<G`Ir*KZFslzmv^BSPArX_!t-VaE@tf%KaAg0uzcE#-{o|G
zhEsy1CF^qE9GUuCfVVz(<z#;A%XR7}b@gfC9c+fmmu@*5RGYT^=<K%X-UqTpeqxzp
zzCpQXrfwV)v>&QcYdv)Tyrv7&lnO4xA7AU<h1ODn;P1wenofcYw3Y=Jgc{+Q44T<u
zjXlKGh(>hj+Q-twE8J<V-dLcTqeu|m+DKV@Tu63L!a>%Eh3M)nV)eoFxcR)v=ftZf
z^UJ$#*bhbnUA-G~^Xsr_WcLz#rhI5L{M|_9KFAVMTSTWaoz+|s#S1Y$$6w6*2EITn
zD@dkNk@Og}8pNZkB_Pf(k~qzpNWus!pRSP0VuUWx`+66dg5)f{9{+0=Uev5zP3)Ag
z@=oQa2Ymb}t&SjiA`xw=i_fG|+2%`HDABV;QGTSJFA;2fi3D=_NQE4kj{j2l94H|d
zp%9?}x3{Ozte3a881nf2svt<^U*G$Q$(tie)9z}4#Nx9fb&RSkTWb~)d=S2C>!33e
zS!f??CJHJm^OA9q@J~V%sHUkd9zdkJwty#AqKf%6w~;5fY_bWJH<$9dkO$mQASC!*
z{xZh|2zqiKD&o&jT}>45G`8ba6<@dR70<joM%C0o`aJA2W6EO{STE%q4_57WFIl9o
zY`fH$<_&?n-{u(QQc?TrmCTrLe!wj_u+@27yL?%j;O+Qh1qMxG>qbT_=aXOUk=xQ+
za$y3in%~tW#C!Ep=wFltvhUy3`y~qQqSGZ<eidA)aX(yXaGn{Y$FFN8u_K`ak7(a>
zXwDz%8t;{mxCX00C`d_)XE-t2R{oy(=TjMbqG6}?Co2lbZF)|W)5$4vty${t&6xD-
zi@3ktk?$gyl_|?@hUDq3x^ZBG^jb)skuOp(+<8j5)PCVZg&%9&3pai=@{-pSG#eg_
zFXv2>p0uNyJEBd#0I4cy5nbAb+5o2F(Sc91`7^)+aG0`+hLmZVFGrbtd8g7EYR<X)
z;~D|1FzrozuiAR-&ISAr(iI8Hw))7)<Pp475%+*H$AdP0uSD?O9q0y6$fvr+q^Jcw
z0217mzZ{?Y`p8hM9D$0ez#f5)R{p1aX>d|Q{v+x59^M+h`Hu$t(Vg*TPuS;aX4GBd
z90+X=J`|1Dj!~VH3BO%Z6+72xPHmT~Sjd2`4sT)2w>zc~mk5H`900Mp`G(=S-JM#~
zz|2cz)d1t%WkaWwSVQr%wCDg&VN?V8gC&0jjZ>wgQ=OO5SH}+Hp3v(ZME5;O@DO4N
zJ_y@mTI4&dK?&hO9KY8Ji~U~FduKmO<nr9{HBNp|bReXCZt`GYS2QHPKfbC!%eb(?
zaqAu7{f;^1qk>tx5gkSA=A0#*`}-Td$|In3%fQGu0fFm%nJDZs{X+U}_ds6fk=w3h
z5W&dL%kr!W(&*U!qL18)uO+wyT%bq~K4}g6Ci`yJcTdzc&61uj-6@9L*%cV{SQ1H;
zs%FX3xThaj5i_u3YUsms2mP{9*u2VL-;$8os-@xT%ai!Xk>$tV8v1~mE2=)dtHfJ9
zE}<c1*VZ)ISH1b7x*vzFUGlO#eCld^P3j@Q1=i*-+c%1?PYZuz935iIPZZM)+f%-;
zEQUx*(WK$3PRBeZUKl?3acGHdq~1>gHL|WAuIbGqVD1FU)Hb%`MMqPbek`rhqii~Q
zBYNhqR8)71_9r51JoE3M3nVqMdkMow82>zlQ@>{p=D6{r1w|z>-S>3aEd)7yo2|!g
zheBuq@9NKQ=W>qNrNRC~<sYR>A$O@^qpCVh(gDkIE6R(0!x_$=kot-}zde=cuQhe2
zt$!SN1IHvN2jtpia%iP)yITSa{gQwVKM3FWBEyln|82M-3KMgHf9SlNJrCnvtPt+h
z$2uf@1*A5)lv~<p@g}&#NnGQ%bWdx(9}~vY9_b7si3cdsP*i-dUA=nf3g&6E=-T8#
z@M_)>zZ_e=0vY1RVI8bxM>R1*-SE^mDX5KTu$V^qq+Jv%^l;pb%CBE@(aha>4cj9@
zy7!Vw;~Yz@Ays!UZGmjXtDkp!i_YI#8y7NDUCmf6C4c;;`vLgm4^sm1Zmgqi=L)(B
z>l=ohnIUV$@idPdb0{hP6|ZaGpz>OnB}#u4nuz!SKp7A~kLq=vj$I6TN4x?>(4~%A
ze!&wr{w~%${pZX5Nvr-M84t-g6OGeI%%*AK@!O5ilia^w;ug?>AALW<%iW`HCCR=x
ze_p<T9m3&GwMgf&MIlsFSvZcKkyV4TlBEuDnE*M@)LGN|?|CKmR@X6e*2<w#8An;X
z(w3^HC)T}Q?z7e^6gIzNx48B>8|@cZySk?U{PkZ8r{JK`lRQ+5y3xh@gdC0T@2m{Z
z6}m__J3O_<iH7}yu^qN6=)%Xa58pXLEw*%<DBYhdj2VZ%Q#SL~=!&^vb7lTe$awX7
zLdTj(R|vIjK9!t@fmhdkg!nJ>A_A5^@h22fQ>9LU>2WW`AZ1g~FPv5G)5`ReG!!pV
z7ATB%^$RiiVrUgc$vLU6KB81cIXd^FUkv6Y70X8omol3nDk%|5)G#lc-iDs*?2_AI
zGl<&W+Dbi&WBY6QxB3JK=6Oe~Ddpep>I02-3`7aO_D@S8Uv`r4(8q;35}?y@NavQu
z_r|DjtjZRe)+x(n5YqG)^}ep*tDHEXjryARe)P;tywy#EeXB(`jaigl@1PTRsr-x#
z-gmn$ME<X^c@C^Xi1xt4Ii*+$BF6$%%{X(<OL}O6JPF;y`r+0}5DiM->aZ|o=eV_3
z1h}s}OZQ=%+v?#(XkKCtR0QnKyU|y%hZdG{x|A&7z=RAMRT~(=g%Cn<E9Pf!IeWD0
z_RGTVen{5o=o#N}m>Vq@iMVqoAKENr7W7$`*3%CWIFz4UthYfUS591hJ{3X=;x{5u
z#T!87>%T)qLZ_LPRG<1@wNVnLR$OZsFEmdxw>eKua7TN2xN#KDg%m=1>jX@cU$Ghy
zSTZjKJr*!|vTn+T#ojL6mt?6sGgX>Mjjy9;I<Kvv=P~+J=#6Rj%C!<Z#)XA^ob!cd
z-;_q6dZ3<efQdYU-9)}*$h}5*2+F-!Gu`nr7+944Yh|U-D7Ie3@v{D7nt4^00jfB%
z!YZo#(|THEg8}`K^mJoA%yd$d7TJ0)O(Pk7j>>t#VzVvNC2WQ{3VVX}nPcW)B)Jgs
zjp2%bK#-JmwsmdipUH>RbQffhfddAX74HctUyDXFjhni@c)V#qfnc(&g5LJbBJEW|
zxszKf%kkm;*{Qx0?tIy+D50PIG5w5&W|8TfLB0i_X5u<AB&c2k3BUw5@oMM9u(=6&
zzP*eU@&X{xW6&hvNmeHhUhIJdJ^+BjHNtm!2;0Xs+}@!F+L#FJ`)`a$4lqN0GEC^F
z<QfDSV#Utsl7Ql<U#gaoNr)%9zm}Agk*wtq`axe{%=Ox8Aenik?P-bsnewr$J8=JS
ze@nz#+ydLWIPYhbR4Dk5dwkL~7}PZSE{k02sg<eefJHH3W7z=no44<Tx=9|J=(Tz@
zE5YMcq`;B+@~Hb~ak=r`MR9dznTTdBF&1&ENa+*U$Gu+M8fIHzJJoTl6`II=m#Omd
z*$7)g>fxU+gYD+uk^3=UnbG%<*kH!PB{N%Vlrr(G(YeW{zKp5VXM~V{=vJGma8#-E
z<G_oPVGR$1@yY`5GYW-ee7hfB&CSZOykoMQk^Vy4Y}w}u@N`uPvWs@|9q-ougp*0&
z9c-!AuVT#tV;1C#nDkju^l8`AcjT<g*jAF?4;5w*S2jq^xZ34(MaQ7{mRHTAT$JdY
zlC1JTZ)K}@x6)aW98zDIR_M*&KZ@Iuw=yj}cX$13&vVLmGncUkR%%pc#5x2LX|_+E
z%%0COkOXuy5YAUT{lQ9S*ib*9-Nc%CvOvsYT|7*mqY#g@scuqoqa%*Cvlxdx*^U#M
zSKcLWa_B$eGRufJsZI{IBXC;8(6{-sZP^BvvE?kOs_cYY)s|`kl!m^R$`usf0}u#6
zeR0Jz!e(WJ{6Q()i6auYv_`egkZw{??N4QUt<PJ}X+IbmELh;-_hgAW*-zNx{}B09
z7b*B>qblCIb5;Ef%9!2kENN<noA5E|G#pkSj*3M87DTW=t#wy0SL02T-ex0Q)QsP2
zRbFFS9D@dBo||EOqTsQ&wNr6||DEc`39b(dqK(h#%3{ymUVBmwcrXW?`fGdrEcL2d
zHSSd`c02AfGd3)!-u}Ecb&f-<LEcOlu4zl{BqBbG3N25tdr80bE_1n1kP#o@{`V(|
zhS-m3pc3L692R-+Gnb4UyuK~P6n$euPcz-<_{&J$!D4mx87UDv0Yt4fo&w0|#>cx3
zg4ijN7h)O?Ha_$MBc6)QUL8bl9XLGnCo}vti}fJEyxdiBrp=kF+~Op7#?gWoM%C+D
z$JxN@{$Bw|eClLP&A9gD+4te6{vW^cL*_+78oa^_1kiiEC&su}5HMqgI^ru9w5ih_
zSZ~MQZHUAvZOPP!muUy;-;6cAto&@!Vt380x2U%B(BmAi*Z5lSuc26fbF#*94S7bx
zANW1d`BqQuN4>r|M>Xq<?oe&VZXbeCc#uf(j0}0WiVCq=v(uvfkE)tpvtG~5Q|s8P
zSjYg!>;89^Q9Km-TMMaIbAJ}}U4R9ejO`fd#NdO8M2mFZ60|hWwz4*5DW3>U>t}rS
zMS%0EJ$I1LFlab6Pj~;kSBi$!BckWtoG9bbnLzdQE3N5pc>D1B!k<TO?Cyc{1mM7N
zaO&*NFBgd_NN&XI(w(a4#21!nHIbR$e8D2hyejJ;zfyY4z#PVnnMAQyAHy6c)a-=*
zcx7}J+M_;CuGU8}Pew>S|8w~3KOX%Bcyt2;E2F=W^4RcG@vh^?6a_d>ndDlF31}f6
zgIcQJV$gz_QfSwwhq1W|2OCAb5WJwvu+OFieM9UvV`D6**$h0h3Q(aQ3iiX08OA{T
zJXh$aRfzb^!@0)!0WcWG6QzvpX8XFTwXsaZGzVl?>ZF?F;`Q(iKhFCoh)#naoji8|
zwk4WlTM_uj;2W!@fX4~q-#A~r6Mp_F1&(1sr~9>|8Wa5=n^?OKYWhj_Im{8ZSoGqf
z^|K+__aYwAG&^^J$8N@vZ5eqSxvCe(xN){qXrEPZ^rbe^xjRcSC3Lp$;EUqA3VWWT
z&IAX9wqECD*^q7;(7TP!ML2qN!S(!!BW@ubs}|fDcshgxnGq`{iK-50#ANoX)=#GB
zn6JC=0t$5k5@048`;G}^=SIjIPRe$KHCZ+^0(p`GT{xckJ&lb<{!*F$v2jAm@>;;P
zbUZmA;2&od=YWCKvlTaFVj=4}DkwAcvZ~kTRX2GyYbgW|_Aq}L$dc=FCHdacg@vCH
zBe$U&beKbmd&lYXp*>^dQ;U7UJ(})9w>if)gB|JD_K?^={(F7(N00&HaH<pgVVn{h
zCsKXSPBwvUyy_Q3;#I>EJ%8VpPxPSR5KHo#o&wBgejk1M&R|6smqU7-C@T42Lpm|U
z2M4Lck`wcG^_$FDm(Lc6g=IQlk8~G*NdE@;V~$b4QoSLeKSv)U&C)N>ql|DawpDA)
zN++0Be|8%_V^LGpArW&|m*Z$Neq~BRbg^*!`TGkb^UaBSe0`D4KDudkp5VnD?+gzg
z$IuFw6*6)gmnP2~jzuhT)lahTzXbpBw2Q#@J0*4)xnV5ZY_w2>$lWDfzq!i%%OsA<
z9eslNvPcn8V8a`#{kZ(3_$0y%@h>R*?eL#IPLMbc6|1!QrVA&$t<}4zhs)sV_sMdY
znDJ)BjrYh(e2!(|38&uiuYLYAuze%sknPM?FVqy>NRndCI@o%44B_XQnqw{cz2Id~
z!O=R(!N{0XY3x+vYeBDF=Mf`y_ivKO=bPT_O0|x;FwxMjx~`--lF<9h#c&^F{fzC3
zEpcB|;;F#%F0b8a>B?2=+~<D`IQZ%4$y)u+_l|}^XJZe3YSH>|uUMFCY;y31SvPU`
zNw)>!5k|6hE{`Nnm-o<~0|-H+*5nP-vIZPMCF+Wi@CP~)GhD}f(Qvaa{jR+Dm<k8U
zOhbq<bmK^Zs9)cE*62^TwK%+TYtkpD%H_|M9j~4-J{%|ap~nv)y0zPwpN!Cveq<8a
zolG{<eNWq7JuoX1gHSiVE_Qd2Qx2vqt3G&NcAkimYGd4eCyT($mhFBftI>vop*6bq
zqT%i2PZPGJ$Dr{wuV3yo-!FF()VpU+by&}qgaF;NkR&$o&Y-`gy*vxm4-#jtvh+y5
z<4zDrh&7K<TT+xRZG$5Sa+<}$e5>Jn!*lZ4W6MzhKfb@ey1<8-4A-Ah=6pc+$J!sG
zn+Fc~M7IgqjCov(efg6u`{<<ODyK`DXhM6FX1~tCbf#$vIK$bTrh(Lx1vjx4HRWlp
ztJvlgks--_>Z4wjx|3@CGqZ0TbskZ}^)8*LD5S|Ui2UOO_U6RweGrsY)ZAoy%d~(+
zm0U#OyJ<G_@QrE`R&AT;hRN1bR$;;j65F*UWL;EqRj$PXv4BGO@N*XuSYlp=LKK$t
z0ps(fk!uz84Tm@SB~_u54dS}um-S+bf9x6b%&+4{@>+20-G5NF{&g`_kcUt3U&<CQ
z_y2;jCB%=$3^2TYVcjBd&ckp|K#zX-kp8B*9oRGejdI&E;QJfmHm@Z0|4eZE5BN5K
z-S%I>ZCOlDQyJ`280-`298dg7&VmSIXq;ZqIE7I;hf+EJ2DSZ7X>)(%wrgt2`9Cq*
z06^P+rL#$++DoC@Nub*OcP<+MWiw?#*JVQ2W<=MdM^~psS0zQ4dW0@Pj4n!qE_@M%
z^<OA#0D=wRuN^utTqU3agtouoYyXA3=0x`|?3y{pzfso!-r9n)<eZ}PwEUAvS^04p
zg;6P`Aqka13Dtiit^JRTwFkgj2BTd%qg^t+LlV71Jgs9at>fQhwcl8^e=^k^h}`}o
zP3=FT)VNLEfRQzIGv+XLGyHde+5<fe1_mArh1Jv(#gzHK!_#14kYQku{_i8y9#r6e
z)7J9rGszVmMafP04OborAT2Z3@MW;msq&Iwkl+Y&SbE}QGjOQX)Fd)&r_b4Rkwl;(
z;kL`dhUX8qfF|_I0$6=CK+h(}f+bv!PE#iQ)%Di=*S~#R<AZzB+n@wZ^z>8S`Wf)$
zr-=0>%_Xi-!0DIi{cepe%#EiTdmF?X1{*ZTqQ^)8AkDW1xWswqc1+o80V5g2w?qfR
z9$q6!1dH+8o7qj8IZmG>PbBkP_$n%aeLxi4P$;q_q9ptWm=AEBNPE&sWa(AFPcTf-
z)G_GT{8*hDBn1r}Fr&<=<2$H^5#*jJ<57Dx$Mgg^c8rHzYbR(UZ^PrZwt#m-dIlE)
zr?}|qU;=jE?1?hz4#D_|bgC5QiToMM0isqUENTx$>LMo5dI8R4d<0ch+w~gsJec2T
z*f{HwXLsg$@vS5H<~$hX7W<a?_!Znb_GhdiimB%K!iWFJuBZJrg}&?+rygWEXKWAJ
z)Rkd#1cNaZ5*|;?W&W<Q^O4_h-_xZLie%9O4`hD(z4bgUZkdE)+oed^{4P4A)+c7W
z`|Ha&m1%WAd)$x{MSE*lJs-b>>Pzo*q41W=Jq^oNYr6>z=G=hoYJXz^CxO>>PtkO>
zj`j)h9(JnL26w=7%p`SqZQS#*{I*-hu8ZTA;Kv^V;M;!q-aWUHMv})x=5PmInvcVC
zVJ;e<!G^$uAcY_*Mudc!V79f{cFI5}MjyU{62Cohe_nJEkGvWR1`%;J*w3RI6S@fd
zg5xouUM)2j^a;RoT_qDZ<FvqgBJ)E-cU?lKO`AoL%Ms)=(+6wfq*}cY&G%Twf~-dK
z(0$)BAHReVT~l3)#thOvcip%EJ{IH=KU6-aF23&5nIw006;7jFD)?45P290tol?VC
zlN$dbapUs)_MlPmG<`@B&&p0xGX%B;o)m<YQ>P_=vR&=zM3Bf+CH2^)3cP{prf;uL
zeF64QAS+XmYa;Pe0v}ut{~G4UvAZrg!k(Gg#Bz1-)}EqxQ{s>i+X=cX4{zJRou^X~
z4B;hWV@T1yy=V)|bh(_a1Kz^t01<YWu;Z14+HrAXi9&&13?jJr*x_f2iyQZ$Cghs>
zu||l>1}Vh+ZjzK&qlD*TDNwo3z4u&^-^D18hdZlTtn7l?(uq3Y*=d)m-Tt%UkKsdR
zIa)9+Ds&*PL(cZO@wos6F{q2jCO*&vaq;JR#d1Lw&!^x!6;7~#VYQ!XMlTS~wJU_A
z6yb-oSOp4kOf|l9IhfgkhrOhEmMTgOLP`Y7c=?hNIk(r<f8*4#JY}f23G>B{sCDMZ
zx#h5uXp;uU88#720esG`wF0s@EX0hS#<b?f5>R`$-O(M7U-a+Z9u^2YGw+VA6*$KY
zK&}wfiR@9s64tcONmC^*%YOgLS;&NM$DC1|8LlBKpE8kI`bE@631FoYa@%gm<3^c9
zaGnP1X5wLubm_QY-yJrN5E?rMwiw8xxbmSqY3MgP(3-<&Uh{h{|F2!l@8wxU#2#5M
zzprHeTrKEnK-E(55^^?Wwgddr3oa3vN4(FBq(5_ZF$4Lg$>3}DHn2I$m|~(s(3mdv
z2rcL=1$;fUb_;gi9g>RST+{nV!Y3>b#rQR3+{$zyzy~Bo*wMt5tA3qi<F=hH(T0i*
zttoDEChS&PokP;~@5bH^F(4&QzXu1vad;BTKwk}+h1QF-toncwxxeV?t8#F&Y5`-1
zNK%{vhVk69`UK(7wtVOZ9LDUB8BEJbO)hj|r`GtT^nO^%*J{i#&plcY><h=woS~4G
zu~4vGQSX#{7!4?OC@)%?(sNH5O0>4NOn)dpSb!Qf9#sYDPZrHAWpBw<1Eptl&S&U%
z>>@09?Hx)F=S4vJN#s+&B%XVPfgt3QFRUU+I?weofWIK7EmwmU4dq$ELh@o$$SC$+
zc~fgXG##ZSm!4S#N;F}{LegkDGwsnhK359m<j@3ud#!vRk9d4p&f-XU)4l8cX&D(6
za!LJCj#SI4G*ql|mj*=n*)42QG#C9wJgulV@g<*snMXB8m}h1*#6MY-c-*K8R90C~
z6ljgGZ8JLizFh2*chAKj{?q%8&lB+v)+L4nJV9{njvCv-n_MyT(KwPkGE@d`X994_
z+ng`MkRN)<g#cpObbbG2iHd^{&fmiq4I~lfX#m^el_FXoTye(9#-<+OZ2ej=O?&%|
zX7=>A4QJc-_-I$RiIFvW&&)m>HE0avETA1s`kJ?`%Y7uQY57aDXd3C8u4A8fK}IQ$
zNLr$n37}$dDk}pafE$AwGD}DnXdz=r0h^f~WuZ?ZgAg~O1tprL-c;j|Am?&$B2j*`
zcXeAD$wO{I-$-QuwYy&gyAw9g0xU4mgArnj({qjUO|tuNNDa84D;cbE-<S(Y{5%mo
zkQcvuU|I<Rh3<u|if>%BMGSX0Oh4D_SivWG!!`6C>((gKycr!e4XpZkg2o^hqDBj9
zH#@3ESm!gf+SnNx89_U;%t?dWP6H67BCICq@$qXOd$`OXy<{*2t7EDta?Ac<07zH}
z^*nqPqpj~Kn;a#PFoU$Cs~IUWF1~7{U+yW0=9j&3l7ghX^!Ls5^`~aNx<TDu7;UEJ
z=H_+|+}b20jXlliX{}mswzi~pwu*jeFX~${0`CAG51&(aQuiqsS&U3<bY~TYikF{+
z1p}k;9TcW}i#CU_W2;CKIs>=E83#GUxu6FXpiqM>r}#kYaFYn@2$S5$o?c#FsfFEL
zmQmfo39GRAZ>&9VU1hJ#?X`s2wpNOu#^@$3C)6OUx2!{eG0U-tfCf$dMEr6_7rO@r
z29P2m(~(W|8k?JEU1gVN?cC@_E*RslhR|AaWufHqzgift?F~(8Io5N3<i~o6wy`ra
zGlLg_fH=T-qsPvvAL=SA_n0Hd{#Avo9K?|9pKay&Tx}1{Lf3$`fV1E~_6!aV&XfLu
z*%gf80^&MZ2H0aIbw%1{S|8pif}QDHb~qy;!U*ESW_T_8FTqR^lM$0)OeB8(2TQd!
z7<dFEDhKkw38JUvV~%hmE&tA<pGH=QBfw<yLJ4>UruST=0%;)R!{)=ignfyWkHDn<
zTIf4{*CzsBF2SW35!5Xsts~*m0G{a=Qj2+9zh0(>m&O26`dm#6CBavXc^RP)ei5b+
z_9PmM;+p%Ccf<EFRs0HibGK_9?Me3X<;lRTom?GU1Yr4qx4_o2@mvf84~7%NR(n#x
zcEaAGI#V85lHEIpCSJ5>@2{l|!Ur^dN=Fzm!)Q6d5nu#qedd%kfJ$IqHe9~7#J=RQ
zw4|0;vbch?+|D!dAhXnW4_SDFd)y|_@M&?YRd~8p3J5yHMT)c_n$OjXP)cM8SW4I|
z91M*6$m%#QwsW|1h^v0u%Hdbg`vDCk)k2P0i(+trRLkfSs3~v5Fffner$35HH1)PG
zy@Vwqc9HzfG)Jb2FY%-I1mU11A0Y^ux;NY`;Jm8w=E4a?iSKHdCW`Gz+-t82{gDiQ
z)3Pn!w+#y)Axf-@dH%lU*(iUvRhSPY!N%zKY8bIVmnK#*hJO9_3u3iR2ehzkqADrC
zcYtB!NL$dUL3bX5v(^|1lW;`1klu|9LEgwircVQWaAF$1@0ZJK7^0XMC%kplF5#H2
zkL(Op_tSvSxA#hr5mfL_4T^;2O;98N6gEvC8#(z8yU>57Qt}E3aR0pv<@sOOg#vX{
znSm@ofGPx}ECM--0H<hflk~qsihv}>&UO0#5mE#sK>p?w#m~#f%qsw?m=UuoVY8}0
zHs=4tDKZ+g1&W*gCKUY>PxKp11k@T8YVrMzBm!!w{*`qJz=(clUH*m<fq+cJ4<V+^
zfk{9mQ6T;CFBlP!by*VmSM5>&MwI;<MpPCKkcfU`hyWnc$`;A^2F1t*<=_UDpmD<g
z$Q>$Lc?_g&0@;^9+0)D=iR6VRi3_qX=9GX0Oiq_1AO{oR4h79<0C|spmnHqf9r|Zo
z(!YsA0Qcyx>ZDz6KpE7(Swp`;Ll5;wfAfU^MiZ}fB9O}pl!@hXN(53xIoy(fTC;54
zNkBsE?-b1H5FkhNuN2Jk@IP>&<OCqU6v!Y2@=k%WqYsIg1=0W4cZxjR563G1wpCoa
zyLqZ-gyfzuGIz`|R;!sp9j4`uf@Z@@Z&5d6t~&jW`~?!ZKbtuz35jD*@i2x8-N#!K
zFm&=O*ln`q#r`*g^D~HK(1(*X`wtCo_C5uExDlHSST@MRc!NcW?uJ1Q7WdoDwtoX;
zM@QJ7d#D_nx^o_Xy$XH}=%lyk=)`bm*QeU<HxiskAS9LoL|1V_2*G9FYqIdc2qw7V
z8~s@R$?9DA1qj(|6eyaT$#FkLcVI+5W_8PMj&lcIo46lnLuK$2xv2nTO%Ni^b796k
zd2oIsI^Rh;6)6;Wf74wh&F=3R)?W$c(cFOa)P-qah<8ML4lZpQgd*iz#0=&*-aJK)
zC%MrKl_SSxPkc`YVyGYKjTqfsU4&bIE+{oeg}nK71;+IVwe%}Eyy-V8#A_YV%KFXn
z_&MmHknj51iHad6cFb-q5&ba&d4Xfxr#8)Qlo5)R(rK?7sa$Qn1>O5gnSN9!1h`m|
ziV%`plVt3lgh8Bs45eFj!+MrA8n?0|CgHOs8u|AD#|<!H>sTF+a8`dMzPB8O``hKO
zdxi}93RHx`uVY@;<wunFt&#9^^}~dBgVNbYu(r4$dg>K*H+X?wVl1v>E?3%Pts>vA
zHaa%Ovia<vb2Kw0a|Spcmv!+V#TQ08U?W;!-SZ3ie48r+Az{&=yBex?`Hug(lnDWK
zi`8+tv~=ER9eZ|JXWZFu=wON0X;#75t+#chjWCMG*WuZ{vN>zF&9iWzjYo+Rl*SSE
zF-?C;9yXzOs*N)+aT|bh&%OJRg&O5XwF~e3CQ^!?I%<Ma6kybd!qwAg#+=W?fPdW-
z0tWG9>{AC&mVFj>lB6KuTI+;}l|+hW;xIzBAiT|PYBvcnT3NpZzcM9T-gJ0$v)Z~s
zdJnB#vkb;=J`!f#yd&u9$6A;^**Ayu2~zFrTo@2g;=Jpib-x;{F2wkLFL^F6BpOKR
zN8jy0-_6EsTw8xsPA%xN*jR4Zc*G=hm?3~zzT9HGYw@GC`Gl&!Vgin}{>Xxz9f}rB
zz+g*3d@bFDCx;uA9b+Cvaj4P>!bjCD(%a0^q9RXOB;fARf$PM*%*6YBjVt&9$=|LM
z=S$*T5$LeKz+1Cpj>F8+<yxkIPE-@lcMz7ap^Ynh&Ew1SLOKE9`~@ho%D+*Glotk5
z(%=wMF4~xMBgZ8~BmNS|#dR{^>9(S^>mZ=d;U03Gn4Lrn!MnVO|BdSS^@)g^AnSMZ
zrTUkyF7nA5H<HeoK?mN_Hc3}e=4xM$*4_&s%Y=h>O><0TU=+5Okcls21xo}rzG(Pq
zyKr0P?L};J!VG+BN*>x25%BrE{Q(YvvCHo!JOw@fbHQ_l-}hH;IJ4}}-via%*HKT;
z>SeHhT1&Al_(gCJ#z-M<TU#0$@^7u;-wd^=>y&@Zh-lHul0!pwSbqTEOMFcJIWcl7
znmKr>8Helew!L&IANnpdXX@NCR1}vgY1y%SmRFT`A3uyws1PyJ@7E0oDA@ANvS=e@
zJ(#+H(DvoiEwt?(=Te&GpQ8vi41>PZ_;^Mu$6N+!lP$7?Ed<5Of%SS(Q4Zug8gplN
zus)yheRadl%nKB5I?kfdYplhei>O!f$TQ7XbHs|{yW}0Lmz)=PUayD!Mt%L7R7cC6
zA@*4jft5JqBuDd`du^G-<g}<42&cU<H7#-j%Blu>dt69Y&lu`_mD(cQ69RLJlWt%M
zBwLud@gp5qS_qODeQ}V5NUaWP8lMoF5Q3RkX3D>r+W1sIQcWaGWc0xL>yl*f#j#l3
zg=<r1s`vH#uAjTF%^_qu77=sAwO!}Y;mB|v!&FEiI6-U$h8;uH!dGQ#6uVzHo|i~X
zs|WZYLdgev=3!&yiQp7H$`sqHvxr1Cw(F4s@6Ql_I=f^YV8aVs&9oux-~7H(^<e1j
zpwT-s10)oz*0Z&hr6d$z@?8BkB1Jt^&OTZB;o$F?-A4#o_)6U4zRCv3L9NE%&8eB*
zXuw9mc3)oalfX@IqI7Bdr)S9)nc?_qN<}1CcKWQ>ruWJ}OMd#CBwM!U!BwDpt&8(c
z9>A|29xXHvp$p2DQ&tCGv=T_^ISJzr$qO@X2(?%yhP}|<kwoCt_Kx!P**b&;VUBH0
zbhp9KUKb(~=vk{oJxld*{!-$Z-Mq-LgMJ7~u?Y2z7NM8hiUvmk7mshCwf=S%Yknam
zy?c}_r)M4d-s92kUu>oN7v`4M>X`=>k)Mt$Hql@d%3t(#<=Gi7RB<bB{76N~sAM9h
zG;>$pL#w1WFQEn|B>G!MpH}8(oiu`YEQ6lv(aU5h#Ve6tSNeX1j5QPJQK{yI@}0-V
z?93x;IXtLIGr2d1Z!|yD)KI7Nb3Y1hwiW@%^+hc*7==?^l=EoT^PptlI)wo>I=dl$
zAl;W~uAI*lMy|FrDBWkA+P4;SlPu%PoO*)%*B$C#vndIfP0#OjXhgPCU(Aum4;P}@
zmSH#tNq*T9b=74omCrmzM5)i{ElG;ewWh$YVb0;o-FH^qF}1tSJaXYE6H<0XHtL1)
zjXn{h0oP}O8-}zQkZcs46deD2`!(;75)0x9TYTuOQ;M_kbc(NTL1nf&c2#!cxU|pb
zBEAF-^6rpg`K!6Am#yY<kus6&GlnKq0vrQ8VtO71mvtx2%MBRCC~#nww4BzA<Y<I8
z4|7!0%ox(vtq_7N&4b^U_kTH|T<B361OBILJ4?CMa*I*S1_$odn)4Dk5B<fxTCJKM
zTd%jTKJd=DeQ@6qSp5oqeV9SRYLuE9yga`JltPlMT^hIhS~iMr=2fd3+Zdr{Eb{JT
zjxZVh$?T&-u^Tz{71G}$2gUp`HuA=Bz-7^)B8Tuhnb6)^JGNwe2;P_8gEjla?(DM#
z_!h<wvW6xGbB5{ryWnpAkg2y7eGAWtOBD_e4BEYoWTn89goQPFH@YQ94iY4)AJlHH
zw<XVfIa8q_O>TkBqJT+{1%s^KEUN(atcp}b=&Lnu;-t<q!nID)b<Qc_etQHzI?$Fs
zFm#p+S0|Hh*jcq>h4tyl)RnaD=+T!D>;&{6eiYP$xq5F&Yd7<aM?`u-H5NX%vL^Pm
z)`j%~jy_#m*F<4hXF1;fSME*R5JX`5NKPJnKRgE!aeiLoA9O&R=SHILrp&|NjKRA+
zt=&Kl8*4}D<w5X{v{Z|qXU{v#DF5_v09_rI8_k9~RIK`JGKsH8PYUKpqU}Sp)3+$&
zsva-&F)by0BZh{C57<?&RU}%h|HN6!^`H=@HBRKGZ|OZIR%RWZ{*?Sq1*_!8T%&l{
zfH>xD3ZqRxab9of+sks26$BJMOfbMHR+SPMoXcHtz^U6mkoMkNy1$md^krJXN<R2d
zu%uL`{l$z}FWtDyTBSDNj}ylSrV={`j@nYvs$x|+hGb>tcW;LUlmjzZVoYPr#1{m%
zvn<Y!#awflZC_QWhA@@!nus>zH@y24f=13;G{!UFG13_)`05*Hql(Xsd|@>VJ38l6
zzS#MDx!l<|pQ63~MD+G&qjz~M`R8W5x>ipxGhzv6*7vW3-9x4>*zz$jCZ?X0J%&v?
zoga*N-7Qx*(*4Sr61_1wic*<AHS@Ti-o&*9Cek7H3x{E8&Gj4udWv7+1X{8$xR*Ej
z2pRoxfEKm=X-?%6FltNRKYEu6^e#b7QC3M3S4uv6<&lO%*Cc|sbj;b06@dmFi9`_D
z74*E?F~x`9=ditYHRuU7t>xFLNd-6rJI?gtoh}^eyZJ6O!abt25{rpZ%eWseVs&X{
zMGd>hTkU^_XzEs+di@zndmzlSIP<0@hrj$R<&HxaQ}FXTJZg0RO#IfnGPNS+8>YgS
za1<h)9t|Yt@+Igz;Yhq)P;Cz};?Q?Vq?`RYbzOU<uj@z$s^OJSI5436uwi-z8$Qag
zH<?@dNuyp2&;PuN3<$l#8tydj+#9t5YkN{GgEKg5WU#(zPl>Y(VIkMoc1EP$5)-F4
z6(pXQy+eJRe(O|YP8FTx8NI}b!*b|!G~+H%<(k2M&)vACO`W{RS^lNQdezZwe^DCr
zS|*k2pU(EdLikr}-O4_2vQD6(ZFSZB3_ROQ(HUICs8vo|C?~9)$fSK#uG2jY2RHQu
z4UF$hTKW2VCOnDrbXCJgd|x{zBrEI37RCFiuYM|47@#%gcR>Tl@IUdqDPET^{RT+{
z6OZxTeBQkQCxzg1A3fv#%2L#Q-nw*`Ho;L>p^l(Hc3^Z^8cA&U<>tNc{L*kjd4qi0
z-p2v9(4pc!@{c)vHhJ!2EG*?|J7Im}Eo+o$=xd@i-GsK+G8eK6_DA7ns=#hT0+N^e
z;Mjd{?(#Zi;KH@w^_S)-a?1&uOs&R+baM8Ly+R4!hkPQq?nUeX87Vi38*_P5Hy4rX
zAl6u#XA5lE8MCZp)?L3dlzm+@TIx|Yi!4G`l{@YW^6Y)AVlSse!q<4jda#>}3DUp<
zHH|;?34C{7J$~*Z@qwM3VaE4E;0Z&X2&K3A{5{IB+iegBV_FAoLa{zgS5PhVAeu5r
z(5A^;EG||OdnofxmV~M1roA9H?pW6RAf_|$xbo}DO6@(8jF1c&(Mdk`R#gXgZ^u^B
zZ}QBq1?{3laMPJVQ~rrF+grxv!bj=bADUQKoA$-|oo3&D-DsW>m-@-c{i4v~;KR9h
zjagoCXFZerHrln#7QwugS*psuPhsV>#beGdnhL~5Y5im`H%y}sK3gqQK+TH&Y;U;S
zS~|hnAC8u;X)2AP4F~hl!??)#9D-^%_$PTAEu+O+7`kC==~K`Y@uxY{z2#j<dQmZH
zD|-;+z*~>v$2KEvlOw0KT#gNim5z@e!^@QVBAt{;p5<j)9L>#(fI)~ysK;WzWBpo>
zSe?PMmQK-*DUQ^jy3^7h(~pzaI((Z?xZpLr#ZmLmqTV~u&qV60U^#rS9PJ#jfej;g
z+!xacKqWjf#nBsE{lW<9@Il(j>k@Ez-fd*@pcL6&2_&z)dxj`RWI5|j%B5@6LnNU;
zA^C1P;|3hD#@njFRvWK>ifJ2Eq|Sv*+6%YLw>Hl-NDwcwf)<yL;{Kvf^pGHrWn;ae
zeQ=KtOZ~YJBksZ?8(l$Q!%APePmqO<na7~U^;e8~P`)?BL*d35ZQd-!@JiJAqwA%u
zJVD;sZz$2P*!%(5!|fZ}ZWXxFOyoe77?~sex^E)PF>Y1%65d@dcCp!UQo!QVzZx`e
zJ7|!gC_99HOv>g;C%RR5MZ%Q4S>kQ!OMF|KhlmT1jK02@U#w&d%jP$;=vZD9tw{Yq
zuJfJrlyPan7JaN$D>k0@&pPU1!+_j7BNOM;ucEL4=3nLFYHRH>I!Sykd8~{y-1;S7
z5yMq)uoJ5?t)M69$Qlg~KXyk+05=SU+fvrdWA6va*(R!1;wm!Rm*dYE2Qh`@`w&x+
zmyr!DvBGuq`ZpAKf2|50b|-HEKaw@`ow&z+wTHBsF+5EX=j^Lg4gIU{atihDw-eSs
zEVc`ezc$)bD5>#1^vvuYj(<-J)#NPUQMy;%@m^4Tb#4~t*|bn!W?+(M7n)aHXIJCf
zXM1l34yDGiN%-<9`cM4qa2&m(2s}MDD}#}JIxmar4`EmgB{1$qTi3=+?WGNl)I*m|
zIG9oQ(B3A8O|u-VHSEnxdRwDX@sr#E$A(A+ET7dK%(_P#%ix!A%mCF@I7_2V#kfhN
z{^?WKU0ql0^4B)<!EL1ggSe&~E2}rjtlroCj?Hr+@0b%Ycs=|(nlN)5)5J$U9V{b#
zT4yG2T5+eIwQe*a1XA@_jf8y!i%$(=gvAy`eC*a%RrPO^f)sEEOi4JVj1p`z_Ny~;
zW{9xM3N=RRR$BhiGoO<?ifn4Qyd!VD8t?8*`TD1Cp%_7hyCIlD)I1kezzswUcammq
z1}Rm>A5t)fJ$VF1OhHy`XCo^<HU@n`R?-XObFeFkl<Y$Ohxy$aq%X2K<#B~u-gr;@
zJEMLcM$k47Qiku>%i}v(|1;+$>vrzdF*a@EQ4b5I&v4luy*IM1>%>2hlLPK>#K_D&
zL*9xrOknEWicA4{YxkReEmpnn*E)Ua5sX`2)cmt5l$=z*WJ^|6i($c8Yw`11o*`x1
z&gyaevzr&<kiDK}*{yPIRmCg*Kc<NcM7R{*r!0|%g?scPnmSBRw8m6mCokXH8Pna_
z3dDVn6KKe=F4KOIkYDP8!yq~UTa?8Y<4{7%wr(_19WCsDRxct^WlJiMdQ3N#^j!&7
zE|{jr$(QSSi->V@z-NJI3bH>7Rwow*GhcjA>*`Dn_DXg2XvH(LeN_5SV3M8^f$w@d
z+T5(uR-lHkM!&E()%GfKW~Jj}q$MBpnMyRje(rFldF~`1-HCN*j`L0=L3p8fIH4jv
zuG(BvDf6I(;2&SEdFQ@5?<S|ME|3e$YN)xwG~i-a_ofd0*2VLMmP8e%N^Uh%0_#QZ
zGVvJHeDN-wocO(6t9(+<RUaPY#wbaug%%fyh)&PAz~|dM2GLl(>)cGkVtPkI_;Cna
zI=C;GtnbgMP%iX{ba)A=S2Ilciex{AFppO!T}TYvwf#a(ZA!Fp3(u1=u!jl>rS|ox
z?=X!|^<sF=*Eu!Y(GzJ5*?q%7g>Bjt)<%iWF1+kFoJ0HNZCLr8z6jgY38f5b<bOpR
z!1e?8GHyi8MB*{oa-TX~Pmz)dMoxV#WNohL<T1C%SrG3I#>F>+G_fzqzLpUnFMnxj
z6lafOR8jS+S^#y?XJ+DU5o6gdUX|=8b)^QmYoRfo{1sN{Ewdv13;P`9?`9s0lx2U$
z@8RsJIwg7domu<&9Odi6%FrFpuK42KOFB-g$yc15BE7sQa*yVfW$A(r1gjheBK5z1
zz?&j`HgU-Lam6FC@3}`U-CE4o(}j+px*gmYQCSA3dNEVW-3CwI*yrrGa=<blc-gQ0
zWfkD6>W9!yl2xq;O*ISkMBx?FR=5zvb~V;I9HndDH3Us1Oerz!HVO7QT}^;S9=$N~
zlaZ|$UOIG+&K0KH@HJHq!|G<Ez6GvvI#GVC4$H=4jcuLr@5BmvMVuz!t@USB92@|w
zij|jbq+bWWba_jU>vPIEX{MYgI~})|>C2M~ui9c27RRw;X%?*{f?IGUDxWNKYBweC
ze#Qk$6ztgQa)ECvDSme(CDiaKuFTx-jYUD9*jF;KyhZvq&Y7j7PkZs9iY_HEfBaQo
zq}n+s;4UsvgTT2RYbfM}uBxlkt+&?{KVecv&jG!ibXhb}C9RayHtC^5c*C@;H#HLM
zH=pV=6i=Ta?ef6(YQvHP<`0O(HC)pUH^|mh7dJVW#AGFs>78WIqz8uU!>PvF^ALL-
z%xtD7Tt!H=(JvNEz9qzmh*9e|v76D5uvaABz;7BK7&k`b3CvX!a0x|Kk@Q%9A9;&D
zR~pMrc|q#aX1g;GI!}QK7xxuT-~NULk^f198aXE@!{Hx2xd1}-1;>(&4WicLNA-#q
zljM#J5<V}BOW@tMdkdOkO+UvzEsVhv(LHMYgpe<`O$XIC-A+!(%2ZTLrm0CmkNQ#8
zjSHv!G+J-LGu6OUPDu=*NG1YvgJ@NG8S;T_U?ug*l)xXW03gEa{`<L2N}b}D%Eyfx
zIdp!b^;cSzbS#U=1R8bcBluwMe#Ip29fy=bc(`H_6)Egbuj7>ISWpuBa5*rypm$;I
zZ(I8<?Vmf!+?1Qd8{sHgH_SI-G<@ZBKbVU!{DLQHfD;o~CYt|eIr4Biv_>3}kNpX6
z3T<W+b2cTG3$b|mIUi1h7<n?5vyd!FJvN_OcvVpPPz30f2HZE|=rTxA_ti88cYFiO
z6&X^i1RL>0R;xdRs1KA-W`JIeI$*ne3)Acc8=vQcv!g>$lGm|;Z$=I!0^SM*=k8{U
zcdp$-DZ-kRDs-3VUipD=+Ap1s6GQb;WGPXz)QBS=o%Y(6bIvG!OI$vk45VRyY|o^P
z$b?{6(`P)BN?>T=R@hyKuDDYaC(5DXKaw>StAbKFfi{Ss|0;%&yt!1d`>r)kw`o|~
zS9sw5uMqQzdb0A<!AjSpciwSr6f#xNaW|umcYJHZAY5LZMW5KoTcc-R2n62qea5$M
zsM>EJjIN$>h}7}E?2ublUZjqfxoi?<9;QiW?hLq0{iK+uh2+$ydO)pNxxxQ4&OJdQ
zP|x(@hhq3Q%STi+-`^|$V|;yp=||Omgn9c+S3f$0HAd$0jJ;xu9}7}1B~Xo?CPFcV
zCYg-S&#ak8pR3J{<bC(fp3?44S6-uB*Q7$1pmrox?cHU%x<`9^XrS=KvRfTJP*9D<
z_NM6xh0~8`oP&emM~Gwmm#UGNt-pzvzqUF(fZtqe`<zs0Zq{jTk%dEZWh})_zPQv6
zL-=~@%`-hFXIY;usr8}REHt?_1W0EeqHBz~Z<w|NU9HRGxdf?atzV1l*>b%{WeD+k
zY}M7g-&C2}_pPjzr5XpzG-{9iMgjgh#_9uJH87Ke%_-KF+$^JL1<4?`-ER!#q*poH
zC__Y>)f+2Ri~nJrn8eS_ed36zdEjZeulG!>Ok-?-PmM9R@uzuDK+#HzK98jWY`$(d
z#mB1i#rQkZN^?UZRypE7j;#GTV5y?;+l0tu#pTo=POm&IwM&nsIf&t&i>L*^8=|hr
z$q4oNK%XDPQaga&SW#wP*`#1#IImBn=-reh@VKm(-`V-4dg)<neA0?oi)LO_!%Ulz
zsJy14!Jy-xC?HV_C=lbY-IhETec0dP)s1*8?OtwgC6d7jbCkr=L=wpNC5Bl9BJhQh
zgXGgy)yBi7TjW;X@<ig_R;r_=xW8nFqV`}c`B~*@2+u7WK#JYh@Y>?vf8`0N--d&P
z0Hmh);{@sK<hkrBus>|?TFWMM=hp%BhqZu^i%uv%htq%8qkl_v5A|{$bMyaQM2DC6
ze?gEI{#`^z9@W$o;MJV$P(pXe0F73W#*?cq@OL?#2MiE_9l-Gcl<LV%@&^PCzyty`
zUpc`rKu!hf=K$Jr{<09D8w2%o9zZ_7_&@*w=s}u(k@&YR4IqU8QQLXk2*Cfyp_l-;
zAfNz_<*+3nb_38Lpd8EtH;B+4kZ~W-L2Lm4RYy)BRQBJ{L2}W5qk{nO4Ub*o13-w?
z|FKcRgM4k4@c#)N1c=zb(LvD<g>wMi`2ii28V{)1bg_wmA`Sq703{m02t5FVaBTps
z7*Ks506+lW2at#lK9d3kb^xXjP_*YaPzVsZ0j5yND&OTU4WLW|iZ{R)`dw@X(2hl0
zeOf;;0f-^{F;mkI5Y8$HHz0S*AsGXBB>*-A$lU-63E&L@iuXe;oP<OGIRpsZ?i2a|
zjR>gY12BvL@(_R>dJy6P?vTllwN$(3Z><|h1^6v=0|27mBq9I`^gtp43hYSygG8kK
z|As^a$lwl%4>Gt*(jOVz_dk$`fEqi$Nkjk#36R0l;sMG3K?AQ127pNazfr;;Qak=l
z3D3LfOqU}ZNE{hqPN-&8!u2Iij#to(|KU)YZk$m}Xf*hZc{<9?_ibbWMiuk7WPh;~
z$Fee9zs2Oz&Wg#Cwfy!se7$Wq<Tr_nXSeki&!6#4it<gGJC9ciJ2uo<Y|Orll0*Ta
z0Y$$|8s!a5trH6(Muig5gG#(26MOn_O3?A?x>;7E^m^uiA0DgRnkOX0jPQZGeYWtB
z$W;#;al1GLo#(8AjO0S@8(r-^cRlM-*r>oC6eb3c&afH!GBom_PMqw>n739_3PFZ(
z0nG&784-(`#I);-Qerwzh6`!Qu%{JH8BT+!bn7s@g-^U`JeE-AELNq30<`z^dyrFb
zb&XZ;3ru%pjU#+Y)GljJCVCLXkS~*M{^6mYeYO<BJHm`uFr3K~ZX8B3V#qsQPEy;e
zvKJp@bY$Gs3i=zj+~nXth*4gk2JyzXp+P%j3+U(E?Ck7zx!@q;?52$51k~Iu_^-ft
z%TWEN`N7f&phmXVdh0xQ1C#-W?XA~vRrXh5=?gJ?hh_-c+e9EjtscxU6ZoJVW&<OS
zY5#IQadGkBu;a(DRsx{MsKa^55Y%72Ml|Q%HX|V}m3~hc`hjD+$5^XqHi%~=*M(fE
zfN&8Zr}0&-N#q)AM~)olPVmOW+nVyl0NCCG=}qlTsvdHYTu7A~)NS0iiS_2-+nbl5
zr!HgyHL4I2Lnd!h;zn)}>s@%<kMlDzVU<{L)1CgzZo_7BtM;TDrKo)xL#s0<B`US;
zvRxv*d6|%hMjfgTNv!UFpAgvpA+5#Z9Y!+by<rMFUy1-9&@-|1#D7#^fl5W=Nk}v9
zPET=!6vQPD!PrGkL2fmkv=rqtBgE{Pi)+jw3mhK;Cl)<O#*@hwEGm8Nl8M{}#UCg{
z>{;vaXBa?uAvsa^tpDW6D5^B&PP0=b!sKQsk_2Y~e_Ha-?+AR<?ySYi*;4584s!i#
zt17w(J;8o&EhA=LbG2Dq7PzMXL-(ht)vufQO6f!fJ9W)o$WROBkk)VB;*mwxAs|NB
ztA_p*M!p;_??r@U?JpwBL^i{GWP$X|EYx_R!SSG~7Pz3V66Qf*lX`d<Q71UsN!}om
zrJYUoIKr_r{%$<}$I0`6HZqRT@>n8L@(tc%#LW&#j?h}q!Y-Ed=U=X~@ow*#!e+73
znBUu1(kFkUb<-X3%|Vs*;Hi9J9QcF@B#C#~2isg{RSf<f=jYnyfu<mEg!@XArUn1w
z8tStB;)Q?PTTLP<dbeO2+?ZZu1ojlsNMyijU^wqO(cZ@#*P!nXXhdl{+sWfO3{u9$
z$G#AbQpajI@9-zFYaDKdtEId?7PR*M9&{qZllu2#xeiYJ6o#4URum95agl;Be=5Rx
z$%|uuu?+Qpr%JQKENwv~Oh=2BWcZ}UHkmRKfv=wt6+y7M_xY0{?f_aGe&n!n$xqEh
zVQ=9fF%53EP(OZ|Z$JNGv=>0L>tr<3>kxY$MRq)PU8zSExQsb2J<dAzLw&yeMIj0s
z-IVc4%C4ELVx_rd9QzF#hyaf8t>5MlA1Efz{>GBMp%@FOq}p7!tKgp^x2KF=DcX)2
zt|Ep6C2xWKGdnWR{o8t9NWtV?#5fijVgi|nB9S;js(#9sk?!rs!(FpI**$}Z>boC%
zqp_*vg=@qtarqG8{8=G1wWSp{;@u?E_zEKx>8N?q1vrrZ!`@p*MftY>qS6BcICRI*
z-Cg3)NOuj=-8CQ~$PAsL2oh2ff=D+?BML}&ii9+ZfP|cfZ@hl@-tXS)oORZ3pS{+3
z*JAufnCH3gtFQZWe=e7?@aerHvio!@lDFqF{PV;+Lvc3_LsUxTZ=40JK^l6oyDFEA
zpd>zvw^IPd|5Pbj@X9dDa9ePPs7ny9aN~rrx)F^$DO5?OUss-Cg}i6N^26O9;hL!T
znZnXGWMf@1ZJyK<1L61nc!d9nR=_G910<Xvs6Y@jx!5F$@)GD*-A8`W`ok;9&TSqI
z&nAs@b0hEInSg{CDv5rv=7AkS)3~2-#c|F)=oVpEr?wv<!z1yaFt=4gZF)j!Ck1V~
z;nXm`ov!D^mc2$B1BXI#MF_R<H?%9Hd@FkVyqvbb(r3;{yb!-vG#*NSpjsW;9Im0G
z%Y&PJuQgzA4ppXON^$_<niP=eAQKXR(Djh-kC+x4uGV*h3KN{zF%{$DjiicP7OlXv
ziMx8`_aypN2lQp(CZs{iezro#CO2On;f5%${p9iWATU}jV*D#tL<;6APMa3>&P$3`
zFYY7#%eN>D6T0*?eJnX^<M({2@PK1kbTO)5d@SVAbf}l;DWAiKPSBSQaIBG^;?xW8
zIyRGry4pJuS-89wNifCJKodY%JO@l2&NvT`_#-@IeEqP?T8FMHBg}{q`Jzf(qPzA*
zC2@@H9Zsu6$V++Gv!dlUq+VXuNziIc1cZBnjNGdDxM{Y#PdlJ?Hk-PvYf{he$rBgm
zJWIRxPsHBvCpddZP-MPYk$;l*{4Z|>7`)u<<`H4*BUO9{l6<_rhfk~|o_(z<>3q=r
zA`3HYjpNapbG=~l$qV$yif+i*TTdRH>)4it(?1fJ{DnZj<6VU}>{r9_OUHPLuuHvu
z)Zi>!(4lr!tBs?h0;~5@GV(NG*vzIG{-=CeNs2yw_C3X?zog6EdP9^*MDN-$4*x`c
z*0YU^EtGvv1N2S4^fr&++5>DGWq7vM<*Evla=YzI%YtV9^IALdW<2lCV<!_j8MN1j
z*~Yn_UJ-t{Z8{k6@-n1A>aj>uq$6c?F#osTO4nZYX)UKDM5wE_Cgb|!g3`G{;?Ik{
zJJZ6e?>%3uC^T@$^OUZzHTiMe`q8<pxR}pdBSFxh9n*W;5)JKXwvncfXngKqQ5JJk
z3@;Hby(TLMH#y;tXfcsgZBp|dnBWEuvFn_G$#3_@u=PE#pFkpW-Dd&M98D!b<Q80>
zvfPj$zPq_w*8u-(N8D<2D(&q#j$8E|hDfQ;4lsG^;sw#w^zi8+Lrk-PX8p4EQa(&Q
ztGL)MUD(EML9GFu_ZJegl4nEC7UAQuEf2yxerq}>py@ian_Bf`#Kfx|!VQG$nH+lz
zNqRCD16|u4*>_bXVsd(3O01SjJ5UVzy<9y^a!ZHPxH=H+p_IPzv*;OtirA{ci-;1v
zY?8+O5e<Ys)P&OG8>Y>F`J*J2liA!v#N;jmcEAf>$xc5QNtqjFZnEh(s40(HK*6t9
zUnja%w?aWP(2ccP2Tj=i!5z84=veXyUW)rBZZZ*i`Y;kz0&DC|YB5r?SeL$Yd2ZS|
z?{+L<AhD2!&gZ0rHcYS4iG}O)8Tz}iT%H6BNq_j<iPQC{w@cF|QFJ+lgWf!7kEi;s
zIf^{OP_6{~X~6e<SBPqRMbj|dj$PxHqr|R-A6K-SZ^;)eK<aLYe&!3ePkqvkBP(Gu
zSgN=R4{f>F)UjWM#}hEdMO*d2T=!|d31_U$3iapSMzD?Wq>n-`&I8GNi!7fMspD-a
zYKJ7QM;P>MZ}&3XY{Jv`0pf~(Y=YqfeCh1c+yv~8m@l0&<fOUg`vntBz{ZQ&W*O3s
z_~M9aqSWRcmMZW9#nrkXFS@L2xGH4sW64b78`kQZukvU7W4(@RbaI^gWADFeCK=^6
zmGszAJytP(wGf<7wndt}ikq#B)uhHfs2}I9WFFtTSlB@&(}`)s_I$c(W-#vcTezRE
zc-6q;*2w`l`ycW2LU_rr4_g$R)@5eB)|DSO{}GFcAd|7aPi7a-MVW30jw@_5YUJ(s
z;A6Q2L9fyd#{*H<4oqe8c^9Tz>!&hR|LwLtEYe%}q@UA3pv!tB*K7gXvU{DR2l*9)
ze%RVvdrkO^{3%xn^}#+<`CNG^Q&nd>Zbi@3RAz~n?&p<Ht(<rB_CS2UZ4bV1aa5^3
zFY7PUrkXO&hFKb8!IFDcSHIw0!0jOCnkp?w<zn=BjOx80bpm4BkF`OS!M}jbplb&V
zUURE5j<S`Gtmhn9eEelU-3<ZwL-PxnCBuLyL*@ko+Akt3*uADxPlvN&8@1k)EVoxg
z?$8l+8hMW_%x9;^C~`(NTibtoVtP?9%-gV$gfk}~j94E_ak($YMw<2MuSK(~zWA~H
z#aG=cPvg}W$l;9FvqyK;U5vOSu0`H?8zis4nhNYU+1uj(Vd^a-6ZHPDIXyGTr@z@E
z*(g(bTg{p|=M{H9yY}Npe}5kqkUM#|xw_w%S5lypNaoHi_(2~*N^y#P_5tmUO?pvX
z-6LXSX{p9y@KZEve*5oOzswgIz33N?$XAn?n5t9#vrrExu+P-jSAN?^K*gsux+zo+
z-$@Ko${<!};E{Lqp;h>0klm24&E)&!&Y``?n&Afwn@89-4LUtBj!JQ%WS9j_4Z|%>
zu2{TW`=wG!6sA1u#g-G#Eg~+lpZ-oYz~?ecvspcO4zy}7rBc{qFU!Bovwc6g3k@)(
zETU5peg8etI|82nI8WKKCQ)H|A@lYp)<j8#rI-DOip(T4tPO^GoI4fGYXM#=AymHj
zoKLrO{eAG{Nb{Z_X8tQ-m0sLDO8QQ@;LQSMHNtUMIAMs;{7?z`Fw{?P?<$NL>6k}0
zLq;i<s$M44uhG#!ysqq#-CBhCu9Jzvpw-gE?Ve{YyMCrLzI1NyJ(P4&ni~VtBd+TD
zIeWCXK8*kJA_4Fh{nFTo5Y^q~@X3z-G>(XXh7fftZri=Uhq5m!$!AU<53MxC`7N37
z6dA*+Nxxe;aJ>9pq{ksORX^#dW2D7J9lm^tZbtG5<|ez@@HuI`DNaQ=F&3dwwyLF$
z$2y~<%GA0H%`q|gy?yb3I#$1?2@bR2u9}y9epuo41(=!*q%z=X+!DM`AQdcp!n$ZU
zgO{5%U_wq`*7psJ$H|}QvOB$TC?1Y%^)btARzOM;_;37_NtuzWZ9D9Yl@4)jC{NJ_
zDboH<Z7G0^a825wtG=rdX$(3b7xP?d`<aEld`36fq#OwA!0xQJPkR)OTSErsG6UQ<
zHkj2t@+EGyOy@nSSANvj42TSmNkySSWzwX)M40Hrjt|;*Tn1Vim%{eni@5+6<4zRD
zk%#L^`j)xPXr>i$u%r#XCWqkHeWqGfkI=zl!_vib&?Z{!By}A`E47M6-5w`T2s(;x
zF06UG`F*33>~M8|kd$rW&4`>golA^n)XebM>=zH2=B&Y+qLl1hb}7{Stl&_3HMr{&
z2Dfpg#lXP<sU>qZREE{-P67Qc{RbJYgOoTlLnCh$+?@*6DO`aQiWT+}%WoG>y${s)
zHS*rg#fpy!FpnkA5N~u!DFopBYW?D&?bFEqhiAQBqZ2xMusYObjGD&vBu?jpw>*h-
z>fOX#&`!o(2%nKq#=j@rrr`1=&3$xgj&YtCY@VT7UD`HITfUJZ+O(s=Wk}`FcAGv5
zUX%eIrAS}{g-CR;RR85HU?;P-K)4O#XC(0?dCSzMepXrKx%@Wt9ns<4)i9>>P@R?H
z9wpj5`P(12b*p@a)bwq*=j_G|7wTE2Vux1woND`w>VRv=0^ji?Am-#{Rw9Pnkg^B=
zNQ)$XMjV1yUAvxPMZL?BM(l^Y32zO37XI#+O~g|y4WV9N1-i0am2Z7I)8AxfpLh78
z7}y@C`P?54loJyCSnM>?=e&_b(Lp)L9BAXlJH+tNAQB`3t}?aB`O_FZVs>lW=?=o!
z^1%G$TEv!oA@@xHRJISS;ga{Qx|PRBJGw{cugJpa%N>4u^qf*+|C#4r;RPRr;QQeN
zLwnE5nC5t6-Mywiw0tn!NDBTYr{HGllSEz6G=sKeCiSN&E<$D<gQb_+4duDtva~6l
zMKMx*kjo_XBr;KoI>ltaFhxfsK?3SAHY(aQJK?O=ymMZCRa{yOZ3GTq`xxk6mNu0;
ztyzpmX=O<-;rFH1rH@JE<c$Ya;W7Qo)PaOyaT*J~<_)<eSBTMBeU;N_fl>vX6&~c?
z6H}}zEqScbqGtOp;*ZS%HH8H+TnUnN_jkJoY<EAtX>!f9WtF1xjqBRJE&n8GS{ceg
zOtj^T@!Jg2ZY0dj!BhR6pi3Kxz~v{Y+dcD+nBgnG)#R2h(5Ru2ZrRF}l$cd9H-}FY
z7s_O2e$@eAZ;8x}Yi*_~w{+<)d9NRYn4G8Ey`Q?Ur@D{*N9jX%0Az(Og2e&E>kelM
zY$mqFLDDSwjPeoe@vRzz+HBc8Q&_b<4F(COcdJ_=8xYop@^}gXGsmB#b(z)Vrip`0
zOO@kk2)f9cXu*GNM1abR{#Jev^35IoOFelu6QN>5EX*!%6J78tS<yxfWPc^uLUnl1
zxCA8)_`NlD&al2K>T_t_CE_kk+pMIqDV$8Z1cwcMy~P{PVt5^Xqa{G$vG{1Ww(%6v
z#$2-a5W~`R@VW3%4J%6$u@7(ZBAWr8?yO`rvJ2%Nw6{XYoZy8Q#1~W6bK(p6*gVno
z>CFaKN5<=_$6{|(w#@nj!L%I0@osKKv}*g*s{0-v1H^Me8<N)+Gtt59@AVY{!U=Yg
z_frO(J%m}v7UPew6Vl+Bp}6bl*>Uw1>;1OQdW8c@!SnDH7!MnPaea0m+sLrg(~osW
zA?A+)`gsWtpJE8ob$+zTZXHqGM+aoMx8Jr~+kY;-B-j~SM^e<!{0vLzE~ELRcX(H2
zt#|(1LEYn6uLM(@c1$dC4yN8HdPTCF94hpE#`JNioIq}MB&YJ-K)K`wqAeUg5Ts6J
zLQ<)IBZA!A!{&mw8GKVOw`T6v>R-_v)CJEoFAb)-FPhX*aPKwU6%BQ*5#coB)@BOR
zi_*pp6KpEv$|aVcZRd5~;(3RVItqN-I~9?WVnRQJ5k%g&wl6WAfj+3GG?j3;|JnU0
zpn2kF>F*liKI0nQS2@+o&bN8Hq(g9~95~s_(nqsv1eqp=I!0J}yHd6On8HtI@W>Db
zs2zCrhc55S>odbxa1c8B@P3IZ6G@wD1ndKGDRNc^v6S&zm?Yyb*)GmH{vq2<9Py5?
zNDZC28P5`KM1Nq3#*^xk4?FAOu>`{LuVsU}o6&07aJ)QRpW?m3a-Vu5(BBk3cW5(W
zz>-R~#WDb6%RIn(kzKH9o9|sFT%XbLJD*}T$6{syKjwUW-J{a?)}?JnBXB#vl6r$W
z(vp=DfAC5Akr>;j;YjKC&+!k<6*-w&$8CzD@q|C5-Ga<_{JbUE@t$9dE3*c5_h(uw
z(4??yrD3{oW9XMAeROB+J@P4v#85lxAwQne-cmCQ)3m@^8EjpqVDw>1&@0{qnrJUj
z=Yrw6s3jBmui2}f&@zD6bHt!c<rya9$S}(QyIpW<^te93#$8r~!XM&<{*kb)2|Q4a
z4Z^OWFk2m(;HZcsy7xgIISqYMt6e^G=u};=vR(;2>pSq;BwLu`r;%y!XIdi_-C%2a
z0nr^4^i?4z^g%H<*rh(D^^NGA`iak}_`5*+1vFPwsf0$kY$r0hm?-TJ{e$nZ<=J?=
zrqr~u<tr~?&1{{*F09UY#GWDT*I=J^H!E@i$>>KNg#r8U<C3JxKm9Ms0e<yDV(EyP
z>$6b$sD&#Qp6=^_B})HBjf4rj=oaphr*D!)s7V{1<}8e%GW8|<nL@gTnps6F8VWlE
zB6-l|+|F^!XcHO5rOdtiWp8o|uw84b@Wt-0Ur7iKMHaLd{w(DD`X<}W?LCUmHV5Kg
zY?hJHz6K=_Bx{)0E6^{Px|JVmRYwye3ZrIp4(|%Qh}AB^Je)hCsV!ouwp>O#b%+sS
zMMT`RdW;z_b`{_BwO*rD!TKBj-ErC9S2e{1#D3r36#lP2E)y5V<9H{j+b*u(DsIpu
zYV<#)|H-xBw9N)S|K$GpU$g%F-(dXdl+t-Cq1Pg2*eGK3|Bge)m)hNf(!-t7<9|k=
z^MAnY#hcU5|L)9Y!8L1Kkuuu*u#O9FEC7wHXYJJv5oD$zj$LN=^crUQ>EWB<3_k~<
zOcwXCrPK07kMj+L<_1*lV|~4A>bBp*E84B3oyr}GY4FZc@#*XPuWwh}e!X0={Q6=F
zW9Rlx{*STqz_hT7@i7Mfj3s}9){B`%`$hMD$>5j(?vI`ihV*S?wBkt%!)tuQmiT(u
z;*xoeRChdg($pWQJ)E$9KoLM5K)%CAyy=z)9PMB$=k;1jX>v{7D({|}pHy~xqN#Ij
z^1^-0^Mx6`4he-cSUTR{IM(+BvbT}WK$)pus2Pl&FgvMSL3-&&Ht}w1eSQ69*xAD4
zf?L-$$iy5}PH)S6(#@~KFl_S%h~8*aV^h|CpSG(RCukjsd74@c535!SpD~?jHbIbY
z?t0I$;wUTcgnh)+AT)nS@+RO~%U8^Wy{5LdR``lhZI=h2JZP2AuElW|uRW)sjKEe%
zK>sjIurP-*-TRgEjtx9$dbP4yk#x3vCA~{;gCN`S=-S-Xk$z!DVHkkYy)bxkE%4-)
zD+L8LIyFwq&KHk6KR3ywU<~ms4;m5|Rc3N(_L;ng&30_7X<R}o5Ev%y%s-ey#nm}J
ztA$~z_gjWKkhkK@z<XQbdn8?7Cy!UY8?D~&=EI{5T%Ze`fM+%Fb5FiC%eNIRsjjW^
zt=?}~%l3bryg1xQ&0w`h)EB?;N%^PedS+4Bp^X%*e;W=g+|c$$T03Tq1g&VhE*Q**
zXC(pB{O7E)@2;9x^ZbxWlNpkErukL(>Q$rQT)P%(?7IQDO;?_6yAk<U%lBO|0l`-+
z)t>^t!hO5-TNU>~#-0(KtNS#yz_ELKX~9R|^J%|~rEowN@&3~@OymKH){X?8&!hz|
zhbiu<Y!UPeagzq{?N<2f0&kPpSJ_>>*-A0M;GI$nvwr51ir;E5W2(lqt87a_P5HHq
zNHv;nxk6`#wVRI&nCGz9;^FTysS-K&lAjM2K4fi704T^`e`UBsAt1#)hEW)_IZnj<
zoDA>g?QULiXGW)%>47&99pylu81V3QYvU!|*|OMM%GVJK)R0z}8AF>zR`a5+{i?l*
zUmLwGgM647WidG@ILj2=cgB#q8UAqj#gEs;*nuS+fKKpC!C(4kRb@S1gkUHbl5OxN
z5lo^9gtEWEhe!kZz2nj9?=Yh|z&91L`8oi@q}G)n1}+Nx)ndTTU{zMrVs3HYtLn-C
z-3|@4T|Mhfo5f}cN88tgA3g5q+Zt9jZD9z!0v^5?P|>=9?lwbL0Dt|H@|JB}`wWT{
z5Ob{wV*a&I_kPB1$oEcHf(&b8?3kPzJE3r%qzzbWG;eXh5LxE?UL}jxpxeU-33zIP
z;2Sob4%rSEaEKJ+e>2F3QDsWp+E)dh7>oj*BXZhmt<v9?Ono&+Fz=wWYlh4zC!h(K
ztjbyl+obta0lHPZ*Me>{Ew*bhqxn7iho<klzgGkgnxV_dp`NZNMLV(CMEmpY)~ylQ
z0WQh4HqW}r|JaX8ncbvuEkW)NS%Qw$;9g1dy*j0t#3?P!uPp@xi~$i<<vlH~BmvP@
z2wnHt;@LBLvtu9YC^+M8gYBYy)FN_^@0;0)6#qFD9o_ESEgK3@t9nK2;48No&0aoV
zjfw3bBR@)pp#XTad&saQX?+i2E7ndW;9(rbYiWKIM+0&Unt2)x{NwL7V;x-OYh-Oq
z4=4e`DuAw`Wkb_*)0k4hBBS?Rf8eOfz1=EsZ;P+@u$JAs*1Z;v<>T`#YWH1O_>58)
zpJ@U?YuSvbr`K1$II(uifVYGJy7IdX-Idfkz#0kr`4EZ*+%G8L#eI-&@>a<Jg6jPW
zHr8Fj0X|8#T=rJkj)^S_0lR0oG4LD5BJFBK8lYbjZ>d_OqFAvJkt!|P=j9Jb1n&D?
zbw)HgN0h8}1Q|G0uvr#CltmFKGZ-_wj^04kFk{%wN4)dL+l<alvh@T9$$reDE~KQi
z?-s+nQCm?!K~1x&Xx_oyHO`=3uH)nKjTZT3M6DlYCOfvI+%RrDAZu1h7avu?eBw~0
z7~7@a8Rz8q%mfHOVNiv#m6{UTN@?XcV*}V11)$HS4l{{!S{D!8VGDJ+Cdu5g-ivjY
z6I=FHJmw-uxG-bDz>Qj_It*EhyGZXH&i%OZ3Y>n>|DaCo-B<rRq8`}T%6sV(fE8j?
z{Xm)4=HT4uB@hNCd8h&k8^$f)T-{$=iTcs-qwq&J+g0(M^RgorNda_i{_|F%r)VY)
z(+)E?VmE*a0y-!vHeZ<2hl~pE>pY#xnrfUH7#N5R8`-IkIGW+gB9m@u;-~}Pvf1n!
z1}rPxz1!n?z})$AjR@3DBD>9_-67}2ix)eMa~*+pKjY(NEsa^w0Dv%>4F$MWRabCV
zjKHm=m1S;wsjBW{sC#?OSHpV`FNeoyJWQh7m$5FZ{_wLE_PR5g!&=u%KWt&+tK2(t
zZ0*O1FH^@{jAR(Tk$*T05S9Nkc6_VK%Fd}I6T$Vn@>(2=IU9=`ic^WW;K+P&u^Xhp
zf)?CRj%G7W88G?0w<;dB`1VwK?|RhKnu4;0dHvw-&*1&!#qYC&_u@MHdh%{`?OWII
zQ_dUHIB8#=+`sEAV1bxrMOjXNpWWIkF;5jtJ-V~XdulUH25D`u26muVQkqp7&bIX^
z|3r}99uP+8oXRrYh>F~c1Xm5eTRh`ri~(hTddaNYcBc$GhKuC?E}8rrW+fyj_#1mA
z@?W1!3W^KjaR^%_9<9>?psPQzR;z2203`@8_Y9bFrif<nFK&<<&{gj;6u@0|Ei?VE
zm_Y#e)t}5D03pb~$Uy*D&c8rdKA#K$1eV=LH~_x_uveA?*1&W(0Dko+KL~(^`nMDz
z&|(x<KoS79`jaRGz-`@(XZt5ni0dEY+5RL7@&ETkApj*v3G!w<+e;KMMGnANS#Sm=
z0XQpu=Ns_VpIjjTYzjbB0a&U(NkgVTQ~h_mApm{~08Rn8CICD2a!!;zGzs7+`5$RR
z03g_(%pw0Jv>^ZvOvEw~pbYt6^M(95vaKTGW@Ovnd?5e|>;@?HPreZEo3U>HXHbUR
z)KLFj(!IDd?_qC<<@Ft6Z)M|<irg>-E$Gl_lGcc&=BwH}o0>f@b9Q+i7buT~E|#Zg
z=b%VsW_N8jebzpm+r8Po)hai1^wqTFBG<Q~e*b7Nh+#_jE!6@^8&{zFq3TM<&+nU`
z?o(tFyrsJgK2$xFA1So@zPfVW@n-gcK+~Nj@g`3%wk9!E)aKO(Dg@3cekE@9Jk0EI
zXp#^Qc`m>>@=I7JP+LD+zv+ALO65xbqfOcs(@00`homyL&C-nvi;bV)RR_CAjR^H-
zS)Da;bf3IQhT6%PaB=M0nEr7X8fC%JrL_|=vG=8s_i}vvQ^qanET|;9!%Cp#3)N5k
zF+VP<EBtC-IYkf45lYic#v%-X26~4V-s5jS9^1T~OJO(t@)N-?36uRt>wGhtd^3oX
z(s}8PvQ+v|wm=a^bs}_|l3eN&`8;KnH}o^KeZvXW>x!uRcv?h(r?<@SzYWjb$a~Bo
z*ynUgfYuvwZ{_;eTJoJ=XRK)6%+BgASLmE#Wjfvr_`g`1KF4uadZ7h0=faIG=r0Yb
z7O+0TtNvJAd;h|cpvyPSO~d2GaL!b|spb>Sh_m&mj^@e&Fq!;Cw$L;QMM+so^<`%l
z2FA3s*E-e{!D;D4$?X!?g+l)d+fDbz#en$(Y%P7z+`{dn=^Qk2_gA|pw0)nEm&X^c
zBgQRBFP;DKz#lgcR8Q<8pTx6wQ+}||Adm%-5rC70yfG5FMHB0drj<Rq^(xL(BDpYj
zph-WclDhsG(y@X~tAL(w+2<o~<E3p1Lu1pcRmMI`s+oRT)=-WP_;5#U%ZIc3n0M%T
z5S>00yS@}(f`Hw0nwQ>_iq&JrcuQU7cCIwXufRr6yBE@8iDyrb=ky~jCrom$ML|+(
z!c=CSD`MD5V=6rQv!1M*?D2@g?RM@!?eL8B9#Ea+VN&>4!_g-faUEDJ=i?E6xxZel
z^8r!|1%4cpTiVCBOLC*nR7qd9=YnkDC{5YnChL)=t{*=(JHcLeIbCiielB`<#+S0%
z`jO8Mk-h)(;4s2S-~Z`55(-u}l5+p!^z!UtKGrM06%L0xv@3i}3oUXqAwqxY#lFgZ
zj^XQ*q@X#*vaC0l)s+u@E>5p6<rStXH^h>%pKE-K=~H7;zt|BO;&NpDx&A=pA&I>K
zg&AlLvO;n1LC5_ok-ih*FVYcR4><z^<e@rceo<fNr+h<?dMWN#n8O@Tf^nRL^<0|4
z>8(~TTCJ96caoaheceUAiiypI2p#Ttg*cC^jQnzV$AWl1mbsvQJ#=bu!KDR5Pw>wA
z$Xrcu=eggv#<qnYFAzV@blzGR=AKDq7F?J*9`0;LCS$9Kwp$%W$e$0~J>maLIJ?rp
z8yWM`DB@N&g#@AXj{NyI^b4ZQadY?GOhywd&xI!6|0uzhBqH{I5vQXlahaJLk1Zs#
z(b{tlN22-IK>G+<rN3{MKjiZ8pg=lJ*w3}<Ioteo*$N3Ddq4r?5S?#pPiaGgRTd?b
zo@A)>5-Q-~>1Lk!jCd<r)s8d4h^lREh8hM=gv7p|(B~eL0dNn{q6fj3b5e1;>yC-H
z-FKBFI?sk8vX`bK?-STvfr=%AwT6G><d*OmKI98Dy;0{yV5@dca@sco=UYATMfNKK
zA9jp1IT@G8fEeD2Y~6x-O$-QQmfkZ~Ey%3yLzCqp=sM#Nph2s9SmQ08y*=1h(HdSI
zjQzyB;H^+44D++)27$X6D-o6hPpr@L+<yLbu7NGioF%|c7YI(8g8`{rB(=4VKjibX
zdL3Gr@HtNZu}*fJz-0khWpaEn;c=C~=nPAPEjHL?oyr#`mg6>+<bCo~aOz0I;&`r8
z0}Da6|8%}Ien!Y<V>qYBP9k^y?(y#Q<{OP7zJE#OqS)5s0K^zS$q`;7=}nk5=e^kM
zcR%ZXEnDw^AMO&h3Rx%daGRV!N%QlQQ?$MM<eql674==04pg=4?atbh#`#^+xLr>Q
z{E<%%pn-;?dU%go;{LAc9ad!;O9LnB<=^7DO%I4Cpa<)D*wQaofgEPI{MW3=d5mqv
z>I{VX(c@I&APEB7VbSMcrQOx=P^}<^lu}JmraD5h;Iov8VC)h$tuHvN0n|`mGh-Wc
zl~~!nOESh+wH&cNlb>i)$A3Ske|gDyHHdB4t0;6^Fsnx=tr6$4P1>s9{_d#Z=q|aP
zVmiDidCG5epHJSEAs)+tD{Cc2Tgs-#V7oEa;Mf4=UgKP>Al|G3GTjTC`t^7&Vvw_j
zX-N=Y$TR9W@9&NK32dB2U)#xD4$sfDe8l*pYB(709w>iGDt;SxD;4)@bG8dU{dLEw
z(#7%NQxp|NxQUMjCczfj;$*h|qN4C*QM{8?eqCzM+_K=vt6b+)y3vJHFrWNC7J|6h
zuunZ?bLRm%Dk2sq`{6BLX`5wN40y|fYE0v@GAfu6vyo3u4!tfWFw+L=B@1mkAWmN>
ze4i_%VUlh(+iaxOridd5GQLvmP(}reQpswkUXz%tsy$E5q`!s#kF~r4*76)zI4a$!
z?wyni<D0(h;(=l8x<?q=;>)&0g}NV#>X**G$%`=Ouq(Q1h>_^dMK3#ZaugU=I$|bE
z7p){xtn4%DTwQ+KSyHfC7^s_<{}TB6IRbm1(!4qH<hSFzA3V4Rua7i}$>E5QnRU7)
z$_YNj%CUl>5}+Or8@V0m)fL$J@U${Mqo+e(f^S6;=5h?Z-0mVI{{e2c^cH!oPp0y)
z+@eXrDEJG(!{Yt6wV6R}zj&f}0u=XGMaO5YpLh_Bd%mZI$HPKKYrCG+$|EfH8!zdv
zV`i6zk>AHdyw{l{PShzp(iD6n#(^=-R%7#z_<nr7-S9<^K+`1}F=Xs-Q2yD#De&tX
zOf4gBbeKwGAWzicJ#R{t+j1o;mo9G6!7dY&$|OsQQ@<5%Sz_ZvtG_&FFY-h@$FVGc
zm@D}(r}`Nta)@ynfj_gRhpiZSrbc)bydjOASZFBlfYg!I?Ox-OcRwBC>{Egk>WPWf
zc|SU)1d4rv_f;&(`M_)#*Rb5CO}0_Gsatep2*dsnH54^L`;TW%)A<IUPDkYQok)CE
ze3UArL^Ac(N-(oYREL-AY~NU=IZlcxpkYv=Bd4o*$ky0j)7u`ep+JW6Ix-xx8moA1
zp7*IKLgN{Fwsjo`tiKE;`hh8zaw-@58|~G!rz|)iJLJAfrk45dH02kdB46GZOjMel
z3wFoFV86CvKNu!ZwD^(Z7GPgO^+izu#4YJ&QSh9vqDaUvfo1il_@iskd-@y)l3d4c
zO9L7Q7kuIIdkOoWL+IAj1xq5=6jx_RrLGwJ4c*>Vwf;^|ZtUtUgG7aE`V&9h$#7}X
z<Z8mVvMJ*>VmUO){AIhnbkkrpsWGyrSC1Ul9+UgLU)({bK8fzUhatqi<Jk5%>ruy7
zLvmN>;e^?n5~FY35+rc3&@K38invpa8u7DMt7h;?b89#d#T(k0&0UHl2(K07Z5^Ca
zD)B5KAK4@MwiN}NnXZ*hbW(+?I;1JQh}@rSJ?UwPlz~kw(LO%eSTT=ytjg29KsqLB
zl+`tgx-4bx-3y6w`0O=pZMYCiKsQp(hkfeV{g;B=&G<7du|}``N;C<%qY<U%vx7jN
z8gOpsuF}>@ROF1s(<8pnLzN@-?UdndS?|~EzKPL%-93&fHEX6#JJf$?zWTi+$tS(o
z`@rj4pI>%%h)?tP?^5d#^rx<`uE{L?Ck>4SGop77-0qP7!?O<o8yTo9Mk<dr&iW9C
z-={|Tx)D79k8g>J<A5q6l-96xZbF({?kcQ9`j?2!cH3SU6HF}`E<eq095}sfn}2^8
z=tVIIhwM$z9`%_D$LHUj8IS^qWJ_`%Y;$(^2M)!U@j99P){q6kM&L#u<txMR+S#<0
z=CsGT#2F)~Q_NQa6VGlDOUt!bc9x~GoqrIGU8ls*;=L6w9Wp4vBX+D1=u%a7_-i{M
zJu1+8jH*tn8Ke^f2C^fJhdG;D+L%xq35nGGO7Q#G-;TsnZsQ~g?+U&`J58KLh5s@9
zA>pz62<i>Cp62=eLD|Y6TK~|7CsPK-!L|<AeFLZQXG_-2`ev;UpD!@0P0n7I@01!>
zKX?13zjAATVtcq|JkjWIP}l9YcK=Jse`KyhK;~MODjR3hYPlWz$nFUyu~s4YfG~`A
zi`J7>Fz#fuG$y0mFJk7C$&%)lAF(v2B62ORsLF$;^r;%*Tr{av86Os+zRXnVl^~rr
z2|;xa9rF>MU=)>m#m67m1)@XK{L!taH}M|p0{9uul?EKiRQbIZHG{?XGj&RprFsQB
zdtK29t11jc(u$jA_C?g$obr_u+=++L3{`#0?mTz;l95Z%&VVe18X2c<gCc7qO^4H?
z%5<PUPJ?b*$(<fbt)4z*^h|}gTENwYh~GQNAPel^unzR~Td3(!Y_ExR+-zhUi9;KA
z9ve#pnJ{z>rw@f9nI?I5fS<7yPT9BMGs|<e&L->7mQfxi1euPpuF9L5QYt2N?#>zy
zjHE<e8jcV?_Yp_z79rTDjU7Ad$QNSAf%LMOX4m(0gW()uB=)jg+4UF`ZM?^2CsEz7
zvEk%(M7c>{07c!^G;N9d?tQ0sB4=S#kRpQ6i*d$_tS`p(&7^pq$T4pN6o%kcELu5h
z*pl#y*Yzk(R=G>xMqf6ygcA4QuqB{_`;d!;_K@Y-WIE4a@gLb)WZ&serWcogW|G}K
zl4|>&E^oj0aqk+DE6M6`?cjA0?jNND?QL%Jy0XRTenG7|qSlFv(gTr~H+fQX2tPbE
zeINF4;{s<H&E6>P>8!s?<e0Meh3Sj5UvcaEsq6buq5Ieu!*bq(dpUN>&-x*s>%=7u
zCuRbuL+(IYRtkky$8c~2D_l!IESXbQMLs+%n%cQtt2{oiXh70vSlZ-bL-rvk%}dB0
zmhsZ)Csl0ev*fr>hZ9*>FuVc>gVzz-C(k~l(N6fBrmycW{E^xMIn6*&YkIBQ!JJaH
ze!Obh_J>*d0b0n39~TuD?U3_c=>CE|*_fhKbVEtz(`hrZZ@YJc<u11^WPUVpHcP|B
zKJb$iDye?E=$U#+S7R2G^GS1lJ=aS2SJKRHj}d$VWax3doa6B?GfP)0y83f2a6Z3q
zb^PkNKHytc%ACxh{{@F#BnI(v&)_zJgf`TdZw(?pt!meQ*SbOXHo3z$@%Eh>-KN@D
z_0Z9#oxQT$;WLxw=78cgE#uSQ;qo@UZ!kM#g;X=}xxK)4a4Q!*AtqDZ=luxSd3&xZ
z9_lWBA7p$dzx`)2AybCLY6)s!RCx$#!p8Of>(`)zI4X|dZ|H-eYYx)~-R)LG1S=#&
zyJn2cNxR!3kSuoB$NY#!KE(3krUy{R*8}#8t0BS4S9S8LS`RNKD%-5O{=W2E&jP}d
z(wJ?D?eom7U9M(MV8|yyNmq5{mz+mmwnI8iqY3VOW#Q6cQS5$%5#ytTG~BX(m=^Pe
zGQRFv&#MvmE~2Qmmw)L@Db~5P6YaPC()$N*#)W-e1*5%QQJ2{-VYuAZQ+GuFDUOB%
z+!Cq(3}f2Ghg!?y%2?dF3|XTnQFIl&3;#qgXI#W5NTvsJ!a+mQrP2maZR*XHlQ<cj
zNu!a;US<=O2aR7sD{o8*h+N>49NAwdmE-&^T8(;Vxt~<8Z4TqYjUdIr7?1MJE`G7f
zhZlC|Fucm-OGwM67u{y-^V*b8sDG?i;`q@$pMVU$gd1OU%paMINdfm8ReDI0G9H$G
zL4d{@Ap5$omY^X@nqDe0lMV00Joxv*EPV&}=*WCuf6P`Ok)yK+`?>z?oy6f?=f|+t
zN-B=rz0WK{<Czb&yK{sMx=joV`@_+$&X3uZjHE7pN^h&0U>On46jdg4xN$TrbFC_4
zT*6j95<LjbE|%bFK|CFv;etJZDr!B;u)qGTCDXKkmb5@bLxj!@4r5m~`57O0H`5vv
zrU_$Q%&`}qxhOfgYHTcg;N*UvFark1JhzvhTh^BPIlw?lGwAvuk2L2#p10)(FV0v)
zjJ^tFepbwGg9`#5p(r5Uu!Hi2ZIx=+{i8TN0D>1fw$EX0Cm4qTkFRyN=Hr(<yVnzm
z;W+45Gq0Xft~uR-iAM&EPQC0O?bCXtU=ymDwQEX9%c<rHHHuE0$n+KDlhV)E$Tm^Q
zW)<kZs+imikO1ntAy&n_F_in2Q>uxxhg&owm@Zb-{I4wJf+)ywenR$6prw~{-ss1>
z?e)Lv8jVlf@}7?S{JdVSG$p81KBy`$D70bs351Q$`-@-3PFJ$AY~c`(#7b*6;t484
z6T&99Pk~8*TB&l68MEwliFSI`6t55~T(spC<qgW&En(4vB$*`WPV0X?^hSXIaV|zj
zQeYl{fALg(?Z`na1+hyC(;En(AlX@y>2rpfw*(6tsC*x6$IHObAC_mvJPF%Rh#S(t
zEy?e8KGwI4t>sXT6Cp{Gx?rLR@nrnwMK;$<eJ*CO_eg7_iht>_oH=bF*ssd&cZ1;~
zxw$=!4@yYDX-WG2txA=hnI(CMAS6eIn6gs=dby2W6`i&VRG)9^yu-;JacqB(y?8=8
z+L`0~bM_}$pip^N3*AE+P{oK=vM)Pn66FPZqd$}HXC^vY`vp0+zLiS5c=_q_jhFvu
z2RH&xbS=)YN{M}jS+g6<RtaKR!lID!`-C~P@g2TfRK7AgTI%#_$+b0Oh=GJ@i=~G2
zb6Yp4mmK})uv?~t@u($qtPy=XhEy5Z+NZs>)rD-2-_K|r@!XN19;IQ>YMHP8D6#Q(
z_i0!9V&*#eL~D#Q4c$_WP?1=;ZL=2bwE)NQwmc{D>okU%h?c*7ampmW|L02XK4OZT
zsjCN?wZWWi3~z`8tZ{7J5M*+p>6%tkYVNgFud`md)Ra+YHH}}7AM}bE#r@29@<Tu7
z>T0F;w~1^5J(~+Fc>xVP0rcawyHQ6L=?s05V*m{he9;)EuWkF7T+DwUAr*JSpJ@7I
z0|A2@n>>XxHwaG*7}bWgRb@BR(+`?BT6p{Tgeb}vWf8deU;V(y+D1_H1{JiHpktNb
zi^pFL`q?TuR^I=e=RF4UN+jt9`qp{6*ZCP^8Wy$j)_kRr3~@@k{<8N*_{`VhERU8l
zPRXBdOiR8F;D(0K{~RrUgxeqEPK78ti@gJvH+m;WKEdBY)9^%@MEghKj9&z*I81U&
zK-5jM>kS(fju^%uJ^c3*Z+aBRdLbf^@e$-Ftgx4BFk{rh6D1xEQ#q0twuEUW!fcql
zqhX21I^Lb^y8~S2bjA*FPh#ovP!0vL%E?=CiW+g<1u{8a2_IK)pEl`7b~VfHhV)-;
zNo{K7J|%FjDZdnw=$PSqc<Z;5ZC?k1A;t?o!wep`D{0p8H2jFi>0^eg__hw7_-Bz=
zi^oj(4W~PbMABlMHG-KLH<z|R-$}<Zc<!WFy`veSrqvOxCN;seW6S;~*{=1W&u03&
zRm=FfyA&c-vi6vpaHKNjCr@vv`X3pze6Jird>>GuqXvY-N-TF%0qTG>PLTv1*KG9t
z>Qr8i#E`GI`2eYF%Q?*hG}iK-?O|PL!Bw2ghn-cmRn05w3fqwhPx?X(+iBZqooBD8
zB20^X=yWY!9DIICOo#{~cKAn_Ujuwyl<3#GEen~zWvs0$F)loC@$>B4TaQ|Pd}N5y
zX9uwd`0tgRv`Bb$=f%VFnO^;Dv2u77LQ~QgjN6~Bj2dNQ^OarNXb@CH<?LIJUzPTJ
zu3WClT7RF_Q~QGWMa5C|!eY}xXy_lE#Wl}^T&gzlQkb8S<za=qc4LDs({@NWRw%FA
z?qlux047@V#Mnz4?`cj7CTlP!Rf1bMrPPGdB53CnyU65|8tdGEzUCb^#XH)(>V|uM
z^sL$1B`qb{z9~B#a#R#m3pwz8%Xfcw?d@O|M~}b0pW5*l(SOw>A<*6mE?yGodjDAq
zZ0z&WE$o(Ue>F``-;DnKp~AGZ(e1|d?7lrJ`v5&+5!T`&aN~YU*tSP{sg%C&t9Cj~
znVr+8ZWoEad~~k<YRa|#jQ*AL!*PZ-qT;?^NtvBoyqmC?taysX(ejyXr1@sn(B;=>
z2+Ef^xv_-qH1$8=9EAk5er;oU<@=g6VKp^R3SR|0{S1m<7|vIN!*Sh-O)GuSx@RWd
z2qKw2k0=_v(<>SO!)e|kyI6pCyshn@SsKX9V3u!q9}$aQj9p}${`^v7gskRGW^zMy
zZMS;nSaRk1{a^UoK^1EmTR1rQ)-^wW$updML7l&QTYn-w-1Pk;=PRSf=Z;$D2e{03
zwHaE(Z)h2NWvA}R-5cbht>$vuaA~IbqlM~tnj?#7+slzehgZkILIP8?)2@OJBRbSc
z+3-RHQ;fdi@H#Vm6*%udt{b>KY+5z&ud(9L)mQbAd`FiT3CTInaJq;ddMS*tVBr-X
z&2o305q+MwldqU&&E;DpW!$yu<XyS;&5YeGUZ14h-<8P09iZy*QA3+5J9Mt0AQ<Cz
zwJXgvvo$IwyAS$O=ad{#USrPVyR=Bb*y0@4{-W2}#(lVbej`Nr`Qz;@##H!#g(o(H
zTF?cfs<8(;n?bk6c(Li#&&*4!{p|ayUUBmzeUcTbkDbOB4d4Ivohpk<Utf?(Z9RIL
zSQD3;nj0&Wy_&~manT^3u9lCEJEu>S>HlqHl%9Mpx+6)_r;dk9cu}OO8)@=-HM=Y{
z-A5=<Yi3e{Ab!@S8~_M_fDQ|}z?8P{D|YUvydn4R<>j4R&cB0SIS`731CAsk<lHb2
z3AZLwi3kMu^+)m<BB?E?IP&5qx1wY}$8`_;4+!!IgvV#Ic1#lr&@3zI!S7f^d9cmp
z4AvDkWq-B}e#~SC$E{kP>9Oe@Vzd51#9}=?@#%R0rT_b#fu`{F{r&ZQ(LYMbCI8*M
z#cOojqG6SPcZU5p_EG$wfJo8*r)SuLVvPL2k)ETIAEPjE7S6BW>E`L9?`3Uk&uGrb
zujXNAA82pK$ggN0;B0HJrvhUX5(NN}SDUQRl*EfoX5d5_CLblO8-KJ;r-*KJuui+X
zP6M!qY_C(RLVZ~ylNj=2<kVw<18yZu<Ha>f#<YaFH7XS%JAm$EWR-SkmF~kTgDM-M
zYni!YnYDeHjq!29U0AdV#I|OUS3wR{waCwkOj04VE}a)qrEq>ZFUE>W%9)kUnw3$;
zF_Tw{Nt?c#GOeH_8UamCjGa_f1<sdMS^T3W)mWmE7@j0VjB7p|*AlWzk}^nmFsiF8
z5{?+vR~8EM`ef`jWad0%uF4u<|IyO+<9#0AB+CIC;KW;5AWYCP$)w-jpw~&S*IBFE
zRnQ?xz0+N_(?f+nR9X0;l6ZvTJ1>Uxc-Y-2fQkcPHo0LZ(TtPPj+1WnXLuGbX_z3<
zj1V_Z6oV&<HU^1UCkopp3fU(K)&~nXC-J)`@zsX#dIN+RVch;nz&ZS%BQ`>T5gQR~
zuOnE?AF)IyF_%R$m7t(6QH+IAz|au-oY+54&XZKQ9!QubC`uz0r6K{iz#Y|ChKzWC
z0EIawi7PNk*}?-3oTr~`FdlEvtCBhb1S0ESs2DQiK7XOK;0#UzMq|u;rkearJ@%PK
z#lpwx{R*SFSwim$l;L@tDy0i^Tw=?T1xM481!w&dw<@_4aN_=IK}eOs3*aF6`_Mfu
zZ%&daF)?FC?&*wt(v(vClrq3y!ta)ZoVXV<renbolBB{Ltitoaf5d<(A<=il$Ya<<
z8DwE`!+^s6Fp1AIN%VfADvi6<2P;{vI17vSwr20`6l9S`eU7j@D4iY`jV?D;fN({H
zFGRV+Q%T|xaP-fR8w(K6+*OR0SB|;U<}0TWC)?%+O-hv3i<fE%kTgn=Fi8+^3KX-j
zNEEe96ln+&wn-Ffcp&JMB;b<7Ul+pXk;GdQ`uA{;hZdX<k^q23ID2>!+oL4bibpK3
zA{k!9FqI+!*aKrx6hlEYFnI);nxH~rf5UC!odj^3C}ElMdL;q;FbsJyB36kqI`N8<
zk^i-@*&FkOIs5tQ*!w7Wx_fzg*n9XfN-)aF;qhzOdpP<zF$xOY;8y<I1ANqb;|UNZ
zW%%m!(i2%cg5XcZsp<nu<|oB0&bp-ricbb>PM3hn=Op)OO`+N<?dbvH=+3j-EF9H`
zWrvxE%@C&M6g^eeA|e<**;_~y_%?_N1<6FEb{Tg~!(!ZE0nq5fM2Jm7%Dq6<KogMQ
z-7}*ztw2T4QHFq82G17?JUnPISQym>BZBt0StkJ+0YzqT50a>Z*O3q~iX8>;2*F|;
zQE^>D)+ilQP_<s5Rw+{jIjoJbjl&IMNem0&cO!lUHb+84k<Yut^3x$UtvV{D+`Gio
zc+fD&bI=7U5*Cx*MU-FfWdR!1l3>jylEQ@!gW;$bsC`(>ebh8E9>x#tq3I&aZ}c+U
zVn#OcwXt6E9h1QpAWP&Pcn2Wp82B1IjckX-AW(OZR9z;}9s%o=5p^dP79yAo)Q;E(
zjNAVL#+3iWOBEz|&x9`l(g%hvQOJ=mk$wO}@o<yDUy&bST}O>xY9`FPM6fnK9`d)O
zVI;6N_7J9HQcH5!F@z6fh`Nu2T!R*o^Ic}E?9d(&>xdC033lWbPd1q)kqa0qg{KXs
zLjn_uPrB%=bG-CGqec?YIwEE86$;XiEbJ=p5{AW0bXh|)0S=W>*bIjV1tAD31R6p{
z!1SR#a`_pDg()gdJV;e8H!^xMF)&mPB1gK9+lqn^ARoi9^4~%V9_wh9vhR|@c!<*R
zu8=}qgg~jj8kAp=VhBn#Iy25-(jbEkQcQsvaMzF!EM#mKWR)MPNDh6IqD{$q$u5Wu
zE=Lx0@x~tIrNAf|Ptln8x6b}uNctN=B_=3x^WQh@RzhO`8zPb@9>?W%(M1l<`BnbU
zkD_N6&riqYPo|ZB{Cs@8YV`d_)X`DUp(o>>Gb=Fl_jp<Vt2OuK3!Du&|Hr#(XP=~w
z4*XXP#g_HO7j>mBD~YG?-T9e>JEEj?5=MId1gBca?ERg4eX^R}(%Mhi9N$UmwTT-v
ziyAeG8rKP%o(+jt37VJlTOKcJ7xP*j?RjHjkmgu$+GPQs%L<|lc87~L=y4F`&jbsP
z$E;2%tWLUwZopXJ1ZL-Gs4EHz3<P#NaAOXkbALeRevyUkPvc=j>hUuk>`mq2N#*fl
z{$`Y}J(-6cnTIur$9)nHGa`@6SGO-(7=XdR2Dja{EqvTGfsY#4MFs5gZQB_b3@nRl
zkB*N2J&;Ng*H!}8<{}eY4A=VSfY4biJ}=mm8*KbzRt=aFY-qs&*2lyk2IH_4aN9`Z
z+Fh1f_*^v60h5Bsz~Vnb$soAAgt*-2k8vzKaF{??bU0Wv-?r@6Ooh?WEIiQAKvej0
zmvxjEZ<){gcz<5zTs*@*IZr=6OZt8i_wD%6(XRV}2Xx<sWyisSW6O$n(~@u9!a@L;
zA-rlNx}+yDuOmIDC39JfKcgXc(LnvPpMO&Q?u07rESeA)COimJ4W)M<Q&t3q34hzL
z{%kA)+=b|n(iO7suxyvm2d+e1zO?XY5HXq6ls!Y;KABW_EdU=^Q7GfHEakiZeI5Ri
z$EuLWI*-ft1(z);Sme0{hrJ7h$9WG|8k^%qI`%0N6365c!{h=CJ4Q0PK4NrxNbgoD
zU}14th#N@jj-Yklv9sXxqxSHj_DE)N1};u~51?@-2bPWPNbd1{&FsjR4o(b=7bf<&
ztRXjsc${}xaQq0S*tX@;BXs{DuYUT7SOeenJO!kV@A~aqsFH<;v!aEE6AbvsTX;BL
z=7ZcQJwz-#?muI95WJaF%x~dgemW}4hOf(lug#3FapcVa#aCy*SEa{SqQzIB!M}T1
zMM{Y;GpwL;-oZv};UPq1;URDmPI5E8m=hnwhKtQ$3h}_kq{70as1-89K!>2C6QbS1
zx^)Zl|NAI)lbQYxQR)^5lT?0``!U>fmMi#RM4;e35SMtFmBxoT@CfXa3wGO8j82xg
zTMLvF42~Zzt89MnxNgx7yr;^74}r-r;*(<Is-Yl}s5F=m^tBG)rxl%8+L$y*VS{7=
zxN1lPSPVLhEFZW-2RcG|z4J0vWk$Z|W+AmC?ZfrNgQnx*AZfa2U@^on_xvmYBhXPx
zmG+tGdqyM&+XQh7-T@fu0HQ(qb}7Knp^8fRFAp24EI_G-TfDRsLby<M+^49iE)`hJ
zClpzi?kWQCn5(R-c{+MdY{(hD3i1H(G8p<8tbp?A5`Ze=L0=vw9o9oWryS-9SWrTd
zfhLrk3B;CUFb(1*vN7DRC_p2VL4_#6E*@wP4oum)?Jyr=lXO^?VtNL=fB9i-ikSox
z@;zS&n+%r$89fP1gS;3diFAg=WOw;NpQV_C1ohuDU-H_Kz`l@7fooBhuo!;S8|0%d
z8EYU2)K<xxaF7zgNXf{-y(lm&rXOYBMFMk%_88??92QmSfvVL5)dS5;m@CL&GRzeu
zY@l@%gbd&=V_P+a_BdF_A7&r6L2R-PUsoxfDTAu@1Mily831t_>H-P|0;wjn=YCgM
zev*zc$lHX2d4gmc3{ApiM`FVipgo+cbzaI6+#=*K5uz5*5Q-cYW7HL7{mM%h<gMn!
zTt_wsghG%pvb+lci(x>zcKNTW+{8=QE`AsyKN@0_>ZO0Cxy6axV!ec3a{3X&j)^>Q
z`N5$mNFz!bW}RPnnA~$_?8J3Ua(*v?t_!}Jdx;}1RT=p2;?&<&l9=G{f%M}48{*V|
zDyRQcPXDQ#{?DnLZgSKAAtwE&a{5o@^uN7w`nyW{XXPaEpNRCIUfzFtdH=ua<=teV
z|7}FFfA2^NL8p`-Eg36%?DPz#>~z4&OP~bJ&u_1*FF9FC3t*}f;ZVOP;;g*~*Bh<$
zJ->c?@%<4i1RD&E0x6(+V0utRAt>sPnuC(Hh<ps>jH-skcy|Rtb5blpsdqCtG{}K+
zMhI+*<VOM3#8+6rs;PA`#3nsOKT!8f{mcw>RFiTqgFl2D8L0W5H-tTeANii0l$0D-
z2?<d`^}=xTpFnIft6+ifGhGg5WT1ix=Mxg3Nj3!{L)CXlK^4iYBXtY|?}3i8bTnsJ
z+IW$HDl<H7>~0it5ZEQ_F7Y-f7zO!(!hk8PRzW^{=9hU{I6;vToOQ&*Aa^8W6Bz&t
zUM(283)Bi{8fPk7EXXD%Kk{E>Eg)zm9vt<g3l8nEx6T^TY+^%Zuxk)018uGrSj;I3
z3A0{RgDM(9d;C|4po*5(jfaUq4JW942HS!HHKZRY9xgvXC7KL|@`0egD2BmMBV2P-
zLl-f$$7!`<1Ww6;bmDE}4B^TqhZ#V$aK(}7UGC7HPhGgyl~p>RQ40w+07HQX<pNKl
z*kFQCMcdVw5!EJk<e8ELiwJ}e?*$0ThTD$3>XL&h%H}tvSj+$$WYEMP!gI-mJX4+F
zEFzX8g@y1<kpCjJBntpRYjEq4ie1W3MMCTL5p$q*8OZ2Hv_$p|1XafqMUBB&p^5~n
zw^wnj%OC|MDfiFd?>U~3!AK#w<n$yScu)thFA}TE<^O8$T4SpyqHr`O?!7=*v850n
z>_VRuduL|f*brSxgS>iyhBgK@TY3vs<hJDkRy0P~t5;%z;14w+Y7rG5JVFtLXc{*J
zjUf>TQ51r?{Y89Hqk{fGJyY0v?@Ud~k3tit|2m!BIdjhJ`R07*%v7y;%6qqO1DYw}
zd4JSFTvyvv9h)crEN%2(D?U;g+?9=}&mBHjIrfIH*PfFG3zEWs$i&6~nHT;O_3COR
zR^Qo{P-2aBO%ErQrIgs>HBG7hmir#{mct(!TAL|5ef8-jLFNfEPmp;do6MtIQx>Kg
zE|Yn4%PYV5eBSKlB^P#<YyLAo9wpuD>RS^2*1OUNwtSM<9REgJe|~<&rSI0w7~AM}
zZI&l*>3h2Gb>O;sr>O57t2<TZ&o13j7?m!izjZUagPXEtUboz<W<B+__<hpxd9x=!
zQCU3R-6o%qI{lk{IXUVL|6=-JFv-ol=O(-M#%D^$YbR9vHts+~t%^+am!})j@~-rk
ze$p>=Gd=!E_r|Vm$G~+ryc}yToE}v#NU!+Y-A-`b-hT8zqvD?`IV10r&PUY03N}f<
z`@aWG>fvNCQ9X$6k$%~L;<MEq1@7o^OCqP!z%YIqd=^Xz%G^v{dR0*4WnNeyZFz9Q
z)augFx4NT?-il1|pQjXI%s-!QcQZ$Wmx4m?dAWC?_x20(C&a2%f9JI3qSDBVY1v6v
z1TWGQ+tOfhP_KR{_fE>TXIs64a_`;hp1zHc=y^!`r5nv$QE?O~&T-Mmmr{?Uz6$u`
z_?>R1$!+&`#TQ8n=QNg28#iZE!k6dzZw9{xL_OS?oz?X|aD2ccZruwUpTAS7FZe3*
zY+7FJj|ob<HuY_idlOyn0zOanPfe{a`dR7$VlVoEe}@~PG~5rtDsPY6J0?5d>uI~k
zF8A%?k4sM8a(_hqe$*JhHh^4TLx8g%9jlR!*RQDBFE5Cy3nFi)y8}l(+?n0bw(wlV
z((x`3eUa|;BW~sgcYW8!w#8EW+{YTu6`vXJrp6zV)}?z&YVXb7k$tsqPrRWiRrI)Y
zTl(+fBTxQ0>5~TwmJbF~VU&~uQyLPHlZc!|<n+Iaoaok+g(ML<iOA_XL{4FplnY7W
z^@YP3If?X=NH2->(uhefVY&^?hotLVnCBK0481T<-o9_|&<pciy+9P^UH8JgLqA;{
ztl*)4CDLlVob-|w-hnoph$Of?!Q}}qZ$xu>nEywafKu17Fi$;Oa217lnVa097v=$b
zC<^mNLSf#{OS@MLLgw|a#mhJ~P?)EM=bVNUr$po=A}0|!jhx7d|3?5KauP?HhVw|%
ze??AVl$0Ae=_0)((n}(}^nXe(Vg8nEQJ8lv3iH%Ei-ug7=Vnd^LoduzXWViXg?a9e
z^0h9^n||W#gu#NOFd)iJFNG(XhBHVKWS$`N1erIo$vnC>%}+TcLNZSj<_%+Eo;<my
zZ|H@2>KD?`3-jdO!tBrs^Q89pH7?96U3q)aU@#R%Nx3i;9&;K_m=au`;PM2QH*&Z<
z{^AD_If=+=SdTRQSL75%NjZ=d@_YXxQXGyityW@lTbozI6?j+DqYo%>Gu|4wdkfRM
zx31i6gyD1(QfR)4K0UJ|;iZxtO8I;*)wVL3TG`s9tktS8s&b|&D^jVp)zf3KM+g2^
zmF!qv5sk$=lFe(DCGsC@Yi?1Ryk(ETIN>XxYySYP$yGI8Dxs9uOect#$RHLW*wD;M
zM9L5<tH_b>v5rJb6u}g%C>r=tOvBI&r9~NNqqCqt%Bst47~4AZ$ZJD{7_^Ecw;ydY
zAQ)xZOapYvwpoMpb6|&%*AIR%*>Mrlxc4CoIqVn+5d=p8^51763$ojJZA3!`+omCm
zpk_0#pQbwoE1ymr?pfU-oL&r_a59?&48@FLI#_3Pk1S%F?6@{EZB{<pGIe&o4k9+I
zKgY%<J732E1Lw<v5jJ!<@t3Ouj5I=+apAT(2Q%})$b=7yeby!pBOfT)v6(f5;Ty7<
z`C_bTCZiXO4H%gj1Dh77XJi{XBMU;dMvsK#&J7{Uu^IUgatu~x=!e<)LL1@MGqMbu
z(F?3dht(;xSvo5VL70D*fViy8j%o01w$0cLRx{$p00VRL1p`y}mZujmFgG_0N?`1P
zz;K*S!ARV<0M3MP@?pndZG;IpGgcO&BfcMRUrcOvZ6FM{nR0W}OpRGX(9h<+eXN7B
zSXp$9*QstGPA}jPxOu?Z<@y=e;rnU4EQZOCYuMbH#3thW0X8*$zNXIkUHFbLXCu?m
zIsL&^v&^@Outgm1S<9lAQs%EK%jR`p6J9=BV|@-7gCZ95KHK5v>+n7nmKx@4?wG6}
zLfC;9GGl1qIoNdoxIimX^5zD(z<mqgCOMxCxS+8*1zg}T1#p3|^95XBeKrDIFj?IL
zF3>9%^W+0uFj<)a7dYL6dnSwzqqxAnkKzK0wcs{vhnXATg2Cz(BX9?d%oG<4#zqtu
zSeYp<u)dw*0%2?fk6Nsr>7E8N_N8r3j-FE;UhB$4NB?GSaqHs=x^Yrsi;_vY>!Y+9
gT!-9}gjUdRNV0hyss3FSybJbK(UOu`b+yrd0Fb4<kpKVy

literal 0
HcmV?d00001

diff --git a/plot_fig4_topology.py b/plot_fig4_topology.py
index 73cb4df..1576275 100644
--- a/plot_fig4_topology.py
+++ b/plot_fig4_topology.py
@@ -15,7 +15,7 @@
 
 Usage:
     conda run -n pidm python plot_fig4_topology.py
-    conda run -n pidm python plot_fig4_topology.py --compare --output fig4_comparison.pdf
+    conda run -n pidm python plot_fig4_topology.py --compare --output fig4.pdf
     conda run -n pidm python plot_fig4_topology.py --results-dir results/reproduced/topology/PIDM/test_level_2 --n-samples 4 --output fig4_PIDM.pdf
 """
 

From f729ea0ab26658dfd1c85552d527bccdf74032d8 Mon Sep 17 00:00:00 2001
From: dimanaStoyanova7 <stoyanovadimana557@gmail.com>
Date: Thu, 28 May 2026 10:08:45 +0200
Subject: [PATCH 08/12] updated fig. 4

---
 images/fig4_topology.pdf | Bin 93067 -> 117687 bytes
 plot_fig4_topology.py    |   8 ----
 plot_fig8_darcy.py       |  80 ++++++++++++++++++++++++---------------
 3 files changed, 50 insertions(+), 38 deletions(-)

diff --git a/images/fig4_topology.pdf b/images/fig4_topology.pdf
index b549b8ac8ee97a82e790c85686dc37c4ddae21a4..765bcdff69afa95b0dcb53e9ec776e2e9bf96d2d 100644
GIT binary patch
delta 95332
zcmb@tbzD_n(>F{?qog#44vCY5ASvD5-Q6u5K<N<Jpp>Kn3Mi#Wr&1CsNJ}XQNQr`!
zy!#-(`?~J?y`SrS{&=^a!`WxAwP$9{%v$R^v&N)J{Kkg_HFVh2Ft`u`B_@u5LPb$<
z2uegm2n7WMuwBtx7PG00eH7tqM(@-jX_h^Ho&8uO7^=gUfLfa|uCWnEr`#U6k=F9S
zDC1ElYvD$dztN#TfcUA+!bn^5q0V?>@?)HVQ*3G6{l*=y0<Vtn9~DPG*H>-s{5p;3
z$(`KYe^xx~_WS6m%`nyPke9`~t{t#ss^TiDUDr5EzUqV$bn=aw4__t@^M;3pd$fuY
z!s0{frj=D6k3Xl-q*A33+Y((=rK_KMouuf(_x^3eTQ-K-8KKX}mDp-LR;kndl~+ef
zezTIN_fBd%C70HCq|3N1qC}-S*WZr5KJl3Qu^+y_OY%vw-K~B4&c{}I27GA;!Rv_<
zL~eA)ovS=KldEX5Dp3z1zSj&&j~go$jg=Z!-Uhu4@qc;ro%pRnanQ%q8-G@neu%f+
zX$=oQn{O$fY&?7@z2LvXa6+<NaV?*?1NCGqs8KY3#>O((9>>u$g*E4%6_?+#C_Mvf
z?AttHiFisPl6+5VA{(wb_kstJjl#HB^LaR~AHC(?*wU4Lh$iY+DV9S{Yz6X`RHgYy
zvqX$AD&|!_+{$SStvzz`+xxzJJbjm7xFfex_$-3UtP;QYU2ug;<+0D32ktXtD_dv7
zm9yL;6CO{<%v>1R;$dZsIvoJh&X>}b`J^G%jt<6Gbvy*>Hyd~!k$p_;EV)^hVX*dr
z0vFA-$}F<NrHD>RcJ5*Q{9B4fadhqeFzio7;MfO3t9(VVtb4xYoLk3c^betAd5gW!
z)?ZYr_%Sr*T?s<VepWr@YsDsFTDZ_R<6&Y6_Sp^hRJI0+=bx^e?h5YqBn3^jtj?m*
zzXqH}g+faR3!uDTlMS2avxHVlSDEj!rqa8r-%zA<qYFT*jS(O6lxUdmx{`d8Bg{1p
z>Q6L6zS4f2xho>0vxm@DeR=nRZtrp?`)e*!-rpa8HNsVwBGtF&Kza03>7yL<yVeC|
z{j8$O)(Yu=YtF$Q>YGU?s9FcbXJ{fyXP9qla%pw^-q>`MYcFP!W%PyfD034{ei+D%
zep25{^e7h{G?kypQ=85%+<QpBazNUuy;bxTze!A3nTznDI{ggD&oXUXwuT|LF~YK<
zxF-3Am2>89(~G5#1n;^-7$Vn;KliAdE;ha;#vhv68sAW*;1b}3jIY~IBd^Q2N!D(s
z(Fkj}7x$Abc@PIgOX7;^OE@>l3XYHs(%C-IF$_STRVOoMrr{a;(tSQ|Do*Z%KU<`G
zP}KB7hH7qYQNpM1v9`w<r>1s3wkKCZ$t?46X(sDkv0jvR#ZYgt^KDArYaH*rgKO{-
zJz!mQs9RQe^GwvTc0+<5-w=sK=6)r&?pED{l@JoUz|!!|U?!PRLpgF<*`(li`8;;l
zNy>`R385`KiACCpx@tv_#rPxtl=DZbD%&)jN9s1Sz8@q1nI^Ko?ljyt%*CO8{<V}l
zO>JjY&t`}WFeGM_gJ5wN`FVDo2t}#J+}$vBbxUGojdx(mKQz5fMx#G6Znk%Y!-U8S
z_Mm*s(-v0QtCPcYGw<2zMm4=%j^AdrTWPgA+RH*Z$Uxh;%ivj~p>>|#XMubt96{Uq
z(5vO^)t{`iQKpC2i8C1}GDav_3fCH_<@p|FFP5zr1|R6`b^%JyD010!vsINO0iK7_
z%M;`?9G;`q=;vGUPRDD<_k%J1!FB9JUn9=?t}}@LVM)D($Jy;Oy=&|C*S^=A_q?b@
z`!Lk0p=;z-efHMxu5SFg;(FDsLGNtvZlA)(_AWL*orX&1V^Jy31?^tfHw0f-tRpvC
z(o~(Vh&lBzKBnz*rD#2PtMsz$S?Tff!Yif8uG5wq2O$qjw=!o?lw{hnEvhH&R<b!{
zCYfGeo4qVe1e@`{FZ^x_?{Rx5M`*_!Q-x;p2%n1jN}D@k>1>izv&E<s!lDwS!hG$C
z#2v~Sy!cHGPC8n(5q)3Fg3U_i2J@YfYL^!&n+T1tGjl6>8+xOsWfoB$EKriQ9KuxI
zj?X<Vxgu2eRP4eu!d%0TjEEu;F*te%99EVY;;%n&^lIes%XW;tySSY8N#3<iS{b0N
z6{oLx>1UGdNwIBFcwG6wr{<oSFgH}M^YZR?flR0;eYl5z=D@ej@=`e7P>rhnPq;1O
zP#jCkAgEV<;*%Eee(Cqg&~{bFHlqF+wO-|*?6zG7g%hGlm?6DtxXJ1EgZ`N*k&Ksi
zH`In^YQJtX74ENEa-YVKw&ij#1$YRfWt5#A+sYg9>L~qdo?GDAuS(Ll8slEo7@xhh
z-fPO<k{E5Gm?@(4W@|0Lhmk?Md0uD4Lb{IQh`?GV^QT8P-P-t=acu0*9u{?Jv0bf*
zU+#77kA5|0wx@_P3<L*P)-uHh(j>)k)eU}Go6biWEsQ+f{4PrUBBcW!6?VpHh>o(s
zH-6e_(d97`ULRS&w;caz<CXxMx8I9rj>-PKG)w#Vo{}dO-<AeAOs)-IQ;C0qC|DmI
zD%^7=n5UOMVQzPmSjp*b`-8BIwWc>r=(bRF*Ca$>6%a3f^ENWGl3N<7Pmzx8-uk2e
zS~|H~!|BGHio&%RNzk^Ccr`6fRy1wpsD7kn!S_mLe|z-7?5jz|gPh*Bh`JYDHKbMg
z%g+}@u4d!^RHstPx7t~{oiKZizl!Pku(|+DSls9Ieh7(y{?A=01%<0#R2lg1Eg?j;
zy^1+lZIX-z65po2eHTr9k&*(B2|IJw|1bGgr3e<ELQ<V8W{xR|(T8(&zCXhCbU5$P
zJ2qR@u!YYaRhe=A5P{Q-Z?z{pVKt{<*w)+?-<dwR;br9KUs_j9O_9d@;&6<%#-LN3
z-|fCmcC%*hjUS|Y6CzseI%e2O{6YGI5jt6QF&xnnD-J$`Cv40*b@bjzxj|fyS{C}U
ze%@Xpnav}-V{<p1#skgmTHLG3krl!sK5SG=m3s5UVrG;5nR>V7EwilmMvD5+tsZvf
z>dcY4mv6^+JgXKiHkU7h*%smQ#cG%HPTH&*Pm)mGS46haS>F7>p%b#iVd2&x@xiI%
zMwo@tO}#23^y8%d8_Rq^B?)v`^W0vYXXKl}q^Xong`;uB2#|nY(5`qsIAW0VQw#s3
z(Xi&tQr^-U-xTauU$dncOMjx;(3D(l^Sd`+V^lgmMJOFRb=(TGcwERgS;=!oe4H3R
z=&(s?j5ws9(wwI_#2CD$z*NODIxmmMnB?e$s;Y;@MqJok2U(I5zr^)}-erIU(5gP$
z9!PZRpbxY70-%W|DtQXoe<TJE>Tlqv>#eP4YvxmIj+<J_6&9FC!Vxcn$N#ios~$7n
z6yQh`3etn+*KDuex1MLKyvNHG>gJ4Xb`mGXI#I|>F~9Wluv&Hc_oq`2%U#tXyJ@?|
zJDhwvN>}Y&6e9{;Uk~69`|T4RER}zWYJ3~;{w#(6$}3iM-K!1DPL@S7XM*@x$Rd>j
z=`|Ah_)kRg*GMzI$>S~(5JYx}U&H+I_Qx9BNxOx_3-Kn@ZV-3)!G^b)$!5Ir;+UBs
zS_+9bfO;Im&nVZRNf&(&vC|-l#0&E#T<YhPmmygHeGTdU>L!-rgXq2Cx1zr5c^}hw
zbOv8;P3oZ~O746>=AFLROJ)zNqzIdwQe?z=X`SU!<~=sn?c>OwQv9{De6M)l>cHNF
zTXj`oDW8YH4(_c?<A5&GmaO|@nrq*lK`t=x&`xC{BAK_3%35)g+M1#JwPC8s2%WAf
zWZJue#q0e{(p4Pi3Bn<dOx5Ne4B79AA|3POWmF!a;{~;G8a%!g-`Tdl5z;Am>Us)%
z$-ckbdvGf`s<opjJV;tbT)N5-Ta?JvqK^ChO&g6W$hfg<wSj&SYW-!}n}@eGEHeJ^
z1=fGMdlXl#gO#R9i<iSwMQHcD?X7JVN;4voE8WS05`Uom!+4^<N=e9IMuo`qz04_{
zN~zuf3bd1y_`9y()}A63S=Nv0cvC4yC*F2ZW?!x4y|btAexStr{Ekd^n)`Ky)T*tL
z#mDI~WL()AbET-DID^1M{`6)7w{7wy4<@^uuo}nhjGp3{HfTav!|Ha1a@R}ca)#=r
zme`VUnI-_!(KA7NcRII;z-^WMDC27e!-LmKXz+DbJ5|#%-9zi)IWlTj-O6zZIzK1n
zW&DYC<!D%tNH6`0bOqH8*jjy_`pBN$L(<gmP=pVgTXX&{D(JAT^$EM*)lcu{U2I9m
z8~B1tQGQPPGPb2l!Q6lPC5fSF&8GYswAbE+VBNh(MoE>6e|w)73m#5hs3Sl^xT=GW
z<i@#{UCj%>k0X$t&;PtW(s~5<_2?<vQ9n+J_|<D^C|~)2L`{1Z{LZ-g=zCmw^2jyp
z4{i|60qVyf`Q7DbW5}x@ok-m7Cv!6bknDXdd^|6*p@*nkCG1FBT$AR0oahj0EE*16
z?^W!sd;({Zn95&9_c9`#M{pylc+r{sNRZ}zoc#0ihKhG%48tK<`TkBc`cy75;8W__
z=q_(iCKi0-?wE<AIz>Mgtis>j54oSBYf|TyMEmLLSMSn%r7Ok~k>Ta1?KGu0|6=V%
z?tId5x+U8a)mQ~r_x;_{^!r44B`*I{&d+CslfR|UpB&ko*wxQ_9L~<78;9$Y=I1N-
z5chnVhOJq~O>UWUNoLrp3%2XvGrH~A;)k_Xk?koZ&39uRcb_zzxHX*XlbuW7(@mxe
z-8Jm0BoLf@IWY5P{%TOo>AA;tL~vMr$I-&C*}Rt7E4R*?NF2M%7H;n}{@4^|K~J=H
z@C>iyJrrJ;Kbdm6?$vnc#ho{Qa27b3Tu3$?>k*UgXZAbv<oD9p>{-(0$xhtxnd3g%
z_Fm5<knTzi6fqLuAyDEXKqVs+4niETxlILNYjB`%CCid`LJ0A8PKXPN2-(kF7_R<2
zpX5i~!lHuHBZ}pk-!=oa9}S8%DqbmGHCELvI;O?V&C}2$k3T79R<_IBDNwbJj-xoN
zP4wj*qkZbRd@kzKaeBaHN9^Ef@8|F9VB>+g^Rjg%MnWM_2<Apo5+bbb;OXS=45^=G
zB*Dgp0gP%Q_6EZ(WSvk#ys-j4I_%x62MHzA!RI1$T)rPVB`ka_NGNlA*VV;(cdg@F
zk;OSrBq#ju-Ci%934SR}Q&&E}%wPPnR$<R?W<ep2WQ0-Ho~iVI5dqNgrvi?c9I=rA
z1wVMloC@B_x={gnEHgMrRDBSu5H_%OlMLA85kRAKB|N!cq?>Ehtuk1fPSa~4UA9Tz
z&t|z$%3N}<loJC_y5%I=1#0Twum65kzOC>g1%3A!le89%jxe>;2Hp>`jhj+hj<&+`
z&wH9F9_dMI{bv3WB(FXK+#IIjaSG_-Gk&?ipvEKjYO1L}Z}-u->Z6~sfe=Hs>6FJw
z8JaiIIzmn6w>7go2tztzrkd;5xw@S+q<<M+f05=wP^Yc@s%}cy%e^}{xFnRn5zffz
zWJTaf0Qd9|gX+TBOjCNeE9c8#zfx3Y+iRAgL;@ZqQ~B(p6Ad4~JW?%=(9zWvg(DH^
zA2WS~nsNt(D}`&xbeR+sfAGlvNF+*lWI>hW7UakF_FU>pA)Ib*bR~&xnt9urbEW)c
ze{pNmpTul4ugCiM!TwoJsZHUWj!F-iOf?Ht?QeZrY2|GjGe?PbSU8vQety^L+(^H%
zBYY}}E|fmUzUhT7_+QK-3fM4H0nHF!ppTKdUWUyF8~DmZjSEMjfMR|Qw2rtZ9%zR%
z;&5xM&4#lAB3eF?b1!*U9%Y5@3|?JJQ@BH%`G&5V!$hVqbGt6JmNdtBu7bMG4I-p-
z>>P*4lwktm&G)XaRgq0kYI<&jzP(?IlQqVnPZqSqvV3c9a?PP&yC%GVzVajggK~p}
z!dt^NIn4guIrl}MjR_j8qyGqx-f9oycV)}-_;Ry6sEocjD!cQJ$H2Wlmke*Mh2F3)
z=EHT`Q46`R2X0pA%Uu5xtT^i0@CMJmxv@q*Jq2MveV5Q&XFt^Q&P%mzuG0HAW~V}I
zbJR{O!{a}z!@u6zy?=F=apCOGX!cRc=?g0>eT&wAR}x^t%uxS^odX+KWv0Rr5eJs!
zIpkhJwZVTV!!Z;RrVoWTYC{`p^p#;>;7BMA!mr6XTHN|U0(P2>vn%=gv>yDAxwxOO
z(_>tRmj)MAak0?Rltn-Q3wQkq2PZZV$Vv_LYjf5cagkyJ-g-#jA$K4kz(x(Q@w5T8
z?9}x?c#^?s!9fk2i*W+V{ItM3zS{r`7d1GQxB*pu861>&eKNldHbBlp4PXoG0}DJ<
zz$_ydARxF3p!ukPN^35icYjx!PKg(bL;^D}|CGCgj-6XoPW4(^XE@kA$;EL|4}HIE
zAWW!DJ<yO;$Tu#BBpu$rd)k}J@rze<pjWF>!ph48d1yJnaYzzv$tVRZ2~c6CaXpt1
z4>phl&Sxv(QDEx^H6RBa0`>){0Y?umKoKU7BO(g;=pn#iQPsbOi(vz5!qoM6$otrU
zAe091(B=Y$QEUJ?3|taLnt?<ZRsDzv5jJM6sNWF9!N%~wL1NU-DG1fZlC|Kl)5F(;
zC{2#_Dzm*wBN-Wqfy(|6H}5A+vnQ9cAUC>V#DFEePCfxdp}0Ynp@D4_4FHI@1I;4T
zfWyt`hw(6MDu6NM8bB-|hl3CSG$mqi5Mn^Ku_Qnt$$&;egzdaMJZvCH5s0w2gRhI1
zJp?HZ5%%(QfC&2sc|k-_#KN)=5iyAHZHTY}L=*uLR)L6$LWDISVo->%Hbe{#5!QtW
z>p_I|A>t^AaDb=1gRh^Rm#+gv9PDNT5w-<+K!oif!Vbj3ju2rd2n-7La{<4^fLKXN
zY!r|$$w`DjforxdL`v#m0XH@ya30D4{E;jtzIcpT%FO^B)7$m?w<d8PP9d<#(6SJO
z_{AHbU>EB>D1-t83H$p@1%ibCz0-go5r6NrAxPxkJ6#C!f*Ua?HaKt$Ur>6a=-)d~
z8Df9$Y%#jHXtjf&FnbEv@2|R0=u1ZS5HL{+HV_LtKv0*A93iN`g8|2ix+L!cL0yt}
zhoCOWdq7Z^<UJuG7vzbBL5*Kh#+X3lauD7SkxSa%Hogv??hcM<e~8HCXf7W4x;Qz5
zk1mIGX-Sbw=6)ChUP$lfZDR+Ly=3bT5xpE0#?+#hi~}H|mqYqDTY`qaAP@)<y<p1*
z5e|WfUJf%9BKnt;l+-_4uo&!O<A3kV>6U!4+1?H-drk3MEb<WCY!Ci;#0y@ZyS1LM
z?{01XD2}6Hg|@EDTTfkAvm%Jp^@%96#5b<tGvq+15W~-_KEG&Q<>6-NaHhxIemIon
z^wsK)6sZ@J?Y}QvfA@W{i%mDsiVKa>QSror5w@(+{E>N5!?Tm~Y@_(>{AH|;FfQ)Y
z6z5KtBBxYu+BUDzoxu&{(5{5Zmp7xTOJCaJi68TK6T1+M`Whlg3m9{79wPQk9Hnw-
zC1|xZdVK=FAn(e?yO=8ttwTRbej{p<qVusUH+gQWyg9Gi);{^8kbh9=)4Tw>QFD4+
zb-u*uyNY?BrIv?_6<q+eD1JIQt3)fo5&Nou(9LwugFL>ttjBC(f|0BV#rmV<FDSSp
z965sr3p961k*x=^AAhxl$trnr+w(VSEAkgqA>Sq!AE!8TKixTxD)`mb{s&85L%->N
z(E<VjQ1Md$it@1+fMY>E3P8wH169@>x~LRc%1$Vr!lC98A)D-6`Nws+oen{j=B1Fk
zFG{AyoM=(<c6~{ZwUX=ojY$f3`BZ|L%H`sMZyq$6N4UI11-@tz@~?PDoFvV$7<Ga>
zCcz*8G|6*==!P4}x$Od2-=@NaBjCV$5e{^knlBz3sr+HSoDvp#N%E2EaLL-A+5YVu
z_q1o7Kd5||sGRoW2_G|^R@pdeQ?<s$$WK^H6m51o$!IPz2>J7Qm(JYtyYr|gk2v>r
zT%Y?(<*G+t)!8<n+$!$hRQg3moPAgF=bq_*R(ETAyPW46)H3Kc^PsyeZtz%aMPIzq
zk>4#{gd#`5jj>CS<$KL&X{Ga!3ICjEvW5j!R!`oWZIk(d<;0yA<|`8dUGENi8atR+
zjpo1c_e~Ano7M$ZKZyT&@!<WjcSBN4=#o+xx3YIYCB)##r;!=G&@;U`&f_!OpIt`G
zz|L)MTo_6Oz!v8~-&Z5=ffC+6lzL-cL}?{I0zBJbZ##cw&67c)b?}Z(4*wo$t1)bt
z!gq1F)H65YuAfjdt;&Q(rU71Hta7xtH~C(IJ}=SgJ;Mp{I0Koen8Qlov#*gQwx@*m
zFL$Mne-7wffqV14>Djsw#KH5&??n<4V?&<Dghp<ojQMi!F;wAyuO)leK<T<bUiE2k
zfBKwZVebgnno8t1;HAI~MA&jFBI=<!Q0*ElTZA71-;YBrhFV^Tg9K3|BlHm87!o%$
zHg;_gE&|hqB9ZuY>cc6;w$KzA6SXv1aqTm4b9!?ZEPps<F|edW1=J~00W=Ekz`hbS
zwg|vBP77RPzADpz0Slr=AXq>eK;dw0C=#x70Tz%1{|*)iIlCBqUt62{b>4*3X;=Rx
z?NdVObV0gbg{uCIqA)h#sY(i*AqeXUl{>Kk1~n=SEKsh8zQQm;LiM0XQC+C0h%OX{
z!Z5)hipp*>hjuYRhv+H<2n3R>W$h82?i_l06)e|CO8Txnr|gREcl3UOjiu90PkX`Y
zr5ZKxR*@5}p`((B3nc|tjAI!#OQ5w}K1Y7-d~%RHMjVgmMF#L7+nD4k>>jJYt>5Wv
zexhfL5hc?tCZQPv)92Z1?0P!Cbt{By<t*YEM~f+TZxy>yn$))Ki3^nG__Y(T#=OQu
z6l2?ktH7HoR<qcsG)V)P$W0%2zjm|jSvGwynKFm=JW+IX;J!z8-(GHxE;1gniBm@>
zkSQWU1veSN-69(xGqs+4%BYhReIxS|k$;I{@3VJ{^{bx(Mdby5ELMc?9XlI7w2pbN
z_RBcfDn=^%X-?pFhFs{9h6MXN7UIWn3BemL!+JM7qmHGAba&4N4u3PhxH^1lo`1Q1
z0N<2Ifh~0^;M9pLL)8;-)}X>cATI(p1zk1I+c3h}4n6NE<)w#d`wh>Uvp=KF^3*4W
z7m2LhgNO9W><4R_xHvc`Gqu9m<*Uk0k-nVlWxrL3@B_2%_qnN6rF>7Xpe~%*TdDo2
zST;>#`fL0Bli?Db;lY0K{%gerG|hEk<K)x3q2|iXJDJ05Ohf0|Q34M0zQkOzXtS}P
z?-UDHnV(1Bh_<P56S}+Q03Sa;j-xf-2|u*$6N;p*T5Inj$Eql&YQXQOpV=1SbH*}g
zPEzSE{SoRJSmIu4uztjZg&>FecE)p=F}J_}jP)Sg;+sNB;@J%u9TS<;{)xb@&#(by
zZ`#!>scqhpZ*siV#NOh_B(^Qng&OQ~O|1$WJ&(`bB?@S^7jEq?m|0zu0|<kvvB)j$
zd#Wo-D;{jEOGY0!DflWTk0*)UWXmx9ARfK^p@_wF#ay&@*@L6D$!KAlbtzxi{9yCC
z+V^|C7rv*XNd;_aal;Y%pgY%s*jhvfDuTqZrNYe0BEtBrA$+PK?0T7JzORc0{j9++
z`0Ec?_;lp(i`QqgsKA)A%b!CKfkEZkHArmASXyr4RmUsDe6i*at{DnlR~I07hx7h{
zH!*ubSJoA*CMPl;Aj*&$Fwv&Mfuk;GEg4!N9bBy;;L=qP%@KL}MG{bTfHj?qkd4@j
z1U{@dyQj)gMk%mH9Rdv>_%Uq%YCTBYP=XPkT7frvz~EagPNjriZ;o4n>!zK<m)9R9
zuDoF!u@HZ1?^Bu_pdY~Rtv;IdOK1Kl&?GZliQIvBs>+YaeR0sEhmJ=vuX>yOFaZtG
z;?V=M_mJsb0-luctjZhSkK7O5t3k=}&g7`Fza+_Ql19B9*8BN|^83n4;98WmR|tjj
z^tJwUHah0$z(?li%b$+g&V6DfMqkoDXWCf~%KjACXJwl~<A<Fz$5*lDCS*EEfAced
z==)N35<Ajl{jlY(`p%K`r_tj-xGa1)j>j0Sfaw7rJw@Q9sy%S1LkliyHo_ceg)|9D
zTyP@`(=6ur&4DX5>Iml(IrOrda@XzrXbidALKQte6P@raI_?$MJpN8Ko|E0_x`-!=
z@(W%-q~YTg=S<!3rZ+BG{(H_Mem6*}shAzfLo-Y1i>}?I`Mg!~#kXvG<VfE8m({Nh
z+j;T4gs6c*X2RhOy}2V1iIV1K_JKc-`{t@9BW`>*uyHX_8zO3a)Z!>ZG^Zy%Q+Z38
zmH6htg+cca)HrbX#WtkV;_(Jb`W=OT9SVuy8eV}Yr#GVWBxar}e{5wnu!KJ`7YZ2Q
zH?jHg1WcNh-6?P^J0<^>wvx><&DN~<=|LDB?Sq66Rp#1UfkST+k#?+HN<WglL&Dt~
zkvg5Xi#+!ZuQr=d$}mu$Qh&>>d|+&gLzWa%Jx#N0IL~MNy7D(Vkh6(^$QNevO^;k5
zk*~4y4!yv1x@rEVuL<$FXE+XnO^n$0`lQ>7A)UDDoPX>i-AAR&zHe+Ohy=!pt&c?}
zMdl52V$14@RZ6|KIdN@SUCZI+5flIPq6F4Xrn#!7``M_eZ?s7E^KXQtQ&6fld9F6$
z&v_h3+<d3vJ*k(YvYkS>uT)xs>{O5P?fKgAM2HV6^q2>CZNI-W^qM;D`!?vP<DQoF
z>-{?U;9L=vEsK|Zv02@#6Va>n;pf;^^kMcF3iZ|_1vK0UaNw}NvxJ2lt=*IYW(S5W
zVi=4&L${tf(I%;to&QumI$(cKtDwt|%E{mp4#?y((ffS!&Vyd^kl3%D_99&T3c^4Q
z*WnoPUU<SP_2K-)gL--7Luc^_5(NJ<M&^%dBDvoDRLw<mJ&0p64}V<4IF?#7$k=1+
z$yX5HzN>VkT{%=q?4+t1##hdt``$0KOk$Mk*^{SE&mdn#og1J1@FRPncb_NS)2n^i
zGXE(#E(KFYZYzg{ajg&~g$qhnW3<y$FtVl5@(*JJM>DC+K|-%ju5M~^hnx44QQ@yV
zdQ%tUoz*7=xYbetz>v0nK#c>N4hF?UEdL{o1_KL1Fz8N89E3WgvuDH+kjMbzSDyj)
zZ)tzf)!&Mk@hFOd`|C>W@X29ODt$}|4;xrdkts3)cXK&H<=#LAyhT)^;$#g~jHJx+
z)!AO+TPpwlL@mjvVIN)47tj0}82E;}qia?h@C|$GngORpJ*i!7b+h*^8$8sTP@2_W
zP`iW-r9x^0wM}e%s^1@u(A%Cnf#KNJZ=e<z!@#VmvQRJrxIaV&N+`dR8%=^YHd-gC
zl~@$#f9}Rrj!&8m9pIU!y_=pauWtQ4+ir<VU#nV*lcTX&Mf}=RZBaZeXLV9U{$sVp
zto3#W$;M#u>T&!>Y5nsi9?0AD!;-P3<=<&EkA?k!iY$5u^8PBldCmU8XqxQn<Gu@{
zud98FsaR-V-RLQicoXlNNAL3cZ0E74h1Faz6pYiswU;P_l<+bui3Ey+xY25L9N_+X
z$oINaKj%J7N~_GWO=0!VY<f*tdJ!Hcp5rK+{A#B3hHls(G0<@=V76TLV`rd^@vG`y
zEtg;XMCK?!VVjU#PPak-GMb*9uvSh9wZ;j-Q6J{Dp}IF(Zynh&X&dMvJrNW5_~G*h
zo564yN4}~Wwb~Kwo~~j}4|K=fI|T~}eeqb+N`@@k*ZIzUY@%7$sSl@Px};XNRP6hU
zY?)P)4{#v*U&yELrq>r#mr48(Kg}Hd`gqi&`cv(%1c5YJZ00l{Nu4O6r^=H%O!)&v
z>7b`{v!+KECTM85BaEL!DMhQrj8sX&rt05g5zzRE`-o{1`4%zUokbs{7WS1Dpbh<F
zwtU2;>I}?F4I}~!72n|IZuPoac?HhvW^FHoh?zP5ytUl6J3M*_tMIOrDHRIcY!70M
zlSkiv{@RsfuXBrLbT}l2Dkp`C`TgE8UZUI;nx(jv7IEUt*r$6}g1HWCzLYhjAAckM
z`eoRpRN?q_$`TUW+Q^>9CHiY0ExvPRH1bbsx54Qt0mb@@w*Z?BH8vDTcgCcz9RV9F
z8Ze^b)KW;Py~rJhm09DF!l2sJPar3a*k<tIa}}Pm7BNcl59(Bk4n1L=Pa1a3IQ?v8
z*11JA`DbrW+eU=uF?h|8IOJ{cjW~6Zj9x94W;Vfa0kW;BfG~{-To?=iZa~^NNH|bz
z$AL~)^XvsZ_)scF=o;jB`cnuFb^W(Fw3%)Jb~B~jkk(`PxE{OeXL%~uyl+A(0kDOP
zr5~h2TsdrpdcL2RLpBiIRR#k2uUF=;$ol{$lvlbP(E%?N7_vMm)%1-za#ZLb*=nmX
zgM3w^-nRy2+I0nNGCmG_KPZXOv0kD*C`8NpOt*ar8b>?$u`Ve;5&iJFqVRMyI3@B%
z=$%Gi0$MA}{_FK0J2|OF_)^(wsVv^pcpkVr6xH^mt+c*REE}VHTIF=TdhtH<ob-Y>
zPf=8zD&eCUJ?_cD+H3w%W-~Xpkf9Nau8X3?c4w#9&6}pr{zoVaKyC1WK^rRIsvS3p
zh#rV<pg5FeWwC&_FC8mM+5;vbc@jIQhpqc#Ye(BF_9hS*q#1*cvU90$FVyO0OI2^L
z8GsEO+tL8;+Dbs89W@T9;)`7!jMebiK){n<lG@qFy5<94kMTR-ihSfrWp^t^KdLFZ
z_?D0x?jssjHu_h4jZYt>Dws&=hw2($9axO3dOO56S0u0-t->G6rk#|{kS^%p*%&!1
zLRMForS~MYCaDy9|DeI0hQ+GHj6EPj`fe}3@Z3r>bN`c1EuTx0+R=EAv0+3PLJr$g
z;~=3I`?l_XC7&UYp0hjC;J$s@LH2Z-8rR2PH&en?KX526M*rn^|D%Si8A{PFK@Ks!
zL<5zSTe`8z6|IJB6FWKZ7mX+<ynfv$-CrJm@fnDg?s-y9(s%T#_QltJ=KCzhG#tgZ
zJK=A7zcD-**{*Rki+JGDc|Z7G{*6z9eQ0BRUB-E_t;ECP5W%`D@ohN|5{a1&6KEr3
z_llHK!Vl>5jUn&1m{h!z6SUJK1EXe?NyWni0(Dq_B6wj`-)0yU=47L|GP1?rH2eQt
z_&ruz^k*trwBsiKx|yko-3KYgt<1Lq@bysRpZ@!w`tFh-cS=szCP*of4k;OL399vG
z#A8cxbPR(V<pHu`SRdOyc|i|7k?OG|b;o@!D(1}o1#+@tv=vKfa=yrCoYfL(4;ljU
z<@z4WrYIWK>uwo`*iY5JMXjH|*n8PNImybr6?rj<fya(w_20F@g!4BiY7lR80em3H
zyYEZ}+|iRD`L6>aaME?Ea`1dWy+Rs7MPUa0Uq7IbP&|YmL>=L0ca7>XRsxYu8U{qG
zT_N$mIO_6&BY~?1RR5wOf&^)BN{Z@1Q9Au!;rGCZgVaus12Xi^ylaZ?ZA}dxn1jfs
zGsZGe<aSgRs8O`DkHt<CiPN)QB7Kg;N)@6p0trKa=VNrhxxN4nObmqgoanR`A1nxn
zK+DDme-i|=Z2R(MoXsk8^1bG%sm1H*)+SltSXRDs3pQYWUcu>R#}#PJ>R)tyd)K5!
z=r{cN(U6EiMK_aW>TawO8(hEkZc)0ATvcRsL~GA@C7|rvo&5NaStFew?^k|*1jkOA
z*s!}gO<NY9(~r+=6V@9dA>#2r=g#`6+Y5Z#`HqOaMx=fa7y7ShCS-ByPc)SCFZNk~
zN6q}mjlM2YUcR36C*o)7=-wXg$4yzg3oUu;=>XkuPE3rE`Zpugecd@B?W%V{hGN^d
zrt?5|XBUwyC0!qH=Ykl9-yZFakU0v*bViQ72IH92@65uiqMCMp(tgDlCtYLKk*&}L
zZZzVy6P0=ekH?fVH_(VW9SP>T<v+X`-aR>>b3j_h;pXHB3BKde;WN#bu1f!hax*YQ
z*#{k@5j&a*u{Yjxc@V+7?zZ7(cF2)@%cgB{0wxebPvidk{iDn^!dU-x!g1>;;%B?7
z2ChX)T}n{CUoKrM((}s|CwV?6sPDZ@dbqz>vgqKwTLd0>Msh81YQ1^nI?^`(yLn0s
zI-Ch!ioL<pe)X&&=;R1@e&2%k@45y&bR`G$JgDj`3_({67bgQ~LTG_Wqg&XbfM*CZ
z05^63x0`HZ2|zfM43nI{4(8gu-2?po$vF!<hj=?XcoG9zp$ym%z%^6=Edm4c&OQM)
z?wHIkCQlD$+~qOpT`(0ctcc0a3akB-t%qas^kU!>1BkHU|4h}xpcqPEN*?5iNzjA&
zes_ql2SnHtJPQEDfWTnjQGqY`1)dZ5Ltt?5m#qz(FT{cv%=ro%x!C(V`(Zd?lEnYY
z0*eA$p#ng$NeS^q(|_ghf&E)j^`oX4xafaBsg;F@U8bPrF~<rQ`DO)(*k$Hf5h8Y(
z@K(bN<DwNjgt$y`gG0MuP7DrD>@wMH2obwXblckaLd5@D0$=<uCp0){@k>??7b$e{
z3wHmgRs52rqe~#z@sg{fR{%)vlCcx!nBzj2zvh96UvhVch+l9g2Gt0IUNZLtZ!g(-
zx_}9OG)ChWZ+n3)m&`Dkf6N)l#dA>g&<j??!vEy{LH%DqbMQ3c-*W#Lqy2ru!Pm~g
z6VvH(^p~drFxZ6<ARUZT!C)8-pg|fKt6s|F=Md-siU`{Jf|8$0F!<wAkiSO<7zY5`
zh%rt8yBxT`v#$dvG3=5*<}3jQyX5_EM+h+Zr4m9Ne8C=Y3|-ED_ZAoe)8T&v97ynF
z7L!{A)O<N%;C>xIEVM|-Hnt<Vm7N^}CX_=G2J^TXuW=Hgj$b*}ZVlz7tUj3Dnq{>z
zd5*rXB<%l+tcP((YSdYzu^@!e;m0D4Sf<z~yBXijmK7-*S;n1tTg`oy9t4pXs$Q!u
z=$ApWK-P@HQeTECMJYUiltE0x$ykJ6unzr9L%^4@N;6|9tk6MP>tK>9v@($-FY)oS
zMHS!5wW`BJ!U6dgAD_>cv&)_Qs+y#2L|wC=zFI+FEW?@hZb}vFC+?a9!%}83m{}*}
zEV7*8742Yrix_6+R^Q<J<%fTCo7R<_d#YN1f{x@Y^2ghe)~2-}HQWh(rP;vOR%S2I
zIrsgun4RHI&}7LKTpinx5#CCl9f#gd#jT3xo%A0Bud!#pjL|SyubQV%Gx_!Huv2Q(
zD%Ha|!gGr$YUH`GiI!knfzV2T()%rg_h##7CC(<zR%T3T5|DS?*_>nMgabO94bxoh
zI(am97O9`ZEHoy$nr{BAea_?0T0iA>c&pjsT1x;-4l;Q-_N3%$g<60Ga{gA)HjU5M
zTDL#qA0Bv=vKPP4gyi_+Gt3=9kLNk+THz|S;6eP6Ta7vx_D}&WzSKCPAkqPAK?E~Z
zo?loqgxIQx6A^q<>t%cB-pQZYh$uaNn#Z;D(UEO|o5MyY#$I8@Lq8At3SQ<`A8383
zUYBMx3V*d@$6>mAmh{SWx6{!JHj;J2pFpq$#i*P&+^uR`8|Irq@;>l~tzWygw<N{3
zNAhZRyB6Oao|49;FQNWbkAsHL;cxi&!fi8uoZQZo)1MEDn61&P@XEQipBSpBJ*ZLX
z>do+x=ANDHsBBr=5>M05aLtBZG)>8Jj~a1yh*l=0)D}bo+x)Y{0F|zgT58>6%?eK<
z=ocLpewgH-TJomVj%R)YuVDRTO8(wkm1ny7oW8s^0|K4y*T>{{oZo4;qWPV8*?+0~
zW=x8oFgiU`a!!inG<dGh6yWew!$~F?+wf$NH>p8tHrG|70iRpbY}}eHI>s|zZm38}
znB-`zK!trjk%^|@&ox|q(j^PI2*>czC+*K~Rm7}lOn=KeCEe$C8iK$6Ox5M|X8ygJ
zt<H<Fi1$Bc21QdBBP)iO|D>RWhhuHp;6v;wq5(ZtE?=)}%yGk^y!G1LYNS^vUbvX~
z-~O>I-~q>F-Ah><^jc1#<QZneO)&5vqUkzx?tH4|NG#!ogPlez)~We=D+GHRrCBL2
z(r-}btizxz^npzLjUChQQ%fhF<6P8>!41t_YUZ)GO_|Jy#C&bOV6t%Zm30E>8bvX_
zA&YW{%lF#cwG7n2Q$GLDv<=|;5xp4yaRu*I{8jPxYxsigMQ@tbZb0gUI{UT8iLq|Q
zULhVw`<N##=uO@pZW;IxCU^y(Xa9Nao6^86dp3Or!ikh{f-Uw;Q!EJe8aq`>2O*#4
zBWDz^(!@m8OI9-Yrt+qyOn8Zt&gm~|N8@k7*W_=k*gAy>$t~B1q^C5q3(G0mVp#|7
z)wEmQ8{vzI&o&{&zbgJoYVw_>`yVOLpH0b`_b&Wd+n*Xo1O<Rcoajuo45rJ)X^aA=
zcp>EN(r!ukd9_u^4_gMs3Wy42%GXa-E#a-x@h&+w9j7L<%To($$bGxdWk=Bag8Tcy
z4_5q4tOFaXR{Y$_NpwBfN0hen`}~vIwvrmFmFkUc9;rGgZKSp;+{+IK?7jB|6nGzO
z8UM6V8No`c+CXppxHHcv<?>aZ^N|4dvJJEH_M_04TA#R&Juwen4Kx}Q7EUeFmU*}q
zb`&~|__mL_e~sjSWyRs`yBHtbZ97w9xsVmEn58EnL;aErLKI90!P%dt3ROyHS#p@z
z4a1>P`S>ieSeYk}VQX&dSy%G0WFn`>mY#i?tDIA8|4t`bk2bu#YWjR~pixtE9zq<<
z#$Mvpe`{tK&SX}~Bsbmq_yfJmG!0D`<6Ww>NJr`si)lJ8yFtO!egTTtV*Rz-DjRq-
zF79tM1Fz6-6uO67=GC(Y$B217Oi+j#j1B6CPY8<A-g>#AuO2O}bfc@H@dld@m)4wv
zo^abLzE}5K^lyWgm9ca}?oqvxEni4+g;dz500%=ATBT?m-PJzRpO!1~Z#JL}w?3$N
z0NfSlIudti7WSF1CUf2N&CC*rE3e}j+>;e0`9*qc(enLKUaPR>+|+w!W6IU{pIw~M
zRQj4;lb@d!Zft&zpLE@LDwWgBEs7$28!#=8?fu}_9cQ#=VXoWZNl|>HmQsJ8CQ-}r
z)or%MqUo7*@AcVeoe4J_Tbcm=y;>;$Ly>QehoTaK;SXw43L`{mmOmu=zIb%)SLp1w
zgasWZ%NsW}N==XkA1vO~IO7+DRu79$z9(+k^lIJ7A*czKWQr=#ah#lu)>DzYdhc`o
z+^;LjdT(#*leMvYDqI`gKVg+^!fnHVZfr4tIE0N%$;7}wSLcSjhldLc3dn>A;=n}#
zuMnmi|E+;oSkcSVUrx>|7-9wy1S>8C;b64`2uH*~1PKK?LJ&A`aS)lZDS}lXE{={4
zU<rbqgCE%WZ-oa2Xkb7NxW5YrLo6`(?;k`6ga3s||AK@tP=f8y8y^2n0uZda+c^0_
z5b*yj3rJj8*6#w{h=Qm{__o8}AA)cYr3lO0cq{(}abP2{u<_*&BoYBom~x__APD<+
zIWUr4AX3aI|Nr<9|3^CL|G)$aR(im}QWO!eA_N9vUom172(A!d`G*J!30eY_{D1s`
zgMb?IL4i&GA0Ohs?I6^~-2C&R=;h1*e4{|{^;dq->L36VgNuUIK4M^%2?8PtqHHk)
z46LLPCq{t+iGgJ?B4GKCI9NU+1_D@7jG$n_jVOq*MZuaD5f}n2azTQ9!2d)D;&*Yd
z@J0*`7XyEQBLyEKK!^^0h%w*)8W<A9mME|n5-tw10$&9k3JC@_ND#&&G2((%CJ2xe
z5`?apHaG~i#Y907p-^HZ$PNXHf&}Y%kSI`8u;K*)meQcWS{6*3C=87Pe}E03j2NN_
zP~ixSj0lh^sF#1U-G8>@e=y^}(fEhnzi9m@`~UMIs2$Le#SoV&1)~p9P^}o%i;9A(
z2URHo`iKY!*Z+A#6da!jSP6v!hlKGNBt}1A?0`go_h5{I1cN~YSePV=!q^`}0E|D7
z;z(jl2NY;O%u5$~!TbgbsZd~)BLZS`5m1R3U->Ua|L1Z4YmEQrJ`mCWoAHCp{_lwW
zCr1Bj`){<+{}&?x!`aIcVi@Ry|B6LyAb(>MFj@lFInW#z;Sm@dfnJKa{nxUBiRS)^
zU=%?Qy9|*OVGwfB%aBMB0WOtdfO(V%81Dm7+}N;s%4j8QQ*h~n3*L5cwJ{9Pv+?v3
zl=E`87j*EjxAAiZE%TS<|I)+P8LSz*jC~bh|4zWe#S;_gL194GU21MjKQO_Jp#yUI
zZyf_XU7!ds`h<aJU0_!}@HZR^#^Nw=j{NW4!Dcwv40PV5xe^SP@_~sk^Lz4S;F5f~
z=)%ET!>&1Q++UyTA3`~??ZCrSpEznjBZeIPH{b<Tc3HF?oWJ!z!?PQDEyn7t^7gZJ
zZ2m5d8IFKyW+@z{W!{Pn?04jkJM}d;c*#FL<3F%p@uEl%S=K0^I*$yy>3)>RD7j?B
z8|Qu?<Ja$z%0{>2p<K>Ly3i)U$YNdmd5X9zyx{ZOH)_$U&_F>%;g2iwXrwg0U!Ynm
zj3qQ|_%rg)O<H8*_S5{M!Y}g{=YMuc92V{k-87lIW9Zi|^y6iuD3%m)&Y`<%?zvb6
zY5f#6p3sY_Une$E)-1y08g(4J)ozlc&drP=)w1DuV-Mh0TiF!cw2vZ>rr+Lp{?sXM
zRIcl0k%hCx-RTu&@nOb-IdiljVq&umRvKpMR@USb!J9o>Hc<7M`pc1{4XPY6^TmFz
zK$LF3cfQW()D-%NudF2}{qR6!h3MSGuZu<2npvu#q|In~A97#Zz$ChNLpe)9SxD)b
zfSj+mt^-BJP&$87nt7_e$-OVWj|bT~A95JbvNbV1ts@-x3U*B-AHu(`v`+u%0>M`L
z6X7DjknAW{^8aNzPPB+9F)zY8<qSMZN=x4V%Ch&BY5ObVmlZnJ;<%+1x`h?Gn|ev(
zOAH^D7)O_w-Yl@OW+Znnuy-tQHqM*#y_~;MH!tvP7G6G!U<Hy2r^Oyk-^`kn&X|-<
znox|NP~yCoa`&TJ)JOG@_d33#25!S9_Cpq|SxMFd)|LY{{6XkclRkUBH%?kTE-GCf
z3LRdYu_>$%l5Vy5!yHq@jFMR%CZa5okya@Pn-sWR3d|t|>Xahvk|N}hD(ICe;FEg8
zFO@$a)toOR)tomhl_xxv8=cB^H-$4Mg(EJ7z5E_q`8~*!7}nBQmb?V^gcOd16qfA7
z<5l+Gt853Wtl!aJ7}meguYI8xF-sP5OJ&JPoLi=wS*Dv@rXOBp9$aMUTV!R)O=$bf
z-Tay7cDwhBIicz~=#v>#$&4slN^<U$<ijbcv`_LWpKiyFtMJ@OWyw#7_@H^`gBDwI
zO3;|D|Cqk_h@r=bvCBI%r+4P&wu4qIkK)bwUZ5fOlg;{V(ME3_4Bk5G^g6RArD$}!
zv1TTzb-OEddh$f1%C-Bj6vWHij+1KjV@pjo=Y5X8shcEXnv60xPexj%AYO&QZBt<O
zDNyGWVb>HP_f$d8Q~}@A8~&;MfuKr)L6wB2vJ}R1N2YQ`r*b}v=7>*WPfTGei-A0j
zVJ(SeDT*V4q$hJnr3!ebKHO8nwgxBg(is~X@pmEmZ?pGNn3-PR%v-^ieIAVlGMO?m
zGDIxaA3wQ5*x2wwal*#rX6M-r*qGSYC~wFq)VB<6tK?y^adW-ox-)!u?64g&5V4?j
z?K$e)-l5vWZTMFGYDhtdreFV8-zLpRHv{%phx0@|=U(p}Z@yqfi~D}*zwx5=$6%6h
zd+^rGOSibI;Q#R7>tjWqp6-u!>~@m~n|DN<9g_&R?&c51u|_ywEezXkx-WJ7jbmfu
z`+oBppe41W!o(tV=QntFbgvxK{mpf&JLyK@2h&cc-ie8m&n-$b_}fo^3<;wh2iFSG
zf5d65LcY?BJQGBZuL&DTpP%~iTebvl&G?<aVDjx`@liZD$~aG6K%bu-Vm?8iL)IR3
z`~d}a8ZBr${2aF9b8vRJfIgfLTKGB$in`Zlg+BY$MZkK;`*3@{1%*PP&rcT4Bfd}7
z+Le};HhRuCqr}C<L)Jzffz0+tFDNG@5b>k${F*SbTHhE4FBQGA^78VhRwgDP%e@Iy
zFTsn9jO;Y|{{8z}>gwLc78Vx63k-S{(g=i}m6a81!fp1_GVhbUl|Cg!Ma3fVm6eq&
z@antIDm`L$pGn+S;^*#CkAExfLEGJ%b#~yjxw(lE&&a^QVB*uKS1m0q=-GvZg~DM+
zzb5nN)z#G=&d$yi&z>dL>oc&h6y)XQm3{>&dJB+;g@zu3SFo;`*{tZoo&DjbdgYq)
z?cpbZoRr0TrvXjo*4U9F;}a7TC{fYTckkYLi%Cn5UNw>t6BX?n?FFyyZXD~Q%Fjg^
z1r|CwIzFHmQ1P#<pjTFCXlQ=^2JN-?1~fV;ws+_DO%5}I<HEfhgwqI=D=s!xY;J!3
zRw-OUg5+iybpK#uqB8I}0yK;DQo`4-Umrj~-Mt$b8PPp|mxCC$Ff}!ewogt@j-+P~
z2<^b~a&#=4rVjP;@$rGtCSlVm>$^HTFFM(Pmyb^^+VaWs=j8YNyLx-^ZjnWmP=KZ?
z*~jP;<DoNdFWR`tNxcF)bC;9d%~a5D<-sdx=X3b+&viZW`z*Kk#TFLY!i<0rLYL+B
zkLCS9(DqytLQ<0SQOO=Cn<SGe^ybY$g<I>xpw{ZEs;ZJ-r6ebhaWr^^hB7GU2cVnG
z$M|a0wY2WmbWx9t<=iY|{N3{Ub-X0pOF8=+^<#3_U8f{t_RYE1J}YmHtis>?piVd~
zJU``;CZ8$>t?B_@Cv#5D9v&&&7z2V1V?onVOnUX|NBn&L8#m+!zr4&9%58in8*1<2
zQLU;F`4mrBGGK#R#w9>QgRB~DkQ74acPApE;Pc|OvE0YGtK*NRgo~1Ivr8sdf|hw_
z@OX8$(Q83SSlH=FU!C5jB7u7jqORx3IsF0xf15DUT&V9Vsh^Wmd1GVaVarbYN$L|z
zE31X~rAqg4tii_ypngY|d4+|`@wLlpYhf&|F0(T;4Ek5NjZI8ky3m@MnsQl*-aQ(O
zjEqm!8lyUji@Q{ZV>>?WrRL@`3|U(UUH{c!c}1dbZ}SB>13^FO3O$f7<>2psOFjj2
zvOiJ%gV^5M+G-2hVM)%KZmO@BN3h)hHStuR|7EFOTU(oF<LvM=FKg?_*}7@>Kp&s?
zQg`g_?*$SuFI;KdLkEE#A08gg+)b5m+ngWt-v<X3dqw8P#*2JRiH_hzMkN?dR2YqO
zC{u#>`bC}r0jQEIz3bq_?)!7l*ui$4L&MnM8ScSnZ06}t;8j-#FJqVFVIs#(5N_`1
zkY>5x7lpS;!NUNJ>A53SxU;!g`li1GoTN^x=B>f#J@(^IEkQe`1&&Bai==~#OF{^j
z1DOZaL%d>6Ylet}@6+|WGi7Dm$AmS0etxZqmN^9ljuD6$H&@qSoGe#2Hy5m{w?ck=
z8KC0Ptm&1{+K6QKQxplamRd0vdI%C`+0R;MOi|3KNMqxGZDXaVHkp&x;lG%lpQjnv
zAd5lEX_Ni_{_PvDSg@A7JnoRGVQj`&gCi5@I;9ph=7JLM<G=_dTALD@LU4GO;3|uN
zu&|lw1UTcSrltrBo<4nwpVibPzER5l?D_N6Y4d84PgKdFaI~0p=}13I+UV<!j*bO^
z#pCWJZ!vpfz`*HyqA(M=9#N-P`w=%D4}c!9*L_MY7`gcU2Et22LqoPmTV()AsJ;85
zstQ8WZx!PJZA@HLc3r)8Muq3<;zBg{q0zVhDLA!G4tEx=%iev(_GEl=lEX@-=xtwL
zA4husL#v1*uE-Zw9V2z0uo-<7Ma+*2eWVIU8(+PWbI&fu>bHmY_Z{6Sh{1~UUereO
z_FCQkim_R!7I;Y&t{FOmYcCH(bL`5)AqDx}n^;_-m6b*>q{0rqn}mnoBJ_~~ow?(w
z?U#Ge`%yz*>q6~R_4KH|rNIo1jMj~u#|8(9$JK6Nb^0F6HTnIddL-_ef9+fFxGqL4
zFaJ(Q@{N8^FE6jS9vf5jm5=B$|Dd2C5(~&RLT~<hEB%L~5um3Qh+&qIkL6k%joqS3
zN=i9sX9J(+qs6;dwLf{kZfLkoa?R8#YzwtYt)^un`#Rj$m$GaS_aS(7eH<TesH>~<
zUFwc87NA|(SYEbOQ&S_EhoJa*V;H3vDSD(sesEr`2CY?1KGlFm)DbKqw!y1x!d9YK
zJDzA`FIck6IxR`vwQzJz?TN0yA8UhKw{Dq78OHS3aEqWHK6nr;)*vf#JC|>TN0RoF
z1i07<rWYvtKWi;3d&{r>vZ~E{sT;pjNI+mWC?Fu<7wh?N0;i?Uj~_ouGS;CEt?=PI
z{uAI{)fzi;y&CP?S@tMhBkPY7)BU~`&&E9Q8zpzCyKH!=ZE5Avi`{#{`8loNMo2>(
z(@ARFILn-(SSmnbW@=jH_Ox{rLc^Op`RUU&e&dg;zTyGzK79LD5zvs6n_Kd9{KbnG
zO8zpAV(34oAw<2}WfKzy{j^4h_)hBiANdgo#2Eh(+xP_f(<gpztmpwTG3$AP0DDA^
z`jxick&)D1g@o33>g_(AB>+)ekFB!oqC%;TRQUXrNcI~3)+EP42D!E0ciJ&v<;#R3
zfKasqr((6Vk)0ifUiuMn1K3cPjcX`Cd$-A#i#Ew*sj0SBhkQys>>G9#19*|HJt}8=
zD?g6@8oA~3*GK2Ro#)i|Cq#6xDkG)nNZI*)AE>g+GlfbPJb(UN$h-WbOT_Cn(5EEn
zupCu3>mu`VbF+U*u6Nxf7^9?HtTt<`s0>SU#Fmhj)^d}LmvP^fx>qSAD2Q#fkrNY6
zP6}^sYH$C%;ep|vo16Q)c8?kW05rMreMH^+59i6?4j=mEOwR7r!O+2h$TzW;+S*zQ
zLOf(ZshOEszReQPqZHz5{5T>-{@Wb?4`pv1mF3#4eN)mUB`qQ#4N@Wk(j_2W(%mAR
z-jsBAgGh&Tqku>^(xIdXf(i<P3VickYrkthdq2+@-}_$wFvc27?)$o~^PK0L$MKsJ
zHn~U&H_Awv)5N|vB&>b>Lry4lsI?NLY-rEd+_W19eEYb#xNgK}+#$~~*ol1+dmNE`
ztrGpDJI+ynI<|e)*+DU0?#0ut4-+W}<zkIx_908Y#l=NC56X}d7woU2)(xY}TI{kG
zmNFJE4Sr{f)?r_xq@ydo(%D{Eh_;w<w^Eqy%8?7+zP>$Gpt$dkPgC<Ih_UZ|p4B!P
zw{gjoz2xe-g;U1h$`ub-qCR70xo3JlKIoYSiwqw#1fqRw<m8^MKvdQhJw%Yi+EDVX
zhZ%1m*~x}8sL=4ykR?g2R?NU=#9%}^{Fl+kS>?9(jPZtqeU6II5cYd}dlIF*;?#^`
ziWX#KsF*k{co4X*X^-dMkN5lt8R{wQJv_rAb54q6IgfUD=yF(slu}mn4czI`?>)Oq
zauQcr&nJY*aG#M~K}bYjC4*z(t#N{Wvx9<KlxC1bpwg&i`IFY!uRp&_hrrwN=Bf$J
z6A%>C7fUSs#GrBcYre~yyMLm+U1STdT;sW>8jb!3b$R{NnX~UZyQ8V8<ew|4qx*z8
z_W$US!p#OWDKU|-m1)q`zD5_VzgN=z_~hi|rD2=vmC#*x1hsy>!jGnf^QV{Z-@m7~
zwnt6X8@eI2bN>6M%@6x5s_4E9v2XgxW@fZuRQQ;v(YjGpj_yH!&e;@t<XB$E+n#@#
zx=DdpYeihX9=(D$GBSe9gXfjCHYs&n_H%AO)4i=9>)|qu>eolL=)Q~S?=j_Fc=s-(
zY|vGZ5<mDw1EQg!p|TPWMXcQ(WAM%1?B=0fy;Wm^WFi-yr-#REg&cEleZ^az{<n*9
zdmf@!_?QN$SShi`qC8M97FSkctW(GB?CjPPv|rXm3uyMZEAanRh--eG7yay8G`7wg
z1*SLpSo?YW^}DdZ(Ssxyl7|@9_-r)G$?Ah=9tebKb0Gc*QQ~8s;MLzArp_eTGLw3!
z@Bx=jeSwybul2??7Gg%Ut3%taYE=4CYv+x6xVKDih`%+zjZJ2$I-V6l3<=<d4#n%~
z{ECpR_BK|mhYt!Y<DPUo)6XOlV1`IO3wLd8Ys2}>hK9#f;NkB6?Va=RCY=12C(Dn!
zoE|^^zUYQfDr8>Z&%|%Qe~+njv&<j>hx1xD>`S58hz<GeS61458gBxLgMPy<cMtl=
zWmG_kI*wh-iS^)5Zhn5t%YmpLPrAR{y}7Ioha4*zE}K9a)!wnMo$yHKt5;$awUi><
zCa?V$KOYCjvF(396P77~{Z{+PdCZb8BJGb#={tldahhI=-jz7^E3APJ^F$Rbw(u=x
zIUzna>c!2HIip|pMPKU~Gjns}H|KkG2w5zOj=Ff-_IQTY(@yR8`L;H+wFl#az7H<>
zRiXLJUp&5*bvF>_*W9DWudKF0$r3X9Lqb9*u`}MlcHeVG3kuXy-*pti)ANxiG+?Zc
zMSMIegi1oPAf|O$xmPt`T&2Ud$$$e_Zqv%`t$$oXH=81f>;}4(vvVB(^yBjTJ1K-Q
z;;9WRjgzQ;i&Tp}@Lt8}<4YBU<}jXJ>>pgS%VlEpVj{s|zny*W-o3;Z#T{m199Y)b
zW$|l^dYmPbEa{z-jU>fQM>Y-%Eq;38h<A*PvdmoOZALA7j5Z9ieEJ4=!hB!cVQFlE
zQ`EHHy}SAPWMb^V=9BGl%Y=MUpEvF)o>MPRPAjEr)?0GS>RFN%*B&9{Q*8y52uZWm
z9XvfLzOX)D2pebH&1<b_DjNBA>zX}o>e@nOWu<3ZdwqQ{SDv=>g9p*aC3B>ES_oyi
zYs%LXv+q1E%ze^r{6x;P=Ewa_2nhMPxqU%0Rq`VpVwqorLwh{k-6fj0*wFQUltN76
zbh>&Q3k$3IO3&NR$4g{5kmkz7OB)+<Uwc!bywMn2TtQLPXrMz%NM6R@^|iy!?WE7V
z4!JdTV;IAx$qVgM1Cqn%s4poIcCVb{V`9jZ(+C$hAV#MAv7v<{7B@Jx28C2>PJx>d
z-);EwF&dt0(G|{cs4OvCepLGtqYyrmGS%7ge}CX9U5Sk_F*e5J95zf&D_#pP*s_{t
zSd`WmE>e-}v($Y_@}R7-z1{wW{p@Wa_RSQwrHs-9=RVZmTPX4SUe6Hw?&mTU#TsmP
z<4p%lb@=Fr=tSHVV#r00WOVL$Yb6aaT`Mp0C42ef<b;Bm&OEn7?{4<G_Q_T2`g-9>
zdsDXcbS9h6XKmM8bZbHhk9g2uuQC+X*ORnS)<WG%xRAnMA5PeBlOwpRiS72Rq->pp
zJP2JItxA--ZE1G4&k++bvbJVA^?bJCm%q64Gshux8iQiTp(>Z2_bV$^#E}s*EK1F4
zDI0BaxH=cADk^OEIe#N2Z{s%Cwo_g?)C)TGypcGif`1OOz%vmMQ?c>EUrLw!<Cc7x
zQ0k=RQ~ubJVDu8S#KSPx3BY}gZU6<*vFq~k@+Llqk&nrUK|BJ5>$6o!M+XgVpu*CJ
z507ODob0ZsBx0kWYz7h>vxm;GlZWtmO_6KO5GAm%uvFb`Y;M-M{j|lUr1IrUxi~pn
zI5&gflkX7i4Pu7$6zEv6Qg^hsGo5=vzG5(9f`WyHdVwZ2hmrsb)i?B4|JM<bT*G$v
zT@upZ;uKeIM9-4Jqetpd1-8`{6^!Y`fsk4`no1ZM(Q(On>lEcRAD59~zFc`7u<T4;
zYAddy5y(#I(%IIgA35OV>E)%!eh_%zA}6E<;fFm{$!=UqCTYl$F;QXCd~-JJbscF*
zTT_#)k@pUSy}LK(N!B=Wgq|~sSGH2E43JgH``$o&BHOj9F@A+RvOU&j80XK)^XkX+
z19+TVORMPT1X?(<Wl4HEU(&NLjo8`Q%c2zmATf4BM@M(AF6z3x@bj#2?`DAmmHqDn
zH6<XYU)1MFMp=+S+`-JQeE9ij>Kf~GmG3L#wBVII1*Wq3CKEEj>)7GFf!iL#6)}jJ
zsSh8BP|dPGq#OI%d3$>=eChVSya?d1VBOa-uP4vDb?a8Nzj=aM<4&KL2&5V>h$S1M
zzwu-3KZbPidw*@8gMKVC366ns$Ht+s>4B&+OLC)LVf_&e8Om>e@r&k`mhU%h(}H$+
zq;3&ydz|^xbGNj$*@X~V+t^65G(SKXSaxu%g3_T!SolYalhx5cUna14Qe=tfdzw*z
z4O{^Mt6y*+$(75xjkSNn#xfa7Z!em0dAzrBP2L9@%@$c~4|zTta$SjW`4*DF>E&>v
zk%YgC&t_yG`OTa8&BF!!Ta0W~cSnYY_s5@4ayATUoAnk{RIp<c3KkhmAwIr$ha<nR
zfAf%WA6aztCRbEclx+pR+K8#@f>7ixlB<)aW&IK2`4w7frip7b^EZj^Tx3xh4nCNk
znlc+oaMx~q$CRu{vsLnpNB8~H-v=#-i!&Q4HC)w24aXskn)ASYq4LS9<6{p;3Px!m
zD$y?I78(@DON3A}@e#$orgE!clVU<bm_}|8Y~kd5CUwK<rtI%V%gss4#|)$vX7x&%
z>>d?`J?BS@DH6&LQ9eVBw?5#h%9yyu!&2Y!;pwC3*Aj`0nr-LXO^%t&wJDF3Ro}=e
zPGvSAt39EeV68@lSDDHzFPt?iMB7JE?|q8dmxE+PeG>~IJB8n*B^_UDR?PCT!*qaG
zx!!ahdY919$%XFRkqjr)wh6?bndQ@S7Cf1JyFm8Vl8*geV`?DkzGsII+Lo=UDar}k
zO<ZBe7pc3`Oa+9CdOxb3JM1y#tpy&q$~9NQ6Ex+ebnjRdl^d$zoF#Ue)M#4$`g7T~
zi9`2gp!91*+#qh!ZTd=uz1jwZpI^tI=;LEi2oMFEY;bPQXewR#?RY?FMb{$zJfU7e
z`T>(}>+IpuaESTttf%D1FU2Du%AG#x_7uMPndf|BVe`<tXmooL&V*L_)sc0cu0Kc7
zQW4MZ8`oT0r$V8lqf@w8`{w&<=EZA0{?@j=?`H@{)|t7vw3s|yICG9)CTdV=Y#n-6
zSx0rTye@knF5<bn0*Uz@7hb8(vAmatdy-rN1u|;4EjXM!x{dFa-OPqlf7)Vj;rTY5
zW3+Z5<#x%Cx8dOUEqN83)|@Hdx&FwJtG_Q5#x`s^)pad9!kZQgLO`wAP&T)Zx4xgt
zgWzn(cB-XIRx194Mi^3}7vR83=GyHne6z!cSA5e}fSOCG`mya`nt5B3okWl&Mu_Bv
zhT>2HQ}Q%rQ#^$Q1}EQGCF@-Cy99>#?jysrmi(u`*zOPiRMkQwQ~sr6b+va1#{{z_
zM~+QaF=s}EKz{h`VY{6>RQi&jl&reSA%ygf@(&>)Zsto+vv6@q2;)d6z8_H+(IuWA
zUpmc76=LayL8m2$L-!OZN|Q#uO?!(KihIWBq8*vmovh5_bF-$y|E!*5$7*_4pb#f@
zCQ}PdM?Ak&Y}$h3A&(ipPWkNWYIS!EQ`d7f?A;*2YUOM~y-P{DMUbet4w?{epU;2p
zTk981`O0Y8$7#nkxwO1ot=q(iTIRkxT?~rf@$AF<=RY)6)EwHE7Z%oZ`f^?6p3ey+
zKYC@%^Q!c&L&M|9c>e9}9&_}tw*hVDF<j5|ew>S;2$7kGYfzvU^elf43;^-65LRMi
zW~~eFnQDXiHl}RF&|~Vjfn`MWzMr8wrj4xXH>E|kyP?CM=&zQ>jg6^LU%Z3QWoqv?
z(HGfX!MUp?LHlqc);;&MJ|atKQIfj3{)zf<ikJmOlbrX#-lxD<TQOBTrvCl<7Oa8d
zl+~&?+|p0x>p66($fM9`qne}M-Eiw<eX27Qb`m8}$r4|Djh#i9L2Ce^)>2s+jjP66
z%lalbDk-qoctdTDl*aM7JDcb3{+;@(NlFhN66FaJE{uWNxh(f&95>=!7MUyu3r*z<
zFI1*P1>4t!UPVq>L)lrm{nt9ycKa}tnMmfalvPaz^Ec*53i?>jhYu!9?1HpfjKWZ>
zSrQ-H)pDX4vJH>z-+uNUk?<lGU1%+)>Jq+tUO;c!T<ILT%J<Z>mj@*>j>JsGxj|YB
zV`WUl53&^<hFaOPJ5~HjSN$YUzfatMWK>Dg{LOJwP?xn(nbqomTen;b_jT2Rq46y2
znK9<1=q6j0QVq6HQ~g6+|2fo-otS-{AqYFScl^b9`bv)75>XM$s%DwA0w0Mnc7?gV
z$T0R0?Tb;zN;Na6sxhnIZW~mSIQ@#aq*;_&w00uAVnNKa6|2K5W`v2&9F1A!S)6<|
z8B1xdj>K(J?Sa~m<5?F4Dwg9KN}MB0^3c|IpGJxb$*alrcl&+PM^TQ(w~Y9R7p~d1
z2p&jT-IJRx@gPY?>`ABjI%K7PQ#Pt*s(va{$!m9N7eD7AOVgpa6YuEA<<0hvK3k9{
zeI$`>5Vd1B#<2pqko4PJ4LVA9Q%Cj3^$?qk7LAG?YTvve?^z0{xR*V)wAu^tinY_|
z^37r6pGLo7yJ+*sSs^k>jBq7c47HT$kJIlkJxKDnOcBRIB^?R3ryg*>ziN%;*iE%)
z3W0e!Y?^FLpZ>;9@<wWLimL2u)@E{FMPAAookzAFTLyM7qN}#*OwwP`ISF-vI8qd)
zE=@l7s$GNZStV|faacX8@o=+j?#qbqAaBt)Lrzj`P|Igv&oySEjox3<d5c9JVx#Ff
z^r6BQ5n1}@w~`e7ET*gLK;wbNz(U0JL)AIYbRLtm{DsHxL#K@WMx~PU=h>Xp%3J*&
zm7m+(caw|;6`60U&yPd)wYUf;+f!^5NTY62&!R4G$2fk1wY2D%ruj|MYAN|uFQ3k#
z6o#5{k^)ne{EH%!Go!;7`y4{IImI+m`Vc(|b2xoy<a7qfit_T|qepa%YK`)pR3!4n
zCnui8+19(t9CjTPox>ldYpTY07eJJe@)XCant%rdOKHkhfSrT>sPeQ+O6edcwX4n}
zM9VZzAYVvHhvfmQ3j9V7v#F$6Of}omTjfP%MeamGRHc7xs+!(?{mC(h`lJnEd(V|4
zk;5dUaJ|}vUP#vUc5!W<2U3$GNc&@xGqLl1bo1ik>A~af@M;Du8k26e<Ug&oG6}=l
z?>PgD1A-(9SZ{EXyrp^Ed5HP+wvr~BMfd?`B+;JG!K$qJ{V0_k#^R<~*@JtvcG^96
zY#)8{?6{%!XUw`mzi$bbO_7HdQ9A|ux|&5dPbGeKetv+!;F&=HGh(~FioxMbvNT#N
zy<S9t2r5#IP=m)0wzE^hOH`K3y`S{t@T4lMKSgBY82R21GjSWQZdPCj3vn&h#<A5N
z9v&WS-#`j$%^k2>QIl^584Q~io>6OfXUWKJtTjGmnh6a54r4E95Sd0xdy`ANDJ@2d
zLeW|;=4dO5*_o+hm*QrUw9^PIbw<>`pZRN%%Lc!d3_=MR%L<N;nGQ<)F@j3tB`2f>
zE>*_e5;gwx5jOs-4);p9<JSX}niy?GqkayhsJ~5bE8KPN=-JO!Yc+amw?{imP<eCq
zp{F`Kdek1thEf2RIl?Ku+%H;dakzXVjY-nJ!Rtf7PY?&r=TMh@)#N?L$i&Us6b@y3
z6Sk&oHH9mTXqDD)481Eky1nR++Y%oe`y`tzYm{hL@iqUo0n20t6JheQs$avDZ}pv&
zN2`~bq8k2aE8P%$;~Y;)81A&QHQLXJg7mK5UH;j*|IDeBmaz8o_@MQJbN-9#AB$+{
zkQ4#IUzRYEdATEW`%ZFV<iE27{|N(uu}`KAREW!k#1$i96h<-ZX!>Y6;}bo77vh^w
zP#Po{HC7~5wG+cCDmG$N@ERU;_22i*E42ubpE4&gUUw{G%Jlw0Tv7F&J-f<D=P@-8
zdwc3yA$7K!Ic4(jKC@l9k&<WO3T^hzl{UL#wVb0*ZeP_l@pQsFg5M{(-n#3p=#xE?
z{d6CZq_+CL%k;@valy~nK>_CDGMnGGj*n!wi}pFvav7pV_Z}B2e3^f3koBisbx54&
zUAtNK<-(hl0q*QG(n-hf$p-hj1AlE}&EwJ2&4{-3O5gr^@Vb>t8Sm#|3%#HljsY>v
zEgm87g^U#4Y%YiBW12i`YaX@vM$26v<>5RPb_5Z#6SkSg?p9xLoFKufz0c$1lz_f^
z`2~fkH-|UHi53Q@gEik1@|wSoy|)rgc3SW=e53^JeS2TW=tbOB_DNN9gb9NKUfinf
zm-c3&;0xmH7Wp!#=aE57@ebT<_ngeDhI6GA3py?d$2dF6Ob9DJDgTcy%j7s6%;Xp^
zBnBd!%pUW9_3CaQ^dy}_c!_D1nS5^&l}XWSu=!B5xa>Fhev(#8#Y%XTQ1CJ)7M)v#
zW7BB5(apvDVP|u?l^3l776FQ7i6)NWvs2k0Q$lxInr^?DcCB3Ud}yAN97bAJOdrd3
zvx)2D=t)t_yj^IKQ7M`N`z*2WF$Tj!=>tRWNoKY0_nJNhHzF_+G-UUz=Nu<Oa#8n3
zqbb)+GhDLvho{g|KRx-ucXYR@uJ7lSh{5r50f%Oyb6gn~i|njM8Lmh?F4Q+-b=C!G
z<3^+0C7DZN7DZ{j+*&=YH>+8H@sO)sTaS4_{?paU*CD@ptmsiSdS>NX2i4slKk=Bf
zT{hL4Nvlo0$vtrpGQy0yxmmO2cDlDFKS!_ayeE$)!;7U2?I$%#wvD;mvOX-3rTMwk
z<TN;EtVw-&WPK<)d9BEyCg*8Umd+<5wW{3ltOJ!&cI|wORP4Bpw^!C;yH6=er}!{-
zmlD|(s5Q>DntM;%ZjPnIe!$ZyjZ<GudPIxuwf1!?T_C{ik#cr$25r-6>EcS#ZYBCA
zbIa}k<N4!xjW*`;vY5wJuh*0oYOkny#xgvy_f-^hoMMbEOoTP~V%t<awH5d0TXE?T
zsmGfiCa=G{v~u_h1Ud-AK^G9>O|C8e_Z7f|5Ej5?1qz70_NkP_vwuJ!U`2Qu{QeaO
z`gaxx5S#ym1HB0Q8wUdX=06faz@PxT@;4VmpN@$7n+^IK3<7qC-3y5Z0Td*E%S+}?
zko3I}DX~yV$uJ4&@cZ%+;);=C4<bcXqVB0j0ibkOI~ri2JNhwz@%(3A$l?Eo7eW9q
z6d4N;4p2RS<^ZDfH!vhE5^`TQ90|*0MBOY4`I{U9)Cu4rKyCK_4?e_P8T237A%Jeg
zlp_Bjh=2w9haduk2_T}s2_pJDM8rQ7(ck=#Jg48^{1B4+`EP*ezvv-AhX5M_TIg?7
zNLn-$I3H2fC?qYU5Fw@<3Bb@jwJ6|)?rKE~>qOtti}@FD$TSuS4q5*zI3$W>fc_^r
z1T@oskwamz|3wbP!~!J-d=^kne}hAkQb>yEU)Z7KZ{cK!+~2y{+U*1CWqb(<jA{w&
zjkXm!BW0VyOH$Zv#I^-$2DEfM)npm2IGceh&zhIY<M`<sm)P_MV^by@ZEI*RI~&A(
zy8KcPM-6OpzrPDT{$g^(;=}X1<7Y?y@9+Dao$}QMaCLR%$Ae6qE8^4yHpTltaKVqx
z%TR>eJYYN8hK7c;fWrXd0ygd9cO?FE8z>nK4GlhFxB#Nva&0>S^yTLtFiDKK(|gxl
z9J^u(P8!7;?*5{#fnw}RNRJvTSvz1Bu`a?ZNGBgY0Z@jCd~m0Rx*}x?i;Ihytpvwk
z`2f43%z{L4x?Uq*zXnxFSkx0ppT=3?PLI!X)nGg!4b{J}AaLN{x4G?%gQcvx(uKGL
z9iPY=F1VE@g7KF|9iC2~1+Q1t1_z@(HPX}5JKec|+2#k34*a`U9c^uGt*xyJCUNv)
zOK{n@H@|+ZdU@7fSC<H1N@$@u7a`IB_r3n}w=P^rCA_ZgiItTVSdM-E;wGAKfwPP<
z_w}dziz(KfaH$(%D3j|h89_i1<T=~f-F5poO7%Jqet@zi?_&vi(+)U^?QorZ{m^xJ
zdbmk@^eHx$;Fpl7sAx`pJ`shm5dseRg#|qyAD_FI2z<R*K|OW#o;McH;YP7)zjl5f
zzX!m`>+&?!Qpx`0cf0N)sY-3D&Oc|tMF$bG-73VW&SozEcMa08=-WJW06goFv9a-q
z?<-ENn)%NlKhJ}Gf6+^H|4%oGXU8g-_w(?9pANl+e>`%?B^8D{WUipV$D|^dLWIQv
zB@{?io12>(_$+C)^@)Y2r)Tq^{o0zFrKP1#bt7Ex3~Os^i5Ue&MA$!}1I9sI3YK49
zXTWcv_#i2e=+H@OVFgrE+&;Se;??!rh%wPr#IaW8WVGGwQV{9Zw@`RxZPQ?5Y=9q4
z4}^V#zgRE@Hil_G;tyGLUxB8J={eYAA)pzM>U~hS4({g)aTYV%l?vo%gMIz1Z0h}c
z!aB)N7hzg>Jy!m7R8;FP3JVK^^D(ioeuIc3Tn>gcz!KLz+`PR{TMbxX7^<EO1(h}O
zi41K1c-CvlXBR@Szm>TPE1?~}I^DXq@gu||e&NC?Rta$B(-IiagHYyOA;<3NG1@#7
z-f@VfR0KyGjbbWg;JTP^ip^AcTpXd9aaDD-RpRuS0u!IOxcE3D-Sz8UBDv#JQ&Z|F
zL_|dBWGT;{J*$00dDPwAjl}NI@S1w<W9)=!KdN)i0C`~*+5XL-Wm$#DsTK#}XN}%=
zNo~W)mik#(Gl4+_Y!2R8kmP<lVL#-{#7M(Xe2MjtmvSqv8|aNG{;anabv~2P@HJj6
z(ckloxy3jv$CxPI^!)jaz`~`u+1c329tQw9t|qEm%J!JH5r(6$w?T=gO7`&1GeSNr
z_2_QuV74r~kl023?9uai#DbHcyJiHm4C;P*f`qfcfDcEy@}pEkmProGdbL?M<l#GY
zKW?UG<eLDqFo+>^=FNKTCk1(3-T4DxoAU2@eK7<$3<EdY7N|O5UY^{0UW5Uj=H})b
zYp`FhQBcIRs_W=rT1U*Rtua_Sz`BxoqqI<{nm})gIOEI;@t64kPaegocI2Li^|_98
zYq5!VJ`w&8*r!(y2v%|u6`0K9vnB=oUKx+eza&$;AizLdnOyM(Xsa(Y%j?hSlQiz!
z>y(rQ-$^1Q0gKXavzeeTrDg^4Lw<%a5xZ+x58dzM=i&$H!S)7`?hN)r?e2lhoa-x?
z9SHLYN5-Ef7A?%5sO9BF>F=Nw|IoBBi;;U_IMM}AfJn`t{dyNupQ}%mEU6kv!+faJ
zjeXt>E9CBmO&Y*E($gb3sD=ar0op4vP*lVTyH+K@z{$>zM%Vg4Nl9X--q4j+suF4{
z%V~l~-0ch)!v~%nR$LpC8^?4)h=oA0hN%@q><gXnEy@T#QTk7W%KD#adtg}2*qAGo
z_p0+9$}JJzxKRm)ZmS{rG1fY;uhf_`V=QlQ(Nj_N*f`^tf(LAxUg!Sw=~MctJ0y`P
z6pF1C6}Y2@an1KcM52^8+(j-=2ku{7jjmokz~tOe2B0N+kd+P@oDuDuPPJnvqe44>
z96I3wisUSP{EmQt>Ak*kuk&9Xs-Xk+RF?()f(Ap3l5YqlO}9t<aI`o0lZR+U+&>Y|
zl)ro#H!hvanP^64S6EU~(%jrk!6_>%o50W?^}MpW`Wac!eUeDx^Wd%9LPFLvA+Spz
zD!1tx13wy+l8DHbGdYC~Ic&RNn(nzb`m4&q*fX^E<40?eIRCcB#?U!j5!EEkm}F$A
z-yTlokVuveH3<;UKiufse3EG);==Fl;W4!CxttV<C2?0=oLjJ|3T~c$M2Vi7y4@T8
zH;*PY*0+qzqc3Y~6M_;==sO6)&07q)7c-D&6aoT0aqwMmbu(0*YM=U9lfrK7;QCH7
zqCb}vnq`>Q|B~rEg?VLWrpOJQQI*qvirw}tg!&uUpAt~sH&QcjhG<^Lw$dcQyF${d
zrlEoMLcn4cLe)8HeDC@i(@QFdQz12Q@~PbuzdTCsVokdhT9%_!tgQTyJ=J{65mBqt
z0KxoS%@ZIyz(W%u!fRIUsXTH<!J3lP;FZ7;*EcfSj_W@9eXc;8Gc!G17_t2g&^cb=
z^{wu&bwE0jIJ{jfEM&|KyJ^pzj<=mk3VcPv^RKILaw19F#}*bLFB#bZfaT@QVY*44
z9yJ=dmzfdaIkF{-wUvn&LN0*Hd+yexI+Fs|2P2aFw=Xt&E1NqzW8TKxvGnoLcdoaN
zAFwd=+OP|>>Tz~-?6x?os;R-kqsM!|He#R%#z;5kPpn%E*KPQyHh7@^UiCUNeDp|K
z-SV4>_xcsmc71p()-NR!JlhP3gL`^<kfN-%X=v~Iw~rqYEEi%F4sgw#n}rxP+j!pH
zG1*LD8ftD9N~@pPK}Wxa#E}ORZ_3BWPj4Oyl)=$3^dYFf(sauaCDys5m7H`BJ`C?g
zC|_(`-1Hs07w&n^g!uRc6?tNi%0R}F_~JUC&EHBv*~W2DVo6>v0c5U!wyM9fLs>-y
zp$+H$h#vY4zm3RSd28iB#bH(X(+TP2i#3eh+Y}@O3}KtQw!(^H`{SXvVX#ZGRC$YR
zaWJ8x-c{$7C%(Q}Hj^!2&Lua6N}%$`%P@wPNos;Or7lK3AvZ7-4CfURXbHdW|E&iL
zh&%bO+uW{CNMclERv=G^P(^fO3W|%zIpPOoXJ+;Uy&=d|y%oQnuf?9aw6e0L5i}-O
zykx2gujl+}7sAPDOiv6<N}RU%K66er3jytB>S#fV=qH&uU-40;+*!#s_~>1Lk%r`i
z-k0F3mV&^8{Y9Jn;uc!=hgi|k?{+N{U!QJ7^W=&8kR)^L(FJxOIyzK%Pv+(*UdSJn
zz1w9nCS85m*=eXu(_5wIb2V+&U1V$nBNa`~srJr(=JEE0Lnqk!B=G~O%JXoRZ!n4g
zx)Twd?|(FOYpX%u%rtgz0HO;?qW)MEcVw8<jYXA?!IX1Q{&#OzHMX>*)3Z{L*0PoW
zzV;`o>K;EoB4ib_aPHkZ^!zKiVFbrIuO*xZ0}Xcl&SGX47AQmG{dBdoWSV`>FD`y|
z(X5Lm5AmuBEwqX?%tK-kXCPT5Kv5y}hWJW~2CfMHLx6WrMc?~=u5Nh=j;NXp0Tpv%
zFW3s5`NlBQ`$@!AtzCJhJA;-?`I`&P^pBmL(IOG3d%L^qy%{y&Rz24YOf`!h*VWNc
z5@m70WDD*E6FSsJjt8!q)>gfX=}~x4=}V@`a7>}=3{rd|W(B)<O^Or$?DckK?*g`z
z@YLQOdrfDQh>N&k6{NN_y@p7d{OAn|It?8)HRB%>ZecyfOV*!$_V)IB07@bl-im!#
zU3Ee`-<1)jmBYWL*H8=ovuVqx*z@yq2Fpa?dyi00kO_NGP!Q6OdZ4&C*ekSP=VxsJ
zp$gJcTLxl@pzS!^@Q=KyN|JtLc2u~SArWccmLQ03_PKSeV($O=A;4i0h_k^M^e7VV
zt(#;Kc)@C7Q}?*25gN+Jsc_z#-|71ROu5PnhRPf~Ejd-PtT$q3nzfdOT$vdeAp1lN
zLkvsm&p-I`CG5$vX~@YaCcJ?YgMKv~W};fdclsY1KYUHUxTc$nzWM5hx2QjB=i5-j
zXjy5Tz0aSo>IH=siNG@VN4=1L%VzR+_h@@0eIidRnj7)pZWtspE)k<<fl2CkiReQp
z0IRRkx=K6D9BtJL=&K5x_XavUIo+^bHVuI1j>ODb^!vfkjY-v_5@iWDD8XN}AlsI8
zd=>2AV%O05$(}t`N>4UKGX`5u4FnT*c5jhhQ!CGF=K8Pv&-kpV(!O4t|31WU!PZ6c
zJGGB=aySJVAv#2we9C*bTNIkxjh2)xLQ5!*K-|Cl_71WJy)Qy~En*Gt;Ca_TF4f%B
zbYpm!BM^b-7gn(x6ha;VML?)Rs=A_h#W-(u$r8Jv_}#lh?|e85!2L#z)@}mqPCbpj
z?3DfJiJ93A4KD0wG--GQ8ml*i5e{BncieFo^_q29E%o&?%g@R!#RAhFQRvW1%lG&9
zf65{da-7)DgbV>X5?q-wl`9zLsT8lQQ~;~4kILS?)D)~*f6V@FS7680d$XS)S^kAB
z)m&@udN(Ofkdy&%s{M6wDHXhep*rLvMU_x=U|&yBJNs;M8I=*_i-%Cz-QV9z2yB6x
zNwQtd7jkoTU#eG5R?&2XSPwVVfthv#oC^EnAK<%RpMA`J>{xqzGWv4o!eM1{a&qm^
zJEfl(c9M{}D<?&-U$~dFWX13;hNDnz&iy}yj4YFEMR86~uFT|>RabBCMw|l@?;bH2
zcy#2NL&2_XZIAdS%XoEPJK=`uIqYySzIXEfqPq@ucb|K6v%i6-UvxE_g^1->{m@>t
z45Qq0IMyowo386AfpkHxdh+S!ha@)?PRLPD?<xN==cSaP^M~Gs5BL2~d0lUR{r%%d
zW4YZCYkXlFG!F<yya@5o*3?87SyY!CZ0F)Z@L<v5J=$06GwVU+w>}hu=8|}^lLZT;
zXZY^;_!x_jR=6PQ>1Bz=8MG&uRpHl-xW+JqeUEP{po2ed;b$EJivo+2ClBMzvAYNX
z*0MEqpJYK2v#B}>y@d9&S*C!Iq~5)B3}p=F=gC0F+g6*`{s~F@>@ISHp`bC!3t^S*
zf0#gi;Q>?$X7Xyw<Ll`?-Li=oT3s3aR@*usF~WZdejaS>X<p`EPWxW-WRe|vDYTo}
zaM`4u*_$b$vAiMre%m?+phdza!C*doO5EhMQeKpW-)<9PKXWR|yANm4XC|OJ*uqo9
zdaK8wjYfiDhx!e=Pn3&xVYW5mRwNl4y15Hf%T;ep0_j@n9iBgnsa||KfJyWIIX|=-
zEZJ+X=xa_gijrEhwS?;@>Fmxs9?bWK6K#$rpQqe!^Iy)&&CHaHMBjggca2-`O6SRB
zNMhnu%^V+~st;ljQBhH+seLx7_TzF+<<{t}E$eF<PUvXMO&E&|_@0Pm#a_5{DD|$4
zK6P>79dUN5b@sD<<aQzWzE<g1nKBwdKpe6CmD2h@%*tqZ-;1lLmxp!Orzi>xjo~%&
zg+BVBKz^w4k&c$60+|gx#a#pR(hbeL-t*)0?-d95uacrQ^9G-W_e!1$D3j<~>gryz
z*0r0;S+<$|v=xbhfTUz`s<y}XAk%2#Y+g85wG_Cwsn2UtP|r$e;9xja%PA^%(n<uY
zI&j1~sjz+PzkjsfFmZ&xWsa{@pFizm#U*L%`StxdoU;L*mk?T@GG;RPxEX){qP4v}
zD-TWY*+OCl`F*a3mX}ce`0|O5!Rg%mrN;>J@)ks8i(ggPU8Q3>$J(J>kp^Tcq*EO4
z=u+gluO^z_jHOW49q~{_drwPZF+<}R4~fC0ezBv@(C>#LGw{j)^s?;y)y#$R=zYh?
zU(Hdlb_I5*QGEe~zioaD`3-+CUz2S|cH;E3Mi?H}8V{!+xz47u!I;oO0^;xL12(tR
zM;Teap{`j@XWXw^wluqFQ7$3b?6`}L_nH7dvrRpTk>c$0xO4x0yupaBnZ)w>Y|Yc-
zV<3mmNBJj2-Oi4-e=i*zLcNzjZs9>iNg3E|w$|o-$f%sH-uTv{ftlCZAgryd%=TUo
zdp%zyO4W)OjpIrlVzC55o3u``)g0%@9r}0+t7%NM<)p7^oyI&Sif_Jqi?X~?(Qh(+
zY-iU));A17Q}MtLg4_nEGG^0M?It);M2}}Qp>GZTCfu)g`4>N+;%u;oMC(p_xsX|^
z%Y)~b5d^K(dfD%t28GLklr8V2tnl^oQ}NYQR8*Y9K|BsIT7Axc4+#C-Axmt3DdCtt
z^H25O1)v2*hG?i;ysp@fV6%7hL0jPHjToVY3VW*bO4Hey54mB%1{y6%!_fOze)+z8
z<)v#4P&V(YS5{RC(4<kP=b-UIF4x<a8x|J!bR84LOkN%<=USEv(mm4QTCB>lIk<br
z77=p1!2fyteBOJE{l1h!V+9p4)fMd{-&ZWo2E|N?wAx1*(z2rx6Owk!Mb_a3aNBli
zN&cT2K@%AqKyy&KqW?T~QEa11rI_`j+KtloL$g*x?shh>>*-2ctJe1fRl?}Ld+^fu
zk_KrQRL$9iIMx0m9qDJ&I~O1(*&67?{k8_LYU2&-h-fN4b?P{VuDpQK*!#*PL7h3+
z6xX;7dA}$Lp{u#mB!z0sw49AiJ#6}LCxC;Uov-IfPMH`Ts{h^$8x#7$&07zPu5!*a
zuikk`r9~`oU}zfhs$SDZ2sRa*D~icx1TUd01si>6NolQ}ZR9#WW-Nk6;`jZduj{?x
zO_er$w1mk*;nDls=_V{}fr8QghWh%ElF3%(Tt&^#^y~dwQn}MKta0V@L_DI7D;$)W
zEuO{Q#%E?`UhZap!x8_G<Ih{R+QnJN5Tkk<p^Wb}hheFL(xR_Vp5I=X85SH%o0pVt
z@=WII(-ziU7htd3djRJ@hWO^A)4j@?Nefi`g{UZ8m%(teVIh!%<mihxG8Af{|06K#
z$1+Hnn=_in*0(KtTaCEqc^0@rVDbV|6=jGV7A-{=S|}51=z*mS?9no`%BUUkcH1ud
z&4}ht*wFeeZPR>ZHf>U`vA2~><lPSKHFMqO{RZtzR}t-jL)i1?R#w~1pOkNYZa3ss
zp!I_Gf{kl;XM>8|s4!8lln)hWWM<yzMLT<xt?on`HKyuToHmb<{<@j7wx@qTGZwOP
z{~30}=u>XC45F<~P+3O@{59qr?d*meU*lebk`1FJ3H#GAw2cWeQ3gYlp5#HX2+7LL
z74$&pXoVX&KS&|4Od1+ewDe?Pdlc-}W^Ha>_)FbU=+1U+dposkh~NC|>=V|^&>*rW
zuKIOCn@QsJ<}n0wEz&kf`nz|X_X+n>!L>Q`w69&47hN-hL+|2Hhp!ey<M+agopNug
z<58ULWJmm7{=hphi8rUCtxaBkn^3Grssm9~Ru)+OBvz^i<(`mGzm?%j@`2$U7f;VL
zX*sp7H@&IGFa5IJr`bn7;<kKz67{tadB?|FkbT&b@4PWZ?NN{PaI&!2h)wmXSg0vW
zt(uc#Z}pt&PFb3p!+c_XjD-D5_zRh5&D$nPnb#D*%2=cl;ELn%aB^_)Kd}o$<UzB`
zrfG|R{-W|qW+s)Tg|qj!HA&v@5cHNPAD4onL2pIUW7*>v;#B|l)&WivSoBF*r_VuH
zUk{M<oHdngeDf3^&0Q7}9IL^}(X=Rbhp@Z$W@bJ6W6!e)+-Vu>fymsqxNIW8$Iqx}
zhU&-K!bO6UlM@B8hQx$sl2ol_LzMGA+`l*^TH_b4AVi&vgll+MNmWD39$6c|YKDhx
zYo%XL>l0gJ*e12B+erhpHeHtjvGYuxAj(`^C$5r?FVUG8i&;rU#c-(1yRM}r17FVS
z80I0Vv5ATBvm1>R*RI{{uNO&;d=W(?z!!qT;fxq27X7*6mO}8td}xHHD<=HP3N^tq
zw})CfI<DOD$z2~Xe@BWn<iWz;Ow&+$d_x+<W{c;AgBR;W2#F?st)b7yg%caiTIT_r
zm34Z`RD4>-Jz7J#(EgS>#*5pQk)5sC`SH)nN)Aqr`Ve9X8s#K*D}ESrhmegyk1Jak
zVi6sSFy}tvLR32kiD`vNupY*kH_g&D&&K9yxQXP}y3;s@h&8;2Zvf4`rFVpcPEn$p
z?JZZ0yPndKSnee~8vj|v2E863gtj`zVUC|aePZAsylY`^k6W-HqfM2I*`%+h$NTKp
z$B!S$*g_<#KA|eh4N|C49+R>6o_QcVJfJC0^mO_G&ntK6bb6ZjfNV5^2qb3Fu-ohn
z&0ozh&gAPVgceHRaE2Z{LlYAs!Wp_}m*{gzHyeVBPQv*Yn$!*(=I7^M9IRu0+S_Bi
zOZf2p>8Ws3j>{Tz`0|0@jHPMu;|!71GeuDD&>QMf#wRASzyCZ~9%#23Lqy>;=s_<c
z{2|8ja<<KImo`K05pIX($?+@=r&?nu^6p+zUvFZs;7wgB>)&#9sLnbF1>SeqSZs-s
zkiPPhauvT?2~vQFQ6ZRzyx57;UCW<z*nO=VRU|Hhlj|BIV{f#1U98iUH*Q~6?%rgX
zpPA`)U2ppS{d)qJY8B$;OQF}V;2lsJXxsaoK2M18g+^bY)+J1uCYuxc@veSFhj(<M
ziSeE_CjAXhpurs3S^i|MQYrzp!j?)i3E78h6WrXpN0K;f$u~()+QP{B1FDX=xCddy
z-*F%1PR&EWae0|Yc&hk<(Th1;sd-I9zc}T+WmSa*#SkJyBv_-aR%l@xo-ed|ZvOmz
zTP0$s6Ip3!C>?>|SI_R-%#1lm(ct9g?Y1yAg{n5(1~5Nmt*8Sem?%}15Vz(ya!Eu^
zOUOs<&{Vf%%4Y0^Zs#d6CM3@4X`eN&=|W#0O``Aq)g8HcT59THY8R*4$4mUbrQz-n
zpjJGXvQ25p6a+djLVoQxgfL??CL#IaRH;&}37SPp%t{jGvgSFVs7GYt`i6!w-F^O%
zirSX4#}8wEcY@TIBpa`di!Zu#nP`U64WdQSm3NhBm8b<0lm$cTgU_3v^QRgOS4oSg
z85-sYf|_$5+?#AToTA8;s+bU7{+^u+p?Pd?2pVEm(uDa^#ZdH$a2)Pe*s0NrxJM8v
zm3n!4N-@S*yn;<lDTox){iOH;+bd?=8EelpX;78fe`URlS}H%~Hyx8ptX~@59ZDXk
z?ytf19U)<**`FrNUCbaC#ZN|+*VIgI4seK+dm-F>s(r=et_%+@1_JG^De=qV01OG}
zna4ThWY6o);`-R+gJMeFQ0`6iB1fOxqM^eOWLFa_TV^f&K&rdNlnic_O!bPJ?}W>h
z)hq$|jwxVFbE-x4vkm~oOx1w?Zd>kpcI#vlDJgdGU<EOb$39AQfLN;1AqQ1?I3eA1
z+zTRTQ^0tJigJ#4_eJxllOMkz1tFvJFoK|K_!OsRyYfw8F_m;Z<?`a9K5u1M8=C@X
zh;Lq<m4cON3K1v=B?x4Nk+fSaJuGklf_A;)xLxls-){}a?TIP*fh46|t=dLbqwbbD
z#s+|3ycW{h`pQb4ufSZZ@=wNiq^5>q{Y~MiHo`e{QB)!imw7zP)j!Zfn3iR8VB6K~
zwv@-0{r$JC6N->stVqgfTFs=DQAXq5*X-=W{0xe13%~Iu#RFcsGj(m;hRWI^Yyt5L
zb*g(3wg_Q*NETFu*tthQeVqtI_EmFcRSDx#h$U@3=L>rW4pFwiJ;4k0$BBfEyNI|R
z=*y30La_r2l#+yC0;Ux7MfJ5+c%lXk|DG2(4Gs>j5_bqW{yLdy1db^Y2HKh$1O9pj
z->r@2-v^HozaMq~I)AzwsG@``F#_l}ojr8mo6AeF^Fd$zHSsi$yMG)SDn1@hhrE6*
z&W}N%yYg&2Ge7?^t_ZJAUtb@>#bN&r2M0$9dtwt^Hy7ES9;Y19RE+lNqN7`DwH?+~
zntcyH>vN>?0R@rIE8}FfTRSLx=Fqa+tVvv9pO8q)Ow-U09bsRT&}^LFcPi46?l!Ct
zKd^p(*(JFwCokXi3$m+L8jUu4d0Q`2;m-Nb%)8{$KVgQ&bB9Yzgd;eY%{fT~a~2bh
zyrBIC3Q5&QC1?g1_G^>SdJhB@o3d@0e?rH91!|g&6(1G;!x_hgr6shg@{}9}rUawQ
z^B0%%{Z^ALNNp_k&U<fZral=j4%4&?z1!0xYH2WK;<9Pp*pDEw{U?G<bVP{8(J_2{
zA7L8un@=@VUHJ0joi5byP&Zk7A8kd0rfUiB4@Wx>`)Odv#n}$BWB&6}z3|ujU5lo=
z`<Vn6`No@<m<Nu!9Y{>%+F#R*kffI|uMqD)lahp!pVagH+x(dS#C#=3Mv)>iB~^QQ
ziDkR!ifY}60+r%>2;=%*Zd>1tdbUvO<{3HTo<JJR=uuX1@|NP1htVTXH2LwprcG8f
zo^2l0&B8|Pr;&-YZ!0njs&3a7$LDFqx*X65{lcUSH@19hdu>_-zYDX;ID&?Etqxs1
z-LzR)OQyAyMbhbXNtNzdUeY=a!a9e~f#$Qn_d}t+O~kkLEY<a<y1~6_{~;NLmk6!p
zybvcc3j(4P@;jdD+(YcA<-z)P;-ZzNI$1;$>=~&admC`Ai_gAQ1?%r#M(uXY-k*Ej
z$87k1tgXY>_t4nkW>oRX=0pU|ls@GL_#3PXS&?^5g}3fc96C7aR1lb3p4%v^@E6p3
zb7YF%{-QanBedg;)8p0s@z>nC_q7=j>=qq%pIIhB3UrQ(KmHkUW|vF()&_<urM7q9
zXMM7iLVOPBvhm;fC1Ut{q(QCb`D($JCE9=yb9B*AmYw@IePUm6+3%xgO)(Gu#r4p~
z;Ntzun@TqmLgoLrH^l^#x&9B}^AFwguUrod()o9^=fAifKu!Lh^aB%c{@1Xdf9M_<
z^YhQhAK+48<PQKo|1$LlVe~iJ1GLcJXwSb+{gHU(3L}5+ws{J-dBPYT<XoS+fd4hu
zC+J`1`b7Q<rjs58;LgqR;Q!6&ya@Xrj1FRp>TgH~7@z+&;0GX`d+i>7&-j6%JO2<m
zfad@N^f#dcqlEqebpDy~^EaULKL-53_@V!v@dK0&%=dwbLNMP)3#R-0Guj7W9T@HN
z-*bJ0TD|_C@S7|oe)GS;8|nlkcw?d||7)PbshW$yl>jFg#}tF}+9R(PS!|pZt&Zjs
zDY7z#mMy%*Xl(T|bG3Hu8(!FmuRo8+&y<J0AQJX7O<Y~aM{{=g-SS36zmJZ}LsGxF
z=y-B^dg^UzYPtrxj19C&On~1x1*Q^mXwCgLAnPMxoQ=0A{X+!w>_G!JvlS?8Xwb8a
z52ih`qx-}9x*2kC05pRpf{fPnAs;%T$Uv!fQi9&!>@jQU=W49kV{x&uu`my41rlm6
zI8lh&QYUuWD!aCzZMFyg9n#ty0r>i5O-(*jlfRIk-sOLGw6d~dh{RhEm57Q8<g}dY
zqEPPKWTtV9Uu}?QzNE^}$;q*7&@ThCf*K%+6Br9a*od4{1A^c6g6J-A)TQQuWx-zn
zBTw@A=2z(TzZ69!Yd=+CNiLy63qtV%VuB@mEchne1qdMf7+lb=0$ncPV;Zdj67<y7
z70udy2w}-b)&*csF8B(WaDhx11wS67a~q+#1O&Vq*>;7$m?t3GIE|DQk^WNtf@%10
zrw#o2{+;irShQ)wK0JE8vZLukmIahk9{&EL4(mP8_D*0f>Y~O%j7@pME>-p*k5U}S
z8#2A8r*JHb!;o)OJ-#MrDns;U1LBVi@Rb9bhcNy|D5n%&#S(OHReY$%n7H@>g;~I_
z-O_73#+`%PT^GkZH2aCG4ZBCDG0-`R^`Q%quXc3iPy7}yNA=cMi4zG~?sR@^Sw^kv
z^z<UBM`wRNA>R#5!ik~WNc&QFpKDfsG8X`=nP|pw>jnkH&CnF)6jf!G(szotBg!f(
zrQ2ZQ11BdJ7qC8e6l|=mQGOvcL{_#Re+_dge@2GG(!EmGgSnqK2IC(5-QC?A8yZ5e
zgA0^d(ASZ*5j^L9_5^&XZM215cPW;3{Wpqlldm})d_S`#a~ah7h%?s%^Bt<JF28-N
zwL`@A_DUC#JZ}0%fsgmpt&O&37nmz&Tib3*W0(LGCBqmE7h!nsZAee9a4KN463@ZZ
z5@@5p(ay{L6b{GWNXHP5G`k5xu-)ujN>J04r%9tP-n8OX>lzsmIH~21Y!5!5dQ!45
zw=ngzE5Cyb>jwzV*u~wgBk!7<5keVS2TJWoR4XI|z3RiA$L~AWAG0L;{5d_eNZ~*M
ze=G~E9?%v{Vd~Q79!(gWG(9~{f{ju8S^WnrF-=%bu(u?s1cL~gSHCRoK`S$~Z~5EW
zDsYp^TxD0?R6*%(Al?S0U9%<TOCx)A*Z^~LR3qDreavut6oRI~%irH0{E$p#*ty9{
zFkfUFNsrT+_FVq#x}=M`nW#|I*5-qxDs113Wq3lNQ`cuyGav0N850NdkwT@OgP^Z1
zDhQs&U%IQ%Lg#A3ID8E+&iTattRQ$Vef5kC@vgEZJn4&$6r7?>$}zzgU?F`>+CaE6
zNdEc0Gm(E?4@VC=H`|Ab(h8=b=ARJ%z2AV;QGVaQINgMr{7=#bk~E=-?yC(>RDvvw
zIBuXEgg{cNWp8I^!rFxa!tl+?n%BSfke)w^p{{QDtYoyF=QDznT1UURo$qHwbRI*?
z>*bC@(NY^c?ccVxFf{cMAM4eXU^%V@_J!(qV)5-8p^|G}>*P7}H_p@GPTfT!NC!xg
z{sbi6Z6_#QX%a;4-@gtk0tIR06RtsneB&;%^J`#po$%!hr0UdGFpK3Ua&!?uHv}Q+
zA3^=Ovb=zK&;IAWB6M3k9SOp=8CKoWu(-E{z_w(x0&{ax#nme*K>#KnM39dz8ggU3
z0h*-&G;|k57K{n#>yB~MR6l!Ym-?5D4y@aG{`A%slh5q{<|v44S%uKTK@!Oj75MSk
z_c^iVA0U#19VQ#3!WNDo%!2H1Om+nJXSG=fU6bEQ5wtTvM`ql>CPMAo77VT+B_-`o
zUIbvHhS86KJ%7T&gyA8}ty{4>-`Cbq?6<`jub+I`-DOK(krmN5_!U}+hFeZzZRvgS
z=WcB8DuilQ!4qdD5;N+gN0)Y53{eT@fKdI03*|Mm2%BTO<G}^MT!gT{4)u>E(}%Em
z)BhTyfe3+z--(x(dbdEG)r*0i@B5jk2vu-JW#yR5@qHESs3GGFwdrnDGZw$M-hpI9
zA;QDf4gK5uu5Ag-62Th^OlXAtjQ~Rk=L#e+lcqxnE9r<pAi8?j3l{eG_c<SKSr`Ke
zrB1VG`ZdjAqU7D~4~R#9ZVCAnGI8@?Bq5+Gicnv`>vQSea=j}|D(2_nA|b9d+tY&@
zMM4oWla@viuE9joql-4c#m#+mGae5IQO0QE(jB2+7yVqX*Wio6JNgE+m_z*EC&$M@
zgasfde1}4!%*I&P#3WwdDWoZBwZVz`oC*tu7EJ6&dz+pNn=-Ry^~D$pDvoy`VBSkl
zFv=5Q+J%?VJBsf}$(0yjYLrByX`_&!pd_)EhkUv~%*+j{ZWVrS(L7)ujf;m?oPQ#x
zs2zWvuYp|@tR|Z%#^By&Xf4G=OBfDDN4X@G9W6~&>V6&_+wO$$)4a7u@dMJR7Fra{
zLsw}Vfzonal)9ddjnS8l2r^1_!zl;J;q$TY4N}Say1GM{6=ehKd;u4Q_)sZ={ELPb
z6|n{cA2_*;$bcYVzNu1MUvJJL3tCcya3E)Tsxp=^ZCtREV@Ng6yF6z74;|4`8gA5P
zPq4<fMkt~q%Nb-uk3sJ*B}N?YX%B`n)Xd`%P97FDG$bSPVJBBZ$VO7KE4i;;y*iZ|
zYOSl2<g#2?S-}`DnFjY4&Le6;b!#uL^bY7fwKb+(KJfgm(=KglwvL2pqg!<Co{Y^b
zo0jh9RrAD8oWk6cjJQ()dQoo_ui)NoS9O}N&*8gT6EoV0h=_<Pfw?4?*1GD99ln8p
zt}9kdygner7+|hjA5fe(@(g|?7=ZC|+YxBcT;rN_+@XgJFd$8xRJK}<QxqCs*u2gl
z4h=fM*;V?HxLD@}8Os4Y_p3@m3%(sT*(00$7ht`PWfg#OsYkT|(c7P!hb7X$C!JU-
zn>phpBMy8I?|U1J)QDI{m%;AeqVz;(c1Qx?NF(f#j+N;xo?~F(2#i<P)|<DoiId8K
z8R<_{+vHBA$YfFHki6$A{~+73HhOyn>9)w+wTp|H$e?8(sVu)m9s9<-u>EsRNGl%U
zD~gR`{xdvDKnY-kk_U2J;`2^2U5D<4U>V~&Mkg5+M4cY~Hts~f`EC0JknBJ2?eRrD
z61w9vt6HC-3n$MmXNGn%n$Uu5hs}%aLn^>fT&g9jp4iL1P~XDdK80WWjQjKgmZBP-
zBy<Pk7D;uaLNH{YXZQZKH_K5t3;N`_LDP!x!;E1+KR-h>m^To2-Gcq=*RStXXD;^<
zi~R3+?MoSJaYLjTsV>V$l9USI%=`5~V$t-`e%>ng*+gpv@zic$s+G7x9R(GRIu0!{
zpt({sHEG`@3}I3r&<sb+Z$EVUGywTp^8lXIwF2ZR3NvRI5-IAIN)v!WW>qTb@0Z)_
zcTZs2#M*~-{Ba0&PogFnA~iE8!Oq!PPBruSx4pfJCmg^Vl9$|ftgW_MX@Dcm)p#v8
zrJ<KgTJOc3pG!+wQ`u>I`<U@o4HUxI?~{ap;$|@$H&jY}6Ta2;WD`?1s3cr=t|lv{
zb1fmgA0H=Q%uh}_$_DiTaxk51|4VRw)X;16LBfEIB<OpBfU^NPOVK98sm{-{T2y=!
z)OT+Rtgz(+A^P-#11J9P-5;QjHe%-rpR-RBrxt4h)kv})XFo@*_A&r7jrIUeP`Tqc
zY3b?e+BjM;wx0a_*;cuv_997FZX)kN4fhBOcTBoq$D3lv?`#vf&?;;<8EC2ozAVzf
z1b};p@zMz}rF@D%GR1r*p{i?YI)=H3x`PGd<ErmN62F}sJi@-_Nk447b~Nk5$ipYA
zd7V0kvDEtr(i4NYEP63tcR<x2k=?Sd?&>n>^Hy4=#zlW{)6Rmx(b-vw*J4_hLkH_Y
zu=i)kUKdR7jJ&d;p{Aac^B;z3P+It=1c<y*J(XdSX7y;4jSrU>ciw)(7=}?ZI1L8=
z!wQdyF#XSe3Hk^IU=gyuUtP6&cISZ$d?eGD-wRkqj0JDCbZ+P2@*h}^(RvHUKJNFZ
z$7mGqegYlO6RA-?bC|zpzAUaLUB)=z)tz4T)^VfEYV6huHSrm`xOg3-T{7>@jL>={
zL&l&V%!V21T1Odmc^Ho%LtT?E;lmUlqzRn?d8YjTBke7qs$9Evf4V`sK}4iWN>V~V
zK%^U_JCv4m5z?JXcejKfsDN}!mm+Bp0s?{}oVm8&dC&XBf1ESMe~q!nW;?dJ*0Y}H
zzVA8bb^R_4k)~{69qtu}XUnx(+nMQitI%}FuJ^qmjCi*i7KRygVMD%T{@Q!|Bz@R!
z$5qrPnss(xP1e>#t4&hPwok({QXh^3p?46%>Ak2oEVPjt^ivoZhte28@q)mi+t3BM
zumZBhQfKzs@7QRR$+*XWlj+0KQi?>HgwpM(n!?q3%N6R`OnVo73;N&n)aB47`nlt6
z7|;is&4xKA6K$L$as4$1YgUY+_vLO|lyThfR|;1(aEaNJQevi;p>=8-{%BHyeX+|W
zSjY+|G+t#hLoOMF9SEB7Ik*@!YR-=yrJzo7GZ)#SDmXcD9W;u}4_qpZj~Na>A~#kR
zGt9LuHXwg5_rl0B=CLw^;{~Cp34lA^Y1gHh!q>G;`@8k!OZ_`0{E4z2Ui`VtVsVQz
zCOIRH%~){`XhT9MVJesr4j)YK3DMs0q?K|K32*LtxG1&FgNPaT@%Emr9!Q#s$^}V!
zh<-C=uuqGNGCIDsMPh~6m9IuhJ)taS6rvhMAR*gI*7H67MiFYDfya$jR#&IaDlF1W
zVv9E|RJ#brb}Kq3gDO$6PR9n!>1)}r85Wh4gw5Q>sj$47N;vBT*9?wdKW6b*PW6Tf
z$W3f*KOoL1#yL5IjBYr`_Um8QL@^eyyIO&PgHNL;kFc^@w<-bGYNLpph!En&QaP?$
zanem3c%(}!(hNWr#e<e+#1l+W%uXX{<ia6eMEaq{I`qN$)h~t-!VM+5o|3(OO_c8`
z!dvW_d-L<d$XiBA<c=uRTv}DFc*)RNKi~#tBD6o%E-H;G+zZl(d1~$}rnag-x|&rX
zK{Fxa1R`^y&Q~AyN($$P)8)=p1-W4m>=5cT57#Yk+{eu=$%Natro7y|0!6G@1ce(f
zN1imu-^GOxT_-rxI;6h_+vz-QnxE0WCP1Od{zChXg&^l_f?}#kW<?KdHN{1-mi7qE
zC!8BKzsQ3(j{V{i9blK6ITW8fI`UklN2S}bX}8Nu@3rf22usrZ0-6STNg2`4YirEX
z)%*(TPBq!YnV;-<l7g5jylZL%dqO|#dJl8@=m`mz``-QNT+^_-p)5pOqM4{0og?Cu
z(e&{_m!RzwrAsD83CK5W?c421>JYC@QGP#@7{Zb;E0y~F^6j6vUH5q_1^++x4``)r
zZJJAm*_S|c{7yJ?BT7f+g>5h4l}wx4MlZ3mqU=hXW=yI@gOr7J1X0a|zHDu=y7WjC
z|7PJvQIVVj#Z+XJtQiz*C<2AWQZ}e2U}Bm7I*cV@_jAV&9v!G>C-iI)>P_R)&t|de
z)MX;HlJClA(b-dYl~8sB`&(E9D?IE_zv-^khS5)x#-$L|-6W#TAup_C{Dad4MRt3z
zF6u#b64$=(D<HA-433Nt6zRE~hrLsfQ1O9-|8a^LUG#!^)h=vea3+Bf4!usN=@6Xo
zcczCZN5CRuYdms*_)*+Qm2`#uka-b)&;I+5$Sc#<w&2VKcuQLtUCT>?3jKLaWOdH$
z=lA<iV@k4+r5Oz$oRHWXIjB3eo7Ae5xQdRjHctx)3R*?O{!$GGelmN`&|WNmjan%Q
zhuwGmXL-)+2#}2z2DW*{-xWqcM`qzdmu<}cD&kRmso`wd+l~%`-*U%*iX63+I@P3m
zmhTPv&mgl6k>K?vXO%d#5}{y`f+>3Wov*&o8CWy9)A@~w#Bqv<WdsWjQjY-*DXynR
zXKE7~2rH8Vc<;{u1ft3cBU<-OK!5RpZr#@P%Z>=C&&Lj5tFib=ZI6j1s3;JY_k33m
zpx!GaE9q<gDrn=$L?NuarfDK^YL(--ZSP_G=ls0Gf$ggylAGjqK|~{0K)fW|7+2-B
zvCm!e!E!Y4%kw-vo`Z(2t=-%}ZE#Yr!V45eO%?*T5f|By9X>mH5TmGr1hIgSTU;a!
zT1tZtGG%&xd;<%L8iI-++v&q=|7W4X<qBne!8t1_DP$T?fcR|vsYd)fqA+oBV!|A&
z1h3)F$;kLPI=*I^cD$IzHxO<P2<L)$yPksIszrG%p3u86+g~J2C1Wm{m_gM33+c;@
zl=bQ<W&HjWyy6{Y-rnSJpM@!*ECVfn1@xA3_OpeBY{eHuh~~C%b)Dbijub?SygT6X
zu|HvX+-4%gXGgR5{X5<9vgQ4eL3!Kcplij1-jjO^0;jRi`Lg%%d5$hdEGq86$U37*
zZSqaj!hR}=dc$tYY1`!Y9qaMKLxE>akyBsggK1uyuzUj`4>~vJ8~>lR4k1ueqNJi%
z1Gx`vUP1){%>~;f*D!15s&42pEG#s)w4`gVi%!8|IOC6Qt=ZcrQuIVW^syexjxU;D
z*@dPHpuNDO1T6-GK|l+JQcs@6)=Ou&x6!}AP6guUb(z+YO?L(Cz=$y(T^TKtGE0Gb
z>@_thhJ(%{gt(1`^6&N~#Kdqls?8bb3gZx_Z82Y<L>2l4dbRKUmN&^nJ^%}$V!b;i
zUbMc8Xh|xID`DJcK!x9lHRZkXVs-(+>ed%$hRe7iaKB{BSN}*HEcPJdz>C-6#55?!
ztRI`3{F=C-zfL`uFhUT=Yp;FbSREzIhb<`6T+}qiQ~|cIpx4mRbE%uF3Pofhygo%l
ziOo<3h|DLs?=3(xuP+qog!^%3ez$zKVS$CnD)f$aMe0$?h1*tEyn}etG?^V?!r7mT
zYU(tsNsb?qAX&t!R`cN$HzJa{Eg&FQM9ny7xORF+xUt}Me!~+l6pjHbcr_{KWq3NY
zga|dyd0PB>hqe9EzXhsrgtJK2eHPO2Q&9R-d%C*1PJI7qg>w~NR=zNL>m03j1w4^f
zS>M+l(eiM4*Dp-A#3~&bXEHfhY8OA=skjY=5E$ApoIJl#*Tm1ui~<l_tCMf$qMxqk
z1Im1WiINk}oujt<j81btjdSg`hR*eOy~p=bFYL0x`X?cQkRZlzp)F+&hsR2C3E-;e
zzpoGy9#DlrQ%DtSs91~RNxr%sHU*#-EO?7G*fGT0at3Akpe1|6sK7%OUS#S!#BgD0
zU{4yRL37`3puRIK)<sfKFm$J@vdwFoatl4Zr?R=LG+v86djX)b)}e9FoW_ZuRf{;?
zM<ozPyh|B3ppObAtx7SDl1D4S_$0&B$sYA~HdIcfY>FR^BAPEh)40ogB3nLtc(Xj#
z2vBac@tM$IZB4=ki6Y9(#??2Zp-V=@pZK>Pd3ZE33$<~jKDEkBDK_HC4GRQ==Cv=w
zSadJ_MKlld8dkplWFy7>c>T3Q<W*YQ5NcjT8m?!us>V487Jq{HjbGT2H%%oe;a(L5
zUg7}XO_s7qRm~YgpGMkEWaoG7pf!UW;=xIZoIrU!vZ}Qx^FU3n*MKUd8akB&fIO0<
zo&A=ID%4CktKvP*n091GkAs1hj%l%ck7ZPe_9eknhbHVMPw_aL&J-WXJ#A8ifS8Yc
z6i|$}=nkFE@zX&QDd1qO`np3bYgCJ1=|+ZX<|q9x$|YLoQt)XdL`6|TL*`XwM3g9I
zYZ{|ak-}6?j&OX~EvTHW=$!La{ac`(cCoYTfBqu9v5?S`8~gf|$N3<bK1A;~bf)Hh
z5huKV=N9VM(^KkW2a|M!(B#3vO#|*{{qd6Gw&J5Nv;&a{b*d=&kYMIm71o%7Mg>#d
z9O+P5?#4NK4|@hTGxQTs1F;6rR6GuoxliYu^`UVPj@a52Izyj-(9Dn}^cPTv6h{)s
zM#*>6r#$iWWa-80#d4NpEW3ds!OxH4Z$5MAX>Km_7<+H!tvce*GE8f6*qa&C9M)uI
zJ;Un7MtAV}Lk(O(z{fx_=IdUrQF;bjPNz%!Cx_eERW;Zy$UB%7_;`%Xwl_jm1Ppw=
zzDQcgeZk$S;*i@npB%EtRAoI&3LLp3nBf}`U{YLjzrk6=X;IlSKAZpp%~ng^?G}Mk
zlD;0xGKV>WBB^rWUQLUWw<!Hcf;}DXcK|P^W6(7BMiYu?j!7-e&f22!DM(5dx=}qY
zFqn3%#mDACq{-GQ-9NCnJ7r=!`SGxYJhiGMQ#<oRnd#YGcD&!ES{xs<HE9_bgtynZ
z`@adCxIrVoA;`<%Ws59o&cS4pk*RK{h>#Gu8b>ptD}G+8UHdT4O*}`<_{l_5<SHp;
z`tmAo@>ghM=BGRgTjfOIR>4o-egB^1to7*kpJ_|17_bFu(`d37mi&r))bsr(UAwU$
z8A~p7W0|s>nBP@@hSJ1#CP(j{eeYA;K{zxTHt3b|xmGl{iOe^BX#5V>4r%BCkpLRP
z0`8zmxQNYYXlLlnznsFW4wIuB2%}!`SffTnw@Sl}L;Je>sXr(BXrdB}&^xViW}u&D
zkSEsQCPfuy5c}#j`wP0OWOcU;>_!JcClYBkQ=oHRIN5nFOfVH7hE<rs_Y8j~;1gxZ
z;H7(cIrWIST*XB+);+4x4krP`IR7`_X<gKG)-&PjiQFncxAF{v2XTfrUz>rydc9~w
zPg-S!jN8yyJ}7HH8DH;3m(k$fg0(WD4~8if84t-b(~B~{@Z2CYyryk2hh+gCQC^y-
zvMo2&V~4f2?J$O)1F{W^gw1#J*|hdi^nnwnZKM4z<9vT#Uu52UYXo*QbQWOUvwi!F
zX4~ZM*2zF|=#ERhZ@V2j)W-?&@$t3-G?n?Y0k@@V>y=$5I{keL1MgEm08BUCL*8x%
zyfE{}7mmR^=3NLzfxE?7B*sRh@=gZ$ZunW^_V=rzwsc&x_3q1L7Pe$)+&uxS)vDsm
z$B}G8yH3+4Qgb_mogF^OLy>v6b~{0sJ0%#*)-POcKtn*W|B$pd`S6>E=ZG@3lj&o5
zNd=A~8x2bm$%Z~@r<xHip?Kzc<!H+pHLAWx)lw!SD&T(<46#kki+D~1&`K2DPCD~4
zAunH`2qSy?R8Lcz=aPr9wz=nW;fX8w_RX>JSlu7t-=2Xtv61oShvslK_sEb#HAjC1
zV_|bF*>v=?i+e?ms|kkwmG^EoM}Ce+tG>Uje2_7N4rf<q+DOi6G&Ii|k(1Cz(C@U+
zLV-i2y0p)JPz^t7dwqSU!*!AQ>c4{kk946RyXL77!vv-RYum#nwqycJK?YvIbhb8x
z$ryod%_d3MR}~|LnD6A|4oB6Qs*Q!V1d<{mrD^M7C*lbWw*8d8IvH3NF1(L+zkQQC
zVTy(e)PLo~Ei6srWn>*RMMDO#vYP!{Uc-(GHVrZ-E8}v7M0<|*2By;)nb~>DLiLnZ
zTg~JFE<elM%HW<qMwoW21e;D<cM%?`tY|WbxDIG5+X@Q1*t0w%eUF9ta^Lq?kBVq6
ze?Ii1<p!~`IOcL08uy=*7>Z;G$Ff}|Aa`mh99XbtRg_;sG+4bCkVr1QUF<iyhB6xK
z7<~13Ti2HDs;+bES-=<?*An+_Fh=i4<3GOmNz;8butzO*WLP3c&1V@ai?GFC<N=`L
zF46hs0*3#pDUf+k|8R4J`NjUXnnHm8|4mIn_=zZ`yp#;_ybDk)1mTyWN((jqK`Pr;
zJN4Mx4KH^aME7oLG!H*?MXwOjHg~r7lF+f5ynl8@>@;PUnqP%r+$kbI*;SLJ`;+$P
z=htt|&-b!T^NjdBlx|XbxEAX_+O293PhM2d$^DU>v+KLUN9N^Nk$TU)XAf)YXGi{&
zKA=`Jx+Jb{frJZ^63pO}w(sxS@Q3eeysY2(%~ndhtkl6_q1I#cHkF@iZ8VhBR-waJ
zqq{ot))kfK6bD<fxZ~#r&J4Q+nW2{ZMFakm4SknQO@;;!q<XV-_Vw6WcO$S+OfTK=
z*E}mVup77I*EAneI?hLRAl{V>7{}8k{XF)$amW}$=Vo=y8t3H)oIJ|{ngC{R$9EDd
zwtIj2#C2%0_7!ibbQP^Nd+)ur-N&Ebx;HZSh5LZc*(*d^`Q^#oh7TWhW?3$EP(~k!
z;^@O+XTUh}Uee<_rvp5n)C9lr3jegqus{@wS3}Jys8i&S)MfQj@xMtY{+q}J`L%qj
zAVV1bCFEGKxQAlv4Bh2CXi79r2-LbFwm~Ddf$FW!B>RA7iBwLllDy6#>NCo~b?@h0
zrYz{2chU3pnBP6Hwm$N8a61h=zWz9080+mx{{Y2y7@pRvq8ZzvTjCpA9Wxq9_R=rt
z)+wXnDe-Rw^4KuGsOu6D$$Zn7^_hU;1L9%P)fh{K-O<Sp(TkK(PuSC6Dm*r3S&SKx
z-bwr-{loXM(vhO2SWWq#ONSE^3G6xc#kNO@n4Gy%s#j@}ZW{6gHmx`eXFTlDuu;%I
zH>hbj$Nrv5VbP@iYv0e6ZiMJ&ONM`7+noM04&|jecaK+SB?NC&_<#LE)4;1;q~TyT
z;0{&ar=*^bFFd{SCiqpD$ko|fo-U}hI)XXuCisfD#|(TZtYkJT=<6xmw`M~Y^7MYt
zunepigu1KF7V=jelHO^5{Aeb>MLHABeq~WcFtNDr4Jvx&_%8Chz(>ZfA)gyTh=#sw
z`=5w4B7*-2TK*kZ^Y4O||B_n;w3h!lx9TsY1`sp<Bc<lw6fDTxs((VO;{TDZARH9=
z0_4R)fJ_5e8j!F2rO^OZ<^Mm8=5KlxWK}(jM#5-PVgN1!Di?s!K>XH!1Xv;dCRqJ%
z0?mKVt@?NH3}{*)QR;7W)nD+;e^0N10I7dPSN)4V^Pj{m|0$^o@eh0k6hQ!=0o4qU
zVE&S4{%_csf8|xZ2tejl{XbA=;$#1VI+Gjumpa3N_W+OY*~wj0<G+DbDW;8}efer;
zJoBobD|CVw%|fziVlZ>vb$U@C>>952*QZixa^3kdOgPi?cz!xNZnH$GLAcj&$*Xpy
z{iIi3Bes*P9{VutnLc`vvSaaQc5yo+&yE31FV!ZX<O2fB^Sr#gx{3-1XJ==~$(gQz
zEg5E2B}mghIMctunD_$W@WL2;g+Gu<QfJWo{)t4G`0s*DuigJA?^`g`{M>_498?;!
zaN5v6a{$Q-a!}u%1E7^GWX%AXPl3nPACRN+aU@BA2+-@k?huyo&m0^XqqCQWL=3?H
z2RMB*L?C#AKf-Las=U1Xc{U<D+Zi&9_UA8WAXv&PW?YFyt}H>!oGvFLhv#%oG-c2l
zEJDbGJqQXyy3COqJU=x7*qNVz%4HBNpvb5o=r(;`0kn-Y%z{3^yzHD7DjrAxxiWSo
zOl~>W!>Ykx<nxc?3LAk87&&jjybqd}pXsQnsS!ZcrQchO^9O0KH!EqBJZIWBm;`Rp
zeD(B$O1K^{CU2n?2Kt_h=slRHAuiR;*nnOQ7o+VhdduhXF=u!?aN6!#__nuq^83#P
zzPCR_*rdRrjp*Xw_n)JnJUHE+rq!L?m=#{~USEdl>fwOCx!2>z9_0;dh-IKOv><iw
zPtH$oj>B)*(uDcq`5DArMIa5f4F=p5rNP#5pcR(~7&R!u-ISFFLE0o50h&?xHf%r^
zdjphAML?<%$p-|09=z!5pV-;{3A>~%b8!dGVuS207<`>g6v23H38o&#VVKdfm!7=r
zd<c_P^K^gar2H(TxMqG~!B_SY$!(SJd<k#Lx%~B?lcnr&en@ulK*L#q=&;8#K009B
z(^22RchrY=rl7De<~-0}3fI=w4#7+6_UY@_uMRJlb|J5WCr+N(w`qvko@k!O&h{n#
zg)k8Y8frp6QdV$%?|%QxEk?voq^zP_9>6p|xD3vpyd~j;ke<_gDwvNQQPKnUqrLnk
z0cKBl9dzD5>VPnuILa!Uz~<M&!=O#g7A4C;C@aJJgKV6g2|No`VUTa7Q3?}JPt6Ms
zI1)k@*aUa5LW^tXLx#-^ICHW~E9HR1Yb@sRBzmXmD^J8%EeJNzJk*wCygRf}40kyt
zLltm__SwEbeSc12k1}zHiDaFV+=W!Avot3mf>>>sO<XlOL1Km&6C!F+XV(w%%TQaY
zs|oI_SEUHkfi43MfZX;MZP4S{g{v>AxuAv1P_O4<D`GlPhop=5THf><egLEu1o<87
zus2em{6b9tDTLe{Z9>1MzF{}q)Y<BG&=84zeh<F7xZC(1$G`vh>Dm*sVX;F!L}6d3
zJ<$bbgKf!eC^bX7W0-+oTp-<v6k>pQs{+bZ<d5($9Q(cg2)_b%p^@l5kPaR$gm@^w
zd9@A9U|SJ{>3$uO8SKqXS@fvhIjX@g`x=>K3%K)m)mI?S$cerlZbD)@UiA{K?nL?h
zo!#BA8aM5?D||dJ?-oWyrWRl~7{qS&@Y72_3DCZ!a1BOlv^vAq0;k*<>38yhg9)u;
zA?OIr!4h)FW$gq#9g{+V2%`CUlDq|ZW<=7&uTMZM8r|=P-o^`=Gfv*Y%))+XGkD6I
z|KR4;Dli~^a&6=4hhU5Oj~}<LK7>X$t_IO=0Su39?YU>m)bo&$SvHLe)&1*THYn+E
z^Q}jrJ3s(b1k8f@=sUdoOy7R-QW}HDLy^I=(_36{$?&wUVa2pw^4<esgtfvf<vUuk
zsHf)`RM6K+M5%9U<M@W@krt_HrNM+IP)3V?AMOxOw>Scc*l;PlB~ME`yNG+fjsOW^
zq^E~;vMYD;<q9SMw6pg~1C}E!%8{AvW4UY;U||gFqql(JoP_4gCm?_xbrF@$)mFq!
z$aGzXDX5AcQd2?@UHM-tcXgWxfayFlWAju`&y$-H{bhDCO1+oDy?sd`-M-DuEsbbC
zksI$Za=W77VoRTu0YmIfKHr^uXrR7;1quO<&*As><Y-|m&i#!eV2qprc{tI*H$Glo
zW=VD6LRh$Q^6}kO?IUCEj|4{Wh_n9c+dk+qHb7{}JHN1?$kpq6k3Bt^=&X7%EdUvX
zJ9S@-jY7fPB)XgM6|7i>87;yDK{MqW71+r<A_~k;88)f&!5{My-ibEy+h!oy0~6vY
zN;To@OqpC5Nk*oq<)c#OP<B~5JCC3)`Rdq-fWQN2F>cNk*E^QsJM&cZra&MVjZ+<T
z<Zj-PNk|zizF7~3ez%Y$S@_u{y5)J58_E#T52W_)6jH&kuzBYe7NV9JbQ|wDa8Id<
z=dgMbpumO}Ip8`4-}`K}yiI4wB&^l2Ku_498UyTP*sHTIJL3cA`5Y1`4gd=7_;wK2
z9df?{nm;D}I-)gkO0Iz=oD&!OZFKhlA;*b>?}hU>8{E7?mt^TU6dtK`Gr)WtJnkgg
zbsb_N>QiO4>I{EpF+gk%TUbelWssaJmL9N}U}L<&X3;2jyN_%w=)Q#DHs9%-kN&Hi
zOi8+t>gTruC~4lYGWHSmwoPIZ8e|C@OD?2y`7s$IjP}CwH%ZVkvS{Ku>_vUaP>260
ztmR(^=B~YqIp`0Sh$pPM!(~9Y6ihcd<C4NBZ#{fkycKjz|2|_E1TiVCN_9Y0v1j5q
z!lS|@sE2$hbsSz|!|R6KFM916UR?CVifyQ6PXpKIL2JcYufaBHRallVZ)b-yUfbAH
zgxoc~+tLuQpeA=4R_q(ZST;mwtpKSqzd76Kjg&Hi%=D7pAF>fVZCjc@nXLm^4(e2X
zfi^(`U9?%4t6Z(b{Q|*_2|tgHP||<gFs;l&!OWS~A)*M1vaN1)?)>J?o=otf4|fF&
zLkj{y0B<w9rUjqRO~HeQ1HlozCzJ1dFmKrg?w<+H^8;{pozHpVVmp@!HYVU*3ai03
ze<$oF&p6h7Qhw2VRXmxXP533ru9)~?^GY1;^PhdME56u}1@jo-aSL9<h25>D(9(NN
zE1K@k-HqA}{%6An(=b%Z1F2kjrG2ew-OH1S@2CM8n#0hTMVRVTqKo*Z+Ii1CBrOhr
zu8+W1G6M9NA~Pem$-Z1AgH4vfT9Y@hU*-DB5{wXpdWtVtslE!DJhk={*3%WkQa%3x
zQc6ZtU(EV)_fa@1CB?lz!O**D-WMwlF_~f#5>9QX^!0&bBYp9cPRKwKXay}{7t5U$
zX~e_&hiV}=dc9Hsta$tbWTX=0?x>umRn$&gfn#df^^;f0R~09N8N6H;d|_LpRuVfA
zbR<qtW&NQ8@s>DjlBxoX30dYZA$~J;PSQxXLQh-!hn@G|rCoEs4%yKAzPBewE(+5U
z#qz{#t_a4XjbtP6KVK>d@F!U?BV=D;1$W0PaZ_61SX*y~Ye;^OJ>dz3I8C}Ybpe<r
z(cD6k-{oJy<0@MPcsDS14D-FWvxyF21_jqOW0_)j)K~!mc-oJ;{TspG2;Jw8b8|oC
zc(O*fHs3$r=fbe0IUm&1Mq|`!9M$2OYm<{F&#;jE8vRlvUAOm1FhYZkV{8#aa(E-u
zS(U9=Zir@_pNaDd5m7f+Lq9v}6$AKd`dGjd&)kyJtasSZ>&{S5V`qyG$eD$3m0~sa
zU{$8b*F)_$8)9Hv$DX*hpxb$EuiQREvP}G0r>0Hr&4*aL>MW!xO`{$t%vD1>L%7R{
z{eVtEN@Zo$1P~bn7}3v1!H^@adaVrBt)iYGsyb08+ILJpBQ|{>cVcB{5R#ue(Kl6L
z(V*VqyC<s<t;!j?YuF@@WAn^i(bP7JS(Ql~PAidwtgYf#%0p~bZ|DAD^Q$>n<w_*l
zk*tL)$szaR0H|)YuH`!&0JlqryD^mbScIM^bPs`C+@2daftGbTxM654%C)nFVIkuf
zPPBRB*k++IyE{A74f?9d{fD)Xf1>^M-iz9`h%@bx8Iwu{$5{}jg&z!l-o*J5ZaJkW
z(vm`0&Bl3w(HCucOF+Q=4``x5HM)dkf7?>PX24sx0!xYpn0{A#uO9)KtP)WP`%}Gm
z7i#<Zi1WUEM;}aNGKM$#eU!9&LZUY2=jQAr(ae)VgIJyLbL3n>{9YX}Gpc3(tRdO`
zjp%+}XWzP8iqgb~4}_R0H_{J;_7Y5ZBY5#SUO~?7Kh(%Lx?2y=;VoQ;mr6pIXqPS(
z6;;J9$~;GVZQ^nO;`EHZK6Grvn;~va^x5#{?A)Bi9KFgn>oaJ1mSYuT-Z)w7jhWB;
zqAZ>xA_W~|fd?eIF4^C_xnnW!O^09MO)DG#JAXtuP;*x;XIwSMFk7x^vKHf%PlAL9
z*>rp+eZK$hib5Gq2`m7*g{q(eeLBgcp|em+d}OGLFmI5z#&#adSctj1Cj7*aE&V#(
z&y$lw`ZrKw$XV@gSO_FjU3m&L`~pU|pxf|iDNkSulctEzJtnA$r^P0!`Fw`pzP*#v
zI};h~oo=gZDfLtd{l3HO)Pdm8yfTw3jTj?N6qSHuGK-}>EghYDwy0akILsFpAh`q`
zk)CWTgzdZ)IaUpT@`W?O^k{&5MwXXr;j+?2)H3!>IKOOe1^|k>G>7mwd0gs~%4F8H
zepFrxd|feRD?eRx;Rtuc@QTGZgqtO2T1Y?hs40xQk!a9fJJjfuTKIbVR9-j$OVD?X
z+6fehTjY3s1svx)L2=@O{z3@Tby@!c_c;)L7puMLJ`U+(dM#6_TjPlW$K4-Xw{dCo
zbzk2cUny|L8vf`w=X|S8YSO6vi0hV)!@cY)5E`a6(W1-EO-&&8ib)HpltzwF;a}h1
zO8cJ>=(m5X%F~i?Tf;EFre(T>5|)l{kh2}c;AT6ke_H1@xhITZWuUAY$|_gn{(z3Z
zA%|CbXlHRgBvoP-ttO22P#{Cd*3QlGO~@wbgMDq5e`sZ?E@ye0qp-85Wg@Yn{vanr
z*=YnzH%uz7e5FdMU)oiSKHY%$<OT=witqTGt3fiTHw5Lv(7jJ1$DHBl&B30mzrdT6
zs978TwPq5rI#Nns`Spf$d$eGEQ8-B?2+?$p7RL3%{5bWOi!mxlt2spx01Uf2FlAYp
zwqJ3KEDK!$&xHCK9<lCOQBI=aO6vw*K0YfG;jp*B8@n%cO*?lPHOtLb<N++fpai}g
z7>MKuzQxZUgn}EGI5jctsMnW6uAMS>{X2sBei!RxU>qCEqr1encLRf}S)x0l_u#-&
z)N+-nGxN6}(K^Ey+Qsd=R|A`PCBE$M^V4a{7DGCgc`$eYFxnMV!B|qKPssm<c3~cM
z+r!qo3^r+GF^5z}zg(>^DZwPm9+3&4Zj4n`j6?@x%RuegrBJ*5AZ2p!AtLXK<d*&o
z)<GM~Ns^s>Q7&)UQk{$vrYkty#0lp7I2^%B$Sa#4fK*vBR}hm1KNOH@$hdOY+uhwA
zf+tSwW!{qJ(YY1>Wdx9Ud6nIRC#AnuqRUn&R#?K+77BHIH_dR`j>KK4ux(|#xzRm(
z*=8YXr&<W_W4dAAr#-~(uI>?@vfHx$*J7WZuZtjddj#>-gs%x4^qN_1(hU>2^4r>I
ztb-mvOQW`;LU!uTx?lww(Y!3wx0pcdY+Ts+^-KJH;^K<(v8QXq6dM`Ub@3Y)91;X<
zFY*gi@QkK}2YM@KWZs}h_|iQ=QO}StDaxuCh&lLlKoh5!hXB7jeO^D@wS+dnPh<_C
zUGTBB#R@h!p`Pc7KuX3{exSar=-LY+6cb#6@ACl6HeK*^8U9j{<CoHijak@}c`E<4
z!M=cV%$c%TrI&McP;>@05NL<UsBMOg7;rLBjYp{%yVF>C85|V+fU?oVHh^TodG=It
z53%w#p`Br}oZ)t4Iyjnz=oq11VloS=g|2|!h0nhB{VCL?$31q)q-cAo=)qgECXoF%
zz7}F?rxMSl7&Eq^8>D^4J)wM8Ftq5wCyg&~Oi-ncu1w%c>+3Nzd*wN}krqSIZ51^U
zaI!=55yi3-zypSLl}BMzSGewbcpwC~)5g!>1+y4_K>}7fxN*IqOobbl_t`Lj9tqnc
z)*6FYm~A>xC$&pvnQ^%c3yg2_22nJSTo<9kW^YXIN-DI+)B1LEQ9QZd6&WTng{qq-
z6hMiFSs)HDfoX*sSzU#kX2ca>iO7X2X&D)ijhX-X^XE9jKE!hfbCehxX`woIlH}*-
zXBsYK9{LjLZ6fSNOK$A2W=Y;q+Ig?Be7Bn*{QxjArJkXZ$#M?g5FD+UW(p(!@cbaC
z$%U*u>UI|FTav+tkjakI+^OZsTKR2gD7uAgAI`NFDi7dXc&82$wFTC&em@a4U%%^P
z3yvU!BJk;kx<Bc*R9zahi9>s2piM@Lv$W!7?c)a}F{moh<)dab+^=;wOL%G?$CW6e
zvWUxC*(Co?<;)Mz=Dm4?0u+e4`%d5CAnZw4_6tnshA2v1i>yRff1jUAzFmd}8gHIA
zhCm5h)<~vT=bosb@oC)w@;rL+Bkz(0L4=8KWy)Y9F*hwB!kI;}nP7?&F~XKD&j(_b
zKJvDu`<RmNxgI{J^3Hkb9~my28ZUEyFUB~eeW5+bxQUZC&K*tMk%d$<gK1b3#Qs;3
zKrbyAEC{N~W2gcNP^DqN=epa8y7U=pzOJ`@K(hM-RRae15TC_}G=ydvQIH8NT1VR*
z=w3+8p2G4HXlYTkm&hzMs)#a?2Z|6f(IRr(+-qgUii!8cI$T#nq5>7K!F3v5s>7yd
ze*vxyVs_*t83jA1rJw+{yT=0R&A1SuBuQ1%1ay%vBRf###x*WD>-}b97G$qi&@&T%
zSGTzTu9cFaF$&>5KRJoUtq@*eExyF@eBvfAgh`GMJFICm+sCc{fVwvFcO(%W^(I&5
zHazF8ZN`#}*w>=!S6!(^?Q5W9U`ib(-AsFDwDi#VXaUZ_C)kgn*E5sxk82JL-;ay2
zy`!ueog!`)E4?c=Lvwo3p}U&ZzVrRN2i2Qj0f^h-GR6`Ofd#m0$-9cRxAh3v+#Z0E
zOzjmoN+{W@6B9>3o&RPsnD5PL$f8W@4m4MS8#upa=?*$xK*w{ea&*C0iuLIfYWwy`
z_2ocEAJTFHJiYZh7A{Bk!WFgKiR1v>je|-;C}2pu;4H#-4{KyCr<Ar4*B|`<h-HPF
zkLLY#q?Lbu4mVkxn=8wq;-OLkPd6Snrnbtxd;M4Ng`dAJg;owq%sBe`6xa}cIm2-?
z$0YrH+q-?CdKz`x&DOhq-)uemK`@4!rh6gBtNdS_c%r?h)<XAgke2VDHevWj;1&O<
zVrX5qY>{XM^d6h*DTt@L%bO7iX%!6>qtw(@@MJO_u6azSf9z>!C~#C(jzV>^Ytnb?
z1~Gywain^Vcvyh!{s`C>mqBJI!hYe_{z1>;KDP4??5h)F-ss868$Q(nU+NRrDmtwo
zZg(SLAnL=Rm$h}z^ru1F#&a|l4aa_(iZI)`=g@!6C1MmW?W9EX%1nXzF*tMv)BZ#a
z)ii%}Y|LFr7t8pt*$6Jevj*GoY%%oDGk!Ihxw%-}<NO>YMDzV)BUpGB!fFfA9658I
znaP)U5`tkfX%s)-!!8K|rl3M)99`36^fcAGIZeY44ZU8b5=HQloXw;gmT9W$h8Vt2
z*I;>~J6pAogD`E;K)UJp)dHFa$79b^m!CZdfM&N+BvbLI&3A(CoG<E6R4UM0rZN`(
zggl9B^o}Mj3=-L&RTJUYKTSRmJ2^U%2}h}l6{RTI(BD`Gh5th$m-@%U8M+z6oE5p1
z&xo+Tr~^*&maY%SbCRov19<2xKd+-(YhRC{2R9EwZkl=mY$2V|N^ZDCniea07p}J&
zKcu6#{EQsi33_lG{g^5jIu{emIwLgU7(~$HWDVUJ!UJWtU`qg04K?y5=l4Io5g$+9
zxVkySp@{DlcNY``hr#o}!!#<jeYAKJo!jR#Q0D5Z>@S^03P}<7!+*kY3a+b%A_YRp
zVETOBy$xwal~l3G{hEm`vN7UZ3b#|Di<K->D$o1+Tu?PL4eH-oo}BEy7G2SSjTg+#
z!NJkRc5N=xK1#%?(MVS}tw49J(L`HEr-wIog7n#N@0rQN@9kDJI!yL>;lcR8iaC@I
zw*a}Y^f4DkwAptM18Q#uyj();&b}`2OHz8u;nsNqtvM|?79LI{l;hkdP+$BKXU1>u
zxPsPTtO~ras;Wim2#Lx$ez)>uy!H3jWbfSCoX}Hr(xrIdHOa-C6e%kzEj=EA>Lf8u
zrxWx&e&2rO(ISWt(G=D#?pWqF^~WZK%Pfrf!5up=R=pDMBSInf3-Rlh#+<p5%CfB&
z^92!<ol!n3<2e%8lm_~MfLx#eLtE=Kl(;<)%Pfle;~CyXVReAr$8SX7_uSiy5*Y`5
z2L}!Wt)@3fbxBY+!Cw^D03aJ(nJl$jNrxjDo27;TuK{hq^jCqXQKCY6b_;r+<${f&
zaCqt8?LdeXwSlf}y{d6LNnZ1SKcUj7>U?n-txynf=9Ad<-kE&RM^7_xCg6vamVn@B
z1I%!KXq)wh7Gm6swJ$!G_N#=14e^ts4GTv{X?kHb1_rvg)L8UDi+!sCx<<lK=MvDM
zJ$7?zXif-1_a4t!sD<?yCMqgP+$!jZh>GOmUu(ViXKdI_vXxOOO}CD6>a!R6;~ltq
zRg~VtewJ!}Sig!rcY77j!`7Ud#3d!#tgxdao40b7r1S<E!F9US0m^qJ?%Pb(129yI
z9d-v2Z^YCy8wvB2J6l$sp3|u9{;75%wsXq-7hVb%g(EhNhGdMfv2MSP9BL7mM!vpn
zCl`_;;^ISm+^aA_XytqTJUe>>!?hFtwP_uTj=WBz24<@8rgwWALE{rEtD^TGPnG9o
zUx7|Fz4%DM(B(|w!TLwrQ0KV<zWVa=$Sc@8_;$AHR2NR!AkTq(O<!HV5xx9~;7Qc9
zZb1`adZO#wmc|X}Mw~s|1&AwJx;*MX0pl#HTpT$Jc$#3o&*BjR^FhRnyq96!4<fhG
z%FPEKhEmsZno+<*!n9FE@Iq1wCPh2EhJl>Cye;k+^!5H@BYMy!0GhOxH%42US(!_&
z{bBJGzI70AYxnRBmMk<?_%8l@M@;dNF!T`QmUUoS6QCQlrXiThB58`zh`{u8s+&QG
zgR5w(QJ*DGv#y==l8hTBJV#+f^2{Vb0?a_G-;54VVe4VmATp>D6EsGS5|+p0ZrR)*
zZ)N>@Rd+J-9AMv`rl!i`hsZ(Ohq*ay!&P5#)R0fdeqRZKN_ZwjmD|hEnAANdt`)Hb
z>irg!i$JI*K;M?hFqta0wmO;Og%B#`3t>m;w4|;2;^L=f4E67e#2b-$lZVw>KU6>7
z2XM_ni1HhuLT9Kb-|HHP=rr^kIxWRz#Y{CQZE9e%=d}=w`gIe(lj}thl#+6pd<Ek`
zTo$SK^S;yvfK^hwqe$)Pl)8b;VIX?M%Z1=t58w^FOw=kraK+v!6>L;M4y|^r=R000
zrJ98c#3dxq;m$vOG0*Mk2qD@!uL;8BTzULl*)gt?B`B1Ixx+B(-m@@;td!`O7+LmA
zw43PZ)ruyZ&u**h%rfAt1pFAiW!3Op>mq=2UM?eDiN&(}QT(40LxET5Csfc!LR<=u
z&0mP`l8&5owqo;OuOM9DXpzF>aa&ZhJTP53!KPv=24<4CXp(@hZ~Uu>u)@Gl$@eg9
z+Ss0=skpp+U|<qvP9}JPp{9V*BJMc(io{z3i|h@Azw!kl@u$#Oe@?CCvVK2Bdb6(Q
zt8^B+_b$}?bMZVD4v)H4z~jne^Q8_<6iN(NfZ#v2BOeF=Al^S_jQi3edgUEVFx>Oh
z{^(b1wvz$jWPNl<dYdUEAkVG%16ce5{6hO(bzl<aS)K6XO3TYEudW^uMEmo26jkD4
zB{o{Hkr4Bk_7eM%VddsOA_al}E$+D`nDTr=>i<nTve-<H=)w!pAXfPN0CQ>K>Wp3U
zk#^V<rpK7QPq&ml%@lqfjugYE`uQm~{)<1m_#Lm15wtmi3C~VpOi2+F?M|zA|M>?t
z>U)fRhHW)eoV-?<tZ#X>=<~i9&sWbHZ;&RRC=RXhHH8N{ANZ<W{QB4LMIe7V{vM~W
zJ>wTsS#zZP=5vM~iCzB(gJGW+n`pOKAGqjBNk?Q<@@mjO`d0Wh+{&Mt(Q@*mEL+^^
zH)%}P`w>ofKF+NdTLzh_y;oaHgZjgr<PPer#Hy#;RSi4(TXe3=d(*a+SYEdNs(qBr
zQ1(4s<5Bki38hNGpTffz{Ev$#AS9Z?H1$6zJcLF6QF#1|S8^jX?rK5A>N@qxI`x0$
zl@x}9yaV7O0P1-8!Gz;4ujD^qCI1#h1W=K`I*)(xO8y;I0=yIVaoxX3L|4-gG5<;<
zf+(VY=asO8$3Y6tUup?NByoDj|7DkeUPJh$k3h2@geGw}1R^0OkK;`^eB({n{o~mJ
z<5>Y>QWebdU$TZk-jNf@{13$B-&2N85L;LO1`PdwMGO6lS^_GJe^E==Y9KV@|A0&W
zMJ<6ipZ`0!#Dt>`@t0ZxS`TNymH@Q`L^b~cmw?dYzk*8yTYUMO{CNMWIo$ur5UPJ-
z!r=p-*)JYIC#==MH$viBp8n?yA&{~B12F;A3xo{)7nF&0E66zl&9wVZPK;xWgo7k8
z%F(c{;b6$JFP3tqYY;@?eD;ZnHX<R`$i>)@#lXX{Kc>fI!Nqm(sd+no>vv}6)MJ@F
zsmmSf?+b$4nG21xna#5!0c0>TfC(_5Mm!;`CkuXr7S3C{k}MU_2{5d>wiXl=bioM`
z+`O&#5PkQ#k`})Igy!ALAJ63eA(G>`Lg)$rOQ>UdE&aMzpk)kwUry+?PNJKxKz?_3
zl?f2-IeH;j2kbx6Y0@yK`}y<dBamZMy;nghDlp+CZSWP@RD?3X>l@t-y6Tm^h5drR
zm<Pa8YbvjDVy#&<AgG^~Glr^S9B7k!6p%j~#ypULvn33n!NNQ@tPQ_Ffvk_9slUAX
z9p)xf_8U>h^-#uYan)%}Zf%tg!d_L8RtbGlj=XdD-z0$&N4vPN0M@3F0N_!q^MNxH
z{)2_g{PMUCv0!fXbr}h(D+(^KWWuUPz;B7g!dau7fq)VLyz*}$rR2-jI9Q=MDjKz2
z@{>%PpFuf6g$LE4fUfUb)?g8Xqlr}OG?}%}NLIpa5Mi7Ewg4%-0J5LoF;F3(cm5_|
z4fyc3Ba7ytAgI3>7X?=z%<jpn*zdRjWdUsP;$E`H7Z<ln5Z(FQBotP$;BzH+aMV$K
zyK?o9nW58DH^@WAu;DJL(GlaICTJ<M);jAZtowy+e$a)yIPll}gW3*6e!^yu;J^<g
zJAXa7$BR<!c_Ml6C-}Elrfx-I5x9_^PCkKMjd~i1p0TmEW@<2k?gk9l1rP!P0y2;;
z)RMMUy#Z;DFvn?!+zU8D@*s`Z?-v(U&R$i`NrL1DY<4c^@Q)NSH%XvVE#USFaz?Sw
z0^$eG=o(raKe(fMNG*h*nDxgB6-Q<**4FZ7B6DP}Ao1hKR!&2gNU_s67I)hn5(6$!
z7$8muscPPnX@Z-kb5bY)-yHa>K^PUFsD9c6;W!5HHU(P+1q4p<&4WugDX^-+U5uxV
zuf;^udc0lt_K-HLrKw4SN!JAe0rK)PNhkT?>Og|hlhNmakcQQ`v*V0)j0`;De@OF6
zWS*$qPAcL;@Zn2t4gwt-sndFduv%O&h8i(mSpNMVhKE1q08bO)cx`6=0PuHC$_BUs
znCTs81oTojw?;pFc%Y)O9R|gosxn+3cx%RT_OZF7J;hM*%OLUR2(({t+OCK6>QHdF
zpCd;#^+@OoA;ZPreClP#Q-RrvvZ5mNcVsjK?e;DRm$ZaV4WOarcTbcG-MVFWgr5j~
zQF2VBnFssD)}*0@G9NzZ0;{Gp6{IGv+Hc4`trbCCqUi+|nRYOVBl9s(>81hold^#{
zks-6TpoLURD3V<(wf*z=pUh(>XJET=)PM_=`;Fs;%E&b*c;^)l_IURum?1-=-GsfQ
zs3=rF|9%Y`rBUzaA8tw6CFBD3=IG$cAWSShh7o`&9q3Ek?yir`8{4E?ya3y5gqpMG
zI>0KBpEVg?fB-@!SI{{R>@B3fyQF~|x>YsWz4xXP&EVndYhBdsp#KjEN>56XWxapS
za;l-(_Kqx57U7{-3peVTl*gL6rAI2ua`L3AOIs&G2V-Oh+4Jh@WjDiXa4R-=lX?w`
z*KHzWRnT3X!1UNcBPb9u>7g)HUo?N`J^qX6(vH4~o~qQ<A)aH<hXq1-NxtiO`4itD
zy3QshEo>;18PTozN!KqY?}Zwwo`<>79YwYxga{5dj?L#nMXSSC;EH!?fB6zS&0rV`
zyZy(XaKA!*^6PLD|6?o?1qFAJBwXzR!V?7GF;?H5!Kg!5*I{IcBc@f)HRe2SkQ@gi
z)<r+u=3@pl)fk@wWyNZUq$IH-c0N{?!|6p6;@wj5lNfyv+oa+pTT4@oDk6#pQr`DW
z#3m$=aiD*Kv4j-p=NL=}fCgFtGe$aRUGbmJWt;het445R_eqytV=8<66TnSw9>%n`
zlUI1Zhf2CHE4z)!Hmto;CASu(7dfzm3NBW9AeHM*5Jw^b2dM!!T1^I9uuSKOBn&HT
zJ|_r^h>&uGavTFq08t01!MhXsAkp)MVqg;AGW0%cyIud4V>`*)w{O3B^JZ+0AP5rL
zj#S)jY;6TT(rjSFQ;?JAJ0_bIJx>+rdy7?DP(s_;{V3qjk$#l!S}vugD#I7+nj6ZM
zw8AEWA5vYvAj)q8r6&&>=U|LK-X3uPynkmC<%iSh3T=e)&j>=1rM-oaJC`(I;v(cg
zBcuoM(Y#3p88k|>%!T@DO7t<F_G7#h5)sitt5dnNxd*0Mp<p#xyy!tiRHY2Ve7>OT
z)C9D5Z6N}R1f%?l`zv;uKWk30UaGRCEOm4Dnh1{IbKkmz2egwNG+x_ZzczH)mU@gQ
z&(0y{8tj-n)beh}Rj*mCEG*niN~g_<z4JuCTQ~qh#(9EAwS092aR}#A2Y4{OlFy$=
z|GHT;MLN$wFbK588gtnw$hXk_)WQX0byvaO04~?1c^PPS#{FJLqE4h?e*oG4<K#x=
z##q9Wh7XN74hJ-OEu;zHE$uTQE<wn>A5&!KxIKv>Yb+Rs&QtL|8taM5V_|Z3mZ_)u
zjya(y)D{(|FH&tN6a#10FdU^sMVTz`H_YlNka>E0A7-iw1_gj-Yze68Z!h;((H#Mp
zbL9E(VJ%1%=FRgKq_*!TjJH-*#e~p&07wLmO%Lx-$Ps2Pr+H>&^JG*za{oL0&?t(#
zMuFD<AVd78d@OZ}W(rh5QNw!WG?*|QNJdo>DqTFjYAz@!c=Ng3JupS_FFM-WM=E8&
zZbI030f4fgoafJ<4}gpgnMh<d*=h$%FcC|%RwV9=A3$0#=YQei;W1@!TR5>5lH{mO
zo1$a+@aj|#un?cz?!*qEM(W2`@!w<5vdP6;w58X2Vr-nn&0GCO&~iWG>Jt=hX&a7r
z>B$)xXGq}k5faMs))<$9M%xiofRm|?p|5Rz?${ay^bti^A^B}c?=Eyg+sI*Z?13Dt
z3=9n5l*R#Uc6tPfErWaDjvs8+-)5!})6-lfAV7Sk0;u$Ic<2fkPv329Y{1I41OKvy
zOfX;gQ>Z}KlHsKFWqO)?Or)~WF|&9U8S8R4f$`e4YchiNi{62OAL?shw_$A<xd)Hb
zW57AwLk`s-N8r`s^z_qA)lulABLvy$oZ&9mgiYuT;_}HO1bl*r@B&g5%>58Bvod}1
z<o5M8$m~lT7z2qUa#T5EHh}RHw*0mrR{)2B3^r2r;Y+&cV;7Vl0{#%_JL8nq0IhRy
zc-t>c^b2ePjVk-8mv%R7i=de?4iBDM*J1X%mW{HWl><;uQrCl@dssd1wn9G&!r9Dh
zWo6hN%tH=~jj#xGuKniW<a7reNF@(9H+jho6X<T~LuYWvd{QYiANX_*H@fWdK{6_U
zbvBFx@eu`Xt-7YBL=SWAJzs&V8j=yMvb0oGRLU(aEG$r&>52L|ZYUbUXGH2u;lst<
zxeCZO=7$-TFfBsVz%`FL_y?DEdhy5KnNMfaRTNBih!w2uCjS!?zkog%Hj$6)LtAST
zjgNzumr>Jl1pXpdnPXr{N&5=iycs-_4NHbEAXT3JXoMUz>y0%2Ek5L<9(-e&{|Ygf
zun&yj<Wf`F>blyE`4C#hhg2;vHpkIN$nMzM*c=Fg)4D$-S3MZ+adQ#yP2k}@N3xNQ
zb0mEakq15J`tjXdud;r-W$3tnWjM#CpGXrZ3w;A3K>_Wj(LgvV_$BvkWJEPEFi=YF
z9AG{`x%k1Hl(zvq<yz2If8wog9RqCk%hFOTk*7rU5N#RUAt((oHE>41)x=b1%#-A-
zUp9ryJ&iJY*C7PNjUl1BFW}sG%8vCReTgK6iWZ#PGFMx=)Ji<Yi42U&Qo9H1a1T*N
zj^S48v@`*#OE|tc*qp!wuLm2~H_%L9BSC?Vp2m>&1)N$c<CH+qon{Ui&rQBo-`7AR
zIY+?I$G(YLcR*B3Oc}T1wzxQ68b@-{dlP8Pk`v-WI6wvLwO8-5!u0Jktl-(CO~vGd
zOIW`jzwmE4aYgiv*I-Zq;@%?YUMBOc)hi}p!~#5f$s25NgUZQ32wYG8mNF>aoXfTJ
z8<-pTZd0L(&}@DF>`O7`313Akg5fqn0eOsZB1XD(YO!K2ov;`i8+QJcRLJmw{Rs1A
zJcC3!hGQsCga65Wc*3E<RipwcV*9xBRQm|7A}elCEM8hL!{HmP;5kuGXE6*un3CSY
z_n6qPj^gTXWrfb@3Ff|ut_(^_N~D-(fL}`LJ{{`3<s;$c5`@M=s*jzeC7L+PHKFTU
zbn?>X52e8HX(bo<1(pTbD6m-WEbM<rTrOcrz$!C*bQTLUUSBFPfG;^Z--NCy@tr7w
zb);4nTXpErizV$BOh$L4<jcAF`0g;W`>Ko9<H2`u^H*4e7K#SM_BlQG^VQPUzT*VE
zzzT#Wuht^uPTi<@z?BAb4T~F@W^~e4u<Sfv)kSW~pqS`BJV&NF{Jf<_=S=(4Sxt>d
z`_6_gw2_V27S{m`c4wGc7BJ*YDV4%ssFMN0*u6wJ1LUM(6=;ELj8L;UUc$Iq2=!f{
zuP@CE)z3u`P|FEU=)nmx6@mW=-ntBJgFjrO+=(7o7&dej-;u#v*<{a7Jyabh2cD2r
zz-eOSHzZKbn9e!rL!*tuG0o58<3Shw@{B?q#lDVns(G<EHziz2_%k)~*(sE)Ss?(@
zBAZy|_xYKiJ7uZ1zJ5PhD}3xJKD3TkuT+AQhr_RQM^hpwDeaYrRjz+7vz;Vwh1&%~
zCuoy`LGcJeoH{S0lA61cfsb`RX1sNRwhE8bJYPUN`}y<4pJO~>^9BLJ0R?_GHkbkh
zb#LA<%Jp~>u+(x$*U&h*#~YcMshiFx9X+g9%1IBGD(d(IVF4lBhE<yELKItQY4C8`
zzy8u6hJYj%BO%DpNCM|y;pG)SZ&%mEaf61NeJ9uS>3f-;Z0N1m1$a$bR4~NcgGamd
zAW7->jZp5YzV`=PqjWTm8YzQ`%yP0EKO@}g00D`TdM!h%kz3rlzRyc5{H@<{^sKoM
z+<265h$dyW3gv0>_ZDK1UJob%*M2K$C1R_m=jp+xE^WAN%Vj8SZYHoip|OAmn2FvH
zj`x-Kw4T5;+HLjg+FD^lE2Or1D|`ityZpvbQi!TZ9gs6R^X*+?{B>jAzNf8MxG7Mc
zD&0HckSFOIa_ec0kak&<$h>m99oLmVcG)Q@q3;#l(-(3nvH3j-F9GUV!j1?(&==&?
zyH-Kd{7U8<@JFm=R6?HoI;zO1eIl%3;V3Y?1<nNr-ibdT(dqjlUp0_gS&uRFjD*1S
zMg(Ri2BKzRSEvbmfn_1<=2|;JPN6)iKXL;>o!*U`h1H+~dtP)jRt8BeN4jd;%*KQu
z4RkNBVFb5zbZ|G?Pi7-H1uHSCb-tz5-JB2#%XsnNwV&>6x`RqPq|fMTR;5$!>jz7^
zU#GP(RgtWG2)ko$hYyB#=8aDx^H19C%u0IgpvZT_RAHN&-1z+2Ns87~P>fP#!-{Qi
zSaBxPue)mb;jO3ahYCODb=hGR=Jx<ytI^FeaT4AdnvwmMGK6~GP@xh2@8nRk_$PZq
zF?WAVV&ILS78r#(x<k$D@8^f2vSU2t;3hIp+HN=XN$>)SI_mQB*RT-bSXT=HXOqBR
zbwHJE^T)*WtUW1SQt;~Z>}&`smW{082AewfEk$=fE=(guZG~dX)L!b}Aa}Ur#(dh7
z0x>iK!N!PEqxxaSbke~}Ltb4O3xF!dGgso)z5%V$%9IhEvm5Qn4pJ!&HQlo%BUdZc
zq-bHRa)K-Zf{J0qHICc(mTzc(-As_<u}W_!AI#pV2};Y$IY&uUO>fVUkhD-rfA)-P
zx={~vXbheE43Awk<fHv}<VYW90hyN~L63;vU`-L34`{cuBl=^vyt1-#3BqX>()U`i
z4{G?R>FMREIeL7xoZdF;bnjQbdL>T4Njpt^-59r9y=&4{VEsC1P|hR1rX33V>JA9^
zXeWnQs47#vVO=nWaQkyt%3kGAf5?o*csJbHiBb;E98~+zK<l5*3#*s0_^`_&7^R;O
zVD;2J<Qhmav3*~CzHr{m8lZglDWJr*?I6N~fRBTZ?-tjR1BpVTQdr_k3prYmb8B~Z
zEv!n+QFUM4H!7hTF7m-4n1*oJ;+F=6hK2`6I|Ls?F-=wfe7foBI966#t(3pHOZ&TY
z32t+6co0yS!U0E7&EXFnqK{}F#G_i7dNG-9g%gPIXL<wn;s!;SUbHVip}2Z^HRGD6
z-_0X{b)L1-Al@fa28Y61GI;E|#|20qsH|=D^eD+K4H+028E22wN)dF`!+VByaA^6U
zXQ{3?wiVgGzEe>0TB~B#xj;)#uTLQ)O6!0L*3_FfiuXZ%fS8aig^!wx*K03ZgVq+C
zC2R43pTX%$fy4cr=EuYAJX$bSe4&jmtkvk+skPC~)UiF^VC9Kv9s>n8i$cRhhtEOC
z9PlxAb9p4r^V}vD*C(Azsp1qDzN6f54+zNq@MAtkDFU@#oskq_ZjQ2S6fBdbW4Ze-
zdD*=L3@C^<p<{_Jn6cNIv!bI|A#f07V0?UBo0gF={3k(qJTOkP2;;bITBuUtrg6Qo
zAX`E5c>~1TqnSTR?%mqr3j=jf5&n|-&)r-g&*T9Tk_hy}FX~E89O509p@M7l7gwjA
z2RX2_7p}RDWnRa@f!io)IGoK!UmSe<hWNI58E14yHc>?Shj2I69a4-OQ8zS#`U0>9
zy+|!itF5nv6rW5~Zr*1xJkG1!;PYU|5>kbe!T#uN#GlzG-1$Ow&I{&6aC*JH9Vshf
ziCNIh;o-hAXD<}ZZ#k}?3&PkF2iv<HkfY{(Tf{hi+j$pg9e1Q|h6cN|BJC7vwpRX1
zyy65X3KRnH$am$VOOJ4rh&$n(mAMqpU}taijV06Xx}6=`*j7Y3)YOOK5`frimnGv-
z^JiQ-=ZQVTak!bGM<w7nP4=6k%KRIMkDaFzWGt7z;czfe*qu0hTv>_G{gTKLi5lZI
z*|I`^Y{jrl(tk8HGlS@5$dR#W>1|R&JD6hT`25}es=bF#ns-RaG1%LB&lptYy{75t
zze6j_mMQ{bB!hthecdic&Cb1ykIorTar4kry)%3B&2*T9Vn6+t@=)?{D^L7#H5Ss1
zuoiRva&$6LvHt818-|gTWswg%(~L2_)MudR5q}yJYP5>*smICD?0m3oCQz_^gY<tf
z_SSJ-wQIL8E#2KA3O_(;K|yJ0X(^>Uq(oF?(w!0l0@5W&BZx?Yl!UY(tr#FJ26(RN
zv(DP@yVtwVKK%78KQ4jaob#UdJ+3jnBPu1csJHsdMTa{c+EbuwN-twCn2r6x0^`9s
z2(RGrF^4rUXvC9Ay4{zAX6FhXMHakv+Glmyu{y*NT`E|+!!D8iDe^RgOn49|Nlla~
z>izcpv5mb?u<wA}Bvl9hM?KH$)`_^GWF@0aIDFmo$m@5cM%j^ZSwN)8{Bz(!A#7l`
zNu4bYT^lfZ4u{tkMCv8!$s?HRXhF3lV}WYb(8|F0v5FA-yvl-tF4k!fqa4T=#%A+Z
zWXl{7$EIWij+*t6i{Cz;V*-ff4<F7{er24rmlw0hZ@yOJ0C86S!c<2Mp?hpC4hhl;
z+7&gE$yh7;kwRGm*_<rP#r-Fq5S@$c(us=ie7HqS!1p1NjSA0gN}&G^-qnv6MH~A^
z-@n%`5H47$x~<?L+W!+b5JrAqJTI*K7%fZ^d9yM(7|@{lb@uS<#^H;eG>u^yMpy5q
zAB*l)Jdm{W?pcCw1OmkSdL$m+G;H(XV+IPTNyTMU8@Z>GR8^}bRk*1{cRrytr)k#>
zDL3(qv5QVikSmH(N9mlygC6Ux@otbHpIm<M(^k9oQS78}F*EH796xDS25b9SSy`77
zzJ2+E%l2ZY84kSC+1k~E8c+5KXDkbRM;bYPjx-rIYQ&8?iaR65F;dibdZbC^A^rG!
zTqcmB5JsNqv(WmZO&hO24yCErIH93@8KrG&%<-QkS$(MEo%H?6pC1WMjKq^so)<gD
zhN2_F!*wF*%EGhoDW=9jf)p;f-Ll}`GsY)K@yR75Zbp_x8WxA}+oSoq3=sHAKc&Wo
z^)SO*uN66yk(P8O%eq2WwC@rmGnsn#pQaXG{igOHQIFI(`;9ssDnnZhOC?9qCv{fN
z(3>jl2w~wDvGV1jr5g-Q<0vW}N`nJ+PKEG>JawzKft3IvArPEkBBO*H0B2~6XuK+u
zws9vPk(LpeU8rUNsNf>3AT&2pM<GgJ35y9lAua}CS;d<>2}@9DW$#BU+DeqbZz5sG
zS!4Gz57QuokqBvc`gD+0>jg++oOV@7pwrb<iKx6~Nc*@@Q4bGPU5Coo9Ie7Whp*4;
z4b_#z2bS%F>A@Oa`g15l%t4SURp#qEfXyrzzKm`IecM_7Y_t;(qGRgsKw1qK@`cy>
z0G-yo+bPvofAGJ1IPU!+*UB9*>N<UJKFoMaEa+{51%O1cpdPh5P}yc**?XMy{rMLg
z;Dw)A;DBP?g*qls6%LJ~I;m!NuX#Z^>9kA|kAf-Q_{|si$ndpKB<-Lhhm$42VSY`Y
z5NvZ|H+T^Qa(u$#L>Z3#^{uU1L^wpg%qp3urp|;lV$-&RY*$J~ycf!ok^Rc6vQY7Q
zGP>5{!Y2&VCFoBRuHoDPLU4_}sls`y-?!NlPR*(X%(5hvGQWszf^2YG>~+=D*c-pf
zd06IQX^pjx)7e$e_Zs{1QsvBvDE9sje?&YUM|EvfUtE0}j@eY@4@>QDt)gNph@W-O
zuEun_Ra2pwJ-}apT#52MukPc8$SWme=oJqM!mXrt206WV0g@39?%ZK`VJY=6!*cl+
z`0?aAlJkEO#~+yu_{;=`CBrZxO5yHjujbJ>IuYC_INLBwnmZqVfV_MuLsNPe9Tn78
zI2YxRNjiRa&GhdL5D=w)QV@RmihkDTZH~`?RQK9hwn+$(SjQrng?lTHeiAOm^{48-
z%hnEWvP9w|nwzD!cHhj;vs%)LI1N3f%_9>0ks34&u%l94uDQUTLS|9|k&Ag~Sm1NT
zvY=G*ZB>`u6l5wZi&ZL}Y|8Gt>)JNb3q<U4KfP#3W2$?;V`@!b)a&EIP!bB4uFt%E
zDbBRSot#7`P5Cfk{QQdD1N!?sk`qg#idz_ucWVraiW0ip*skjkGi?&wF@($pc1(kx
zX}J%YE}moW4}@M;HElfC>P@(QkP`OY-_U)J=*vWBXxrP`@~NN6fJq-^0JXZedgcg@
z)&?y#Sv)NV5k7HXKLihHx9QT}$|v2d-3gsovDXti&+a`3az{J21C0KHZlmRyQ})&5
z;kV*b>!)o;U<Ba^{WIwcbvAJAwi<gcMg7P&xG91!RHM;r6>#GWc8KV;ir0<ET8hq?
z;5Oz9#}@vh{73xqJ5ydWb^F*hlsF^nUQ}<=@~bilF97yz5~(QS4B7^?IZx*%DoMb^
ztwuDc2*|mQc$?6ET_rOI_Bxr2(6=*|vc4n59S;5{Fo1+fqyaavrup1;4*68t>xx0`
z&Ze(#Fh*Lxe=Tt1kpj{|4NZndPaEo@i}HjU2pLXL#k0eM*s0c;Kp6KBRu|BAS_eL4
zLuSshi=Olv9EVwXvb-cmK-T?+BPk#dgHJ1IjJ!Df+SH)%mhh3IIPvmsNB?HhzD5PC
zXJJhZ4XOPZD{TESJG`{SYU^&$fFs&5PFvI3I&3ju@NHwGoipYR%s?K0;(Y%T(A~C2
zXllImrt;T(i4v*3wQNq)51^s`9cmGbf{4p#ERtTFLvP7jy-Ej}Wg9Jk=yz?+Hh_Zu
zha;cH{~YSsAQk_&XG8cxvfuoF`VRg_-iK2w4PvYT7#7M0lB%}TS)BWfHw@GhCT|$~
zP781~oXQhA#Tlc@X;oZHr0c{*9BftCX%@J4c0`zCH3R#AN2S=4?p_hYI=ymh%FcQ%
zubp_TIQ?DH%N-jA_#!3j(qS6oW=rxLM+_`}C1m<?7Al*s;#9ul8{-gqXJ|e+WzcDB
z?1XG`b9Lc;qLu4BowarK!CYni;z<<FO=-*L>{<*1c{hdC`JeaAUKZ8=MWuH-t&HPZ
zY`9fMQCOGy9fdpRFBpH)-q>0v5IA0(*CYCDL|aD`@pR-xB-<~$Afvc+i!_ST-Y>mX
z)Dx*zTvQ8MoaPio-?wn1W0j8#=fcNU==@)3A(xfEKRe}1ALa1m)@{d+Lk8TK$}O*v
z!gor!xzc-k_T>z?7LSOL5A0Ipe69gkXD5<@{4vA#I;PRT)0169gy>IHTlRzaGVbDt
zgy59&BOG<D5H>;sb~Vfesd=U+*P7HdZ5Kzl_Zk=_W5{JPe)_Q|sxqofm0=GfctX)+
zlvHbd{U0=i@EY`tx?W+Q!Pe(SuV-@HC=sc!$iLA#lK=nFI!R-|aMAJ#7N$MHa#$fJ
zAEmla!SH5Z;l>MrX9KlYt(Wur+T%|pKJy^(V+#)B95Y(RX9$Qn{qn-gkw<HT6v2^t
zDIR4pt#L8c_gj>88mV)ZY?_5I-n+JS8-6tUSK>Yhc3dex^zEej{bWmKW3Q25UjSE!
z^kqg0Hm!T~+A93gOUToS5U)%8jhjDSUpDLfsrI!-Z16@$Wwd`Ml}wUdkpBRsIR)lp
zWUYzqXIHj+#TTh6-YvSX&UHrytB~A(JMYBPeKP-;CRwN6Qk9_U_Mlt6Wk5*$7q<|u
zCJvin`rqfDb99JxXlcaV^)!z%Zpy~;nzl@{)Sb+4IMyW|e9h&D;9VH*TOn6_cIClU
z!KpZ7f?ylhZX>rAxvcYjpC*Q#BbR6@C6IpMuCsTn#T`h=*?dXbqbWMFF$Vc1>e1z1
z2642z{2@y^{nPq}9O-)}A4ucB814$*fAQyq{g+s=I+8<$8s6I9%;)?_JWaN5eQWIf
zV3<nd>3yH=t^9jpnx}}&0Yz7<^ld*eo9xUB7S^4u1_7?_a?=C&RB{{SHI9wC0mS#J
z;_26e5`UbV3FFLHjqM^kVj@_6HPOQFZ7o^yOVF{qTM+kp@t%j&-kXv;vTR=?%uboP
zRPJ~zP6<uzbS=BxvIzZ6@<q_^Pv=kU-+$yj{Vy95v0XCRTS{DUY3byp<^Nm=P9u_{
z|J{HDR+xX>NB_sFr2pzW`iCs@U$HV^I{K#=NyIkpe<REM*LEbZ8vS(`Au)1_5m&B8
z%4$UY1D64&&Ho)P;}$P;>u-gUcl`fHg;LD_TcHH*qes!;K7#5cK+OEBMJY1w=Lhbi
z{|zw%%}oEJ6X_q&3|M{sRiSh_?B8aj|Ivx`f43oV#m54!Mgfrv1FVd!W|WL}^#2Vj
zV;?8%7<b+|4k$J#R^}fgk}sIA{xKqf`w4tT|1u(#hHyv6amB`=SecX<Ff@Tt3&=9S
zq5&foc#;0{WfYuz9{sqAZTv69Oxy$=^2tp9`gE^ZC?$8IaA=ungHTu+&UkKYFsXBr
z9+f<&zMG>$>{6hjkZ-La9=8o6d#ce~+kR_+^!I?ZyU)JgTO3)w_)A0kq1e~^-|D7b
zd^dIZcKjZlWBu@dB?g-%kc`ZM;c|o;CQeZIBZi-!39LyEu7NdWt@RI5XAZ+TP-L%y
z3SEM_c8<}%8gKwam>ZyXKq=rMdaQvepyyzJgaNEuT%W{+3oxGe{o`+j6r2MH1UW5o
z;Cxh{mluRV{Vc60;}5KtFrhg{rR;ZTQA^PPkfHDB6iHVB7QhZfb8ze;e}OfFk25nN
zpoX5j9l-nybGmQ$C1;*&=CJi2O+(p3jVFw^bc<ko1p}Tfv`f38yxiH#%WK>cR1i3;
zCOf3Uh|nLlt&D7J>!$+-`uqE#k_l}Jdg-~^`~LlVcDYjkSq0lr1I*c90ha+yyxTh?
z9$#lf+V!fyziXe0cE}{aQAP4H4D5#0N-D2eVjB^wJc55k(Blz|GhnbYMW1S8#02<N
zU~Yh7bLCb@<)sSQ`{<_jg?5!E)SBR4fXpADZSqiBk0O0Y2d5>fzJWMu3Hx$y=z40y
zgFnoLF&J(TB4_FB{23ivW5>(``v43VzT6f4wq6$N@Gnk8S-?c_I|OZ@yh#)$JhtV0
zWorV2hKd7F@pGVZvGVhIuM)7lzxg<gj+@XHs)kKaU4aJlh^(<=Yu55ZTQ6KQH@GI|
z?FTaFGc@57d<KC?0P!sa4Xz_zaA0-l#<XMj`1nA0Ah3g};lL+!o_-u~1rwtf(M1KP
zfwS6KQbE>0Et2!r`2wGnRw^KL3^1v4@X5kYO(1Cc0sLnMSs1<5)Kof;^Q{5|>)`H}
zfbT5PrY_9{WRlH!+TUQSkTiZeBm4MA)eh5B%V*7wFo%5-4L0HH=g*%nuoH|;Qgw3r
z1ldX2;%RVc!TxWjp}Lx~8b!xIULVYL*IZ&@5)QROoS$L;4nP(d#v@ONp=lT}ICu79
z;io~pF{&<@RK4RzkfR7;mT%a;2Uca=C<F#v_WOorW-O^;KcmlRxMAZW><fU~f4u`!
z?4uGG-TMM|o_#8(5-uUMT8ZBgBk+Kqkjez^R=`N`Hz+H}vR@OVkCA@>AbqD`&@;4g
zreH2)SyQ*`{PGV7_dLBYNiq*7gflO9#1eFr6cWgk*VWPNC|rc<GO`Z*DY$eE>mHt-
zRGET~NTR7q#AOr&RYv5){6`+O8nM9L=QgwjT@qwd7~he5q9+p1(1b-*)yER}-Q$jr
zA80Gd1CyG84)3%e1k9rPRy~zwpz=iEx1Y0fw8et^^LMpX<VQP6cfz>Pi8n~y<U$~c
z9(GY&`5pKH8n*&P3J|c6`5{llRf>9hB_O)wEch9IGM?+_@YmtN?r5429Ufr{M8hE@
zXQ9qY0&p?juT+H-YC9xBx9R^q-2^}MC)huKB=v!lJ&6hvK6OGL7oi71x{|IgRXO1`
z^b<?FZe!XTC~QSyc&<rV!pi_g5>{;D%BQL2uXm_zEh25V!gJ{FGe&5k77Gt?YW4EU
zN-e>Bp$tvEyO|wcirGnRbnf!FFdz4Ltu`XWQOVUIIrAvur327PzQH~Ba#&OktzdeN
z_Z(~p*hJ)bhV%_U*{Uck#7mB`0_`~qZwrVn25BiNDe%W0>}Lc2!0qjC**<~iFNB;s
z*SpJI3VL>KG-($+`;-=x19{de5!4pZvBE2SKJ&^r!_#nBQ)zah6HuktajjmQlQny|
zQ?(P!`=(7m<-^{OQLMj2T)0^$(lFNQtv7Easasib`O+KGl1J$3j9=fjUISV@b~rJ|
zx?V(AP;+Y4B<Ve9FMDO8jrbjHbNNy{1aeN)GldtqRbUr0NPYsan}OIfqki;HG3%i!
zU;q)uodJi|<zw)!W1X6TXN<3j>@Z`Y?)?xF_XL)o3K+^|q-KAJ1ub_MC?GoW?ofu6
zt$Lc8+NPXn3rt0{DZ$(uY(A5)2J4b_ax}mf41JN@5CeFiGAPfk<%11kPnLZI#f7*y
zl6;UzHNYHz<*`qye1bH^rY~New6u(FN`}nvrn$L++?rr1#2KXvl?7i4NY3E5INWl8
zwsClLPm9J4VWw~$UJnl|Khjag0Cpa?Oilo@juXT-IAa7@sMiCQ{-A=^)@-D-7t&AK
z*uDTPuNsX5g+OehVTBLBo?VNIl%ONv+k06(>d4H%V>n*IJt%=%;J`-Llx4LKr!z0?
zCq|;!iSTJTlefnh=}-$1Y=L!8g+X#=&1!QN=8gDa6itq|Z__E-hd%{xL-ZZLmp8wm
zoF!~2_Jq9-H3a6{_G_7`sbPO;S>e$GXG#;+3_1jozWtdN`w0BId2j&c`H_XJy{6(0
zFyHdI$h5sX`N=1r1jdXX2!mYR+&s@>UAeo9SFKvBXM4JIx4NE>@YZ-oyvZ_krWLT(
z7JbGD%v`^Jt&9zbLsdkBPqD9|O6D`zZH|z<S`{7kQl6t{(_bp#_O#9Vd~gqZ1rEAW
zaCHd9gEu{-BK2_&!Fo3{gSOT*Lz~SyNYfe^_%z`4`atK49H-o6F_DL3W4b;pcymDe
zy{ZHM-yU#$(xk##pF(2@75DOFL5kSqU)N!_X|7AM+nwo%nr+<>+mK^W)o;OTqNMUQ
z`}4r$cvvY<WdIy(l;B4YgnYh%G<~ZegE|Tim`&4{WM$(n=j}3=kK@63z_DN&j><Ve
zvV*#wvw2u4aA_<r-vg`Q$w`0@PF#rni-6-7qMnY@1Zn=g)-|ZNxjaq1h;cdJ3A{R^
zHwTa>BJUmc<I_V&yeP$98v2rbd}ldG?lJ<tObc&sF;=QS5qh?i82}LKV&;`su?MH4
z(lkq)3YExb`@2_TlAgjhs<1(0{M*~x9=C3tpFaY$MAhjRfvrBD^s1t#zYNp39R501
z$GW|n@#xXjm?df5M&9p>Gc%lv1k`Rt$jueOu#YQY_ye^P6S#t>{or3(q{9BI_7A}I
z8Zj1ph%Bdr4FOyZVtiRJAo-z1GNumiz``=FG1$n=m;~HzHlI*CP{_-}fZJF{2R?)r
zQca<w<DodId;5HCE6z;J%$<zhE3kREP%sNCpvZI9e4){lbB{ETXV=-ukKr{5)h2T*
z=U|oZzM3)-C4s+<YOMfV%F9|S2s3(T>F_m2Xav?=zyr<>oYpAu0fUQU;HP~*nE`&j
zo@d}g!J#*UimtnY`&?J9EJ{6uwnaQV!zA@0bW5?#>U27qdBp>qWQyz%PmCF`F1-I~
zocA?y%KSxrJ#BThJ#U{UQXK(m_cdM^p=;i393|okl>Q3uip0;s9PmC=)Nrl78_|F+
zys&`_yPj^64Opw(*J^_FUD=U7yMb_VV+CfwnvQ>=w~accXX#<qt@TbN%Euu0hSCad
zuY!B3*D(^RFv%_Nyr)ZY{IIovyu7;yV|ly)b4*?-hvg4`<~U4t3pjStG1y?|`Z?cX
ztv~>ETrME`&e+D5H&v5OIem9Eg!{FxqMlYM!}jWWlgFMCx0P+$L%-{^jH9FUm0TA|
z%zCkIHhEYX<Llo8>x&POy{<F9nLtBP6(1iKOeL5o1o4>Pmus>j&C=M!WE2D;8`}0G
zu!#tyF0a5oZ+X3P&5igE?39Yd=3T4xeMjseum%OAAks#Pob-YIc#jSXpwO=c6AUh5
zUTLYM!JUwWSC*cg-IGduC$7gDD@^TWz;Wh|pydzEB0Wb^+KIzM$!C20XHV9?KrI^=
z?MC^@$q5%im#J_f%m<u8ac2RzZg`t8Y~++8b+f{Nw?FqUtq`VZTV$3(pDjb;*rswG
zIEf7Srh+2AoP#CDozw)=YuQ!3i6-(I$bE`b%zio8HO4?Lp}FQmKn%?lc^%lKj$9E}
zh7KWmMpn2rkG*PPlN9{e`^Vhdw}|2;u1<JUC~NS2wluEOt4kq|lhc0-i>Q<c{cT71
zx^;`9|D(It)Qn{e+=9cur==iq2ChpgkNpJqJfb>E9qYHk%TP+iE)YumfKm)gFtcmZ
zSIjY`ZbH~{8{P+eE+p+T+4g=P9X4g}Y_XPy?O}tH-p0QYZ}a;ha#-EZxC*dKO3{JI
zd6G%m%}Dwd<j>_qzajV`w?H`-dVLH}MTVYL2-&RcrQ{z~o-wK2k<IuKb}!$OJndff
zbQR2}P<P_hdk1)rnwN}gelq0Gmug_`*E!|W1@^>_poi34DlWMU_wL;r)ekiER|?T<
z_j<L@yczbz5UFRbyl~|Tg_V3ANZov*TCUP13I;zx1B64y!L;~?-1XxX?fP7MlNrkp
zxcL)Ia)`5Hr8E~S-|Acx6Vor!<1Wk}jD8VfCYhLcUtS)Y-A}2vHviL0bz9|Cp=N!q
z3am6fy%;d9GghvphUYPLXK8JJgAF}`hR?1)L(H4?Zr+Ud3}YEI!lcr&^xNj4tNh(x
zheD4qf}W#7HX+$y$1<{S>xHPpX|rhYV@GlIbt*kDXp07(dnkGL`_>KU4>}Vg^Ty-h
ze5p(oJk1Mo5|v?rFGO0FnAq93uItXkThR3=2Eh(1zeMhNYpWZ1PwkjKT9(;@Jb(Tj
zH9YlwP6hwsOCLwoVcA?9_vep0&gDIX7v^0dDn22nkhnS7OLwGhuKqPm1G<DHi8EXM
z9DxQ@Pv9c!C<1O3f(MKvI4DsMzi6M@2iMoc8Gpe8j)5KpZlw*QRx8k5)pNe7fR;l(
z2(A9Y-Od9H3X&w5ue{U;k}UBI2OA^fQYcitL;;qF@>92d@gx`L2KSrMICyWA!>LAi
zuL+zy?C$7~^NVxOVl^DTV8*R_F~x!(cUOET=z1DLTWg?6;bS^S`iG{`MBofffj{&?
zdE`>$(vEzruBsY2@&%gc{@FkIaieFeZX&HK4CSSlb~>(He`YR!Eoc|OsKGe7sp6Fi
zcggL8ZbA}g_g?E6duO}b(=(PO@MeMxL_PR^b?$0C6f5qF9^++vs~`<AP5VD}e7bJ~
zfj|Dx%;$RVLq(wvJy&w!+26Jvv&D-N*#;UEE5DK;<?UAki^K}{%y1?eyNBR?0zg+5
zro)nQ$j_<1x;`zS|IOf_m}O<PdK;Of^LJNeSn39+^eR=w#a!XlL17;Uj!w~SMKv{_
z1A!!seM52Pb?GKASmaA(Ho)N_$lyGTEp}C5y|<TuvGg{)5}TMtz`Nuar)AnjdjcNN
z4i6XUI|d8^qaIQf2%jn^byWHhjBrm?_*c%t*~R1DoU@0Aa4S{|*<sp3T`JQb=JTck
zE6djuYExy~um6axsWV5rcD-L`1JG1+H;7*FqmE{9=`!pawQyK|%1?H)O+xeByk;6h
za|GU_h6agUGY=~#Wv$>C%SXK-Dx{F)R`&Daq!iY_g}^qr?Khf;1*7{YUNIB6zJDw5
z`^xkZn0XoBKMXV6))Ur*k<h5JW0n1u4xu`-KX%o6=!0yZiZVA9wL_x32I+n53JHs#
zBEr6)3WrLv6!PvifqJTBd3@@rp==m2q}bNA0#8s7OZ8&eHf*GB%{O_51TDhSl&+5C
zNN7YR3qJ<7oKr?ahstKoG2iMxH<l82&}`DR5Te_BS-6SYUNZOgUw6xhJEbA@1`MC=
z{QMZt5pTdrGg-Eb@Fi0-Y*@0mjTfQCE|8ixRlVpYMzE%~Hdv)oqf3JMw7`1U>q}=Q
zmOa{UjXef#YRO7<Sw+R#wL@gSzmC{@(CW>~C&?M>76%Ty6PMp8%J$oiA7_*4=W)Wa
zuY&5>Tz{4$I5>M$eROq`jMS}l9oqBbQwRc$^rEo~6;=)QX)or#c##<`z)WO(Zc_6i
zZ*E5cHs-|;Ta!OD--eo+Fo<e~n3{M$XsU)C%3A70oH5-lk0Y2~A^YYsEMF@X=juQo
z`tcDQ>K;m>+R*gl#GO7~TPvDukCg%2QgK}wyL<d?Ogs2fEs^FW#a}qxmUMLz5WTXL
zjFp0&tm4(BY+c{Byvey=U4q77i6Po{iBp%l=>Mo#hqSGv<RfY(r?tw4*6i3G>ls^B
zA3j=cFNct9r15^EC_Krq8$>&fm#+tjg5P-fevGp&9kHTJrJTaKXd}`UW@!9A^%+`?
zW`?$>^34qho<i(QjexhVs=)@Ui7wM&ACw643scc|=Ys}ZMhCNXSRsQUcq;A5lY|=|
zPBP{4{H~BiiNHoMU_HUw7aT@qEo74R-(3;(@p|$A>YU)ujBPZ57$Gi7ayw8GBh_99
z*60L{=<G|-$@Syv<1@mn2K1#wrjY{arhrpSr^^7@Vz?HfN(;h7X;voy-y0^7ozmv~
zq_tN11I`9$Aq;g=D3>w2URva+t+^@*QMJrn7nc}C)sB<~7RDj$M+OLZnr`y5xPGlZ
zte7^fiLl9FH$I!9o1@$nN94hFC4jXZ%x|U%GGBN6QY>$;LW-l>puBXA$~iZqsJ9>E
zaAiDv9v*$?5&7iP#n$;aps-9RhlmD_Z^O*4ml1x#RYALB6T1S=SDu3(Z<X#sfQ|Cb
z-+D*IZRV?hc#Twfkm=&4dCkOxsh0@9#{mq)mi>Cb4>>c(7SppGiH5WnH8nNU513P?
zicV`0(=z>Z`C+LSYtBGVU;kOXs<xcY`2tzUD}b1mIPdn1cH`+zP-me`(Av(wL9KHZ
zuZHaS()~5=WSagw4%o5|iJO%*%lJ`M^R66`wz)`JVQVDjw{4giwFUZEy33HeIJ1OV
zAOjs;UT)-Nv{WmmndDosOre-1?Og`lK#TSS3C7g4vHD`v_}zV0_jargxYxF&I&Omp
z<zQ6Myz3(15c^jQ@EH^ID&d~Xg0oQ|2A_2S+J#^X1(C}g)zh7kS09@o+srP_bg|`8
zuguDHQcW+XdW!%Kf}}r`#if!!<vz1(hEq{jSC_wI_=WfM?HIv?tUI@Fdp>I%$z2g=
z>SQ2~xJ%2P3&Y9G+59P<aVwA(FSBc}I_lrs9Nnz$p3if8`J=kSv}bD;JxrjaMA+kf
z70P_{sN{B#yP<&r!dXRn_HKoq?ZzJHm%xVr*5iY7oAj2&H&8xQ1xFdt#lo9AZ<m&G
z$3=dHM?~l<NB`a_vBybV4_oNQn3BA)eq#f+id-6F(`y>|o`hx4Y(E!r`eS?TX!L|4
zcr=Jw90o=INcfuJ>Tg935#V6^iwH--hHEsVUna8>DgN|r#?jdWk{Z`8|5!_=xO}t}
z0>@wB^3xRetgVA5)a#b}U>Am^a}iE@1Q(QS;Rs<N1vwZYQ?<Q&qi!-(*ORie{n<D;
zA~fD=!<p2+C=E>_1}=XBJjEkN=^{&TINoazq$GA{shHlHRe}dD*=Si%Re_Uo)ETi;
zk{Z%Bor^hWr^I&0HoOd{Zkn+&XE(P^x>WG&2^V;ThS?`xRG`aH^MlPRWefxaoD(SP
zX(&qENv)xzB^Q_Z>Qc4>8^05ab<K+x_s|J^ENy)U1J8AkgFP;0Z(ufO2!(1o(paZ*
zAdT?mO@IF~Zp)|dzdE>L%8?r)<CYrg>K=AjGjm*0tpi@l%3<Y4AF!ULTH&+(Atfcn
zGU|-BE$0`nici+;A|)g1f5lx@ZB{B!Xy#;Tsyek63nsc?XKW3k%sCc83z9^xSK!y!
zOsnajfA?1>s(Jg#2R`-eA^LpVHp_rD$2F6qfR!Doals4m)ZIvDk}BT4{={9#74(Lh
z5~MmkeT4N?5sT#cZeGK^z0k<IslAo=_H36Q4Te3BqGw`cl&gyJ0QR4Vn+y)=FwyB!
zRO^Mzi1SqVG(n2w40nseYQ`VtQz0FeH*d15FkONSP+);Hh3S+)>*vHXLzn{QTvG>p
zAuL1SHG1eG=T7~CF1*{gp$eSh_;X(um`P(zO%&{4*FPu69_(daO2G-spH+wOCM4`k
zDcxT-HWDPu6*;zR+#n_)F~Nk<x&f{I?Ucn5w9*;O5U^aSkTr80Rul8er&Vot=EaRZ
zlb9*N0t6U)%Q`0EktFYjS^jP;!KLYTf8e1-q|{8(wy$N%#WGQXv=jT@5tN4x-ucIa
zmB$`G>%ACu)%Vwcwr=0I3H~~vMp^Laa~}}kw8BsTOmVSY7bpoWb^d*qAA$ohMx?l;
zaG<5MQZ~^rAA63;OuIJ}XWBsh?fsNGHC-{s2sZtr)ILa}Fin@5BBABZ3H*02FZYU*
zCz#&6dFITuRXDdXUm<NCfg=R5dOSuyg*6j~9B-+!7GbG>u)C&a8lp4|wi)pYjUD&E
z3pxxa{L>Bz>)+&4bUEj`lN4=SlqKpPlQk5Tk2xBMIco@NrA(=UCTr|Ms|ctUX$$Ot
zg2j5O;MCC-<k4WH?}~Y;A6%@D`cEL^#r~$v)LHpsfyrk$@&cKgjAyaY$Y$llF~6ch
zP*N5mDI9Pg*V%V$`|dHjT)W$!lIEgaAc(<;zUhUJ?#dizD9yGBI0DZlTTObse(OJJ
z_ky4M%=0Mwjy%F9rs&+<+;+hW=LDi`^#*YtBf3Ntl11Z<2Tx%KwC%n+0@>3dXTl8#
zap_+An?F#7y9pko>cwwYZ~oZ&{;Mo`BHHA{@Dc%5S`|p12D*mIbWWG$*A~i8=JCmJ
zXZ&R1+18ZUITHFLex=b2sm;B;POig>(V2lr*eb<j`4>HB)^S^S+uC;KWsoCBcOfu)
zw+{F_KQ;Kryd-D9#?pg+ONBfg)S&Gb0C#>SmJxhzq8Hy1uB+44aCRvL`ISdDJjuww
z#`2N-MaHO?N3@=GMNF*g%DmbOEz9PVOFgTeVzg-waUL>X9c+7u&$H;1<6jc%1ML8>
z=di!Fx3|l|dH6**IWqeGsig4;h=q{BpHR{Ym=axJzR%x3R>-M;-t%VNk34dwKh8Ko
z^m5_V%v?g}&ws=thrpgMMV{x<Jn3w`dZ@~n{n9C!IrYcGPq}!%u&T>4UWgxDUkOKb
zjyKw(8Me8lHRczgSCpmUzGNEc#*E$*@9%#@OO*36r;t~dJ`pNGhVX7hsUR^PCDa9+
z(UcVv<9W+;UO<573R96Ke~}N>+X;dsR-71`j~_nBT|ar|@lat&McGkH1Iz59*o}Py
zp~|avT%#}}F_;kEH4*q2j-azKT^SbFyoI_j*uZn}y>|2UZJf21pe6Rq&Uj{EZ0tuF
z=<7I%V8}D|<<=WEC_M<zL=v$)vIDy>bCk&g2svKJctXD~UHSPLtyo=Hq32S0TnhPc
z5qG0XU8I~oYWr)<|LSDQMu@k4Y1UE}B>B49+FIk{U$A}ssC>P%VCUfgQS_Q)o|@rH
zg?B{T2S5b1zvAce`8}%^r;}t0m9a+nF|v)4`fK|MzktvzZ6R>P5gEScr2XQ-FUdQ(
z*)VnLAZ0zt$jroHYqCp@yYXgt*zn<*6ow(mnZ$*<XNr5w2`~zB3{w$%<mTn|&@50}
zDTQKFue@Y&YKB&IoHy(I)wnWG_?0ZtBWeQ5;y#=n%{S#9!--xQn{xYv7^Z^Q+Q4%|
z;c>$2^W9`Y2j`OKn4*+Mo%FQjpTBcUJ3DR8&hqs(^lwLekdWjR5YX6hP1ERI>(pan
zz{HmpirDN+Bn2Wc;LFE&F=fmId)2P{E8NW`U3)QpL#ZrEG(*{;;UucVJ?!_}?^8BP
z9I=-M*1h;+pPU1(78e^bw=vh?@+om0p<{6!+M0bBi^Q>!pW2O<a{0o-d)DPf#J=qv
z0k0)$8%dXi{+Ar8cSYQ7@5ak9Mkz_DZSm^cNW}W!e9SvIny?-tj%DO%G*yao61@Yg
z2#SyA*abX|?w>sZPu0&wIk)O%#rZm*)x2!U%F`^vty>Z2@%BP|d}y_a+>10YXM8P#
zIMlR$?touX)ii-_XT{?AJLvP8D-~)R_~O*LXI`>XR_vp}l&*7veE=c;q0lk72d1R5
ze*V6t>Q>Fw;!x%A)5Raax-L*CXOLq~4HO}5wcApx>WSS5PrLoov%JpEK|be1s8pDQ
zg-%?(F4#Rl4k$3nFGleuDVox|ohO9P*+u6UhMGJk6)?V1mddMQsL%3MqQzm4eAPu0
zSP5Lh?My~;RztD$65_NOYw@g@8vHQMDXx?9lu4iNPW5Pwk35ld+lI~MyC(8%-PLiT
ztNNM>?pB{W@?L6kbDg>S?vsxmMIF|!`+siLbX+8NG8tj7Iea{I=@xl|T#m`2qHl7(
zk`uNhjg}#m?q~BPD~w%bEkjzQ69<#_(mB2$Si_Rv_q<KrS6)w@ACXXxFIL6aNlJfv
z5jsimi=$`Dq>t-v+@DkJ*E(hX8i`!z3Gt+arNxu6*Z$KB@;{owJQlzd_D>1ayCkXI
zkak5(!?n*8D>m`RI=q+zj`hS-i7cv=R|A8_UkG*B3o##BR$pydZAg=7(Xme|<y}28
zY@!=V@ob)>^6;kEZn?UpEjhzC|8l;cplZ{2CVQRU*|?{xCGlDFHKV!bU5w{m#qfD<
zoROBVUlMyhP(yn`g9`C)=)J-81S^7L^ZA8q?{J>w1U`@*8qdM1+tqplHD^NQ{;n!8
z*!k1QeL5znz`IZB7asRR4qf*-a_z0SnConOWv?Rr*Y@}-v(A3)_ehy>`~!p%r*|El
zi+P7DTQmlCa;7A^WH%3LXvaCeLn>^)xq*Rr%lSYpd67R>w*?WVIM4`gu%H*dm=@ew
zv*35nUFE}TsWvuy66W(?8zmVoA9iuii)=W{U(UIFA@$i4q{o%i-u==kN98s4Iz_oR
zH>zKm>yvm!Xqjp_74Uv~^ib}`*8=?3^~=N*S{8WsJ3nMkkOWuQc8>D9zMP!6{jNLb
zSHwwk+FpMA4Qytri`aJPwWF2#m#I%oO5)#6ut!#s*kb>IWIByV2>&(pfcfL!V4?ro
z8};9;J%6b}Kn3~_q)>9qf4X~sar2MC=YO>J@I=J@r3fJofHAt(<)qf(rrdVxzmkOh
zj|`#PU}LF5{xXCr1OFF8s4N&@M}R!yEDGZ&2nYWS_;<j_^G`(-&p#HP|6US>+INr@
z#<>;7=@q8oCANVj_P!+!An|~62gUWgcz^ca)*ZkV{o~&G&!#9a(*%rbgMsGGsGiTL
z!GG(BI)lVp4_JVY28yfxO%ei-5O+)*u!I04q~||=?P|L_AdCJhObAd$l1+F1%@V=@
zLWu7f0w$n;;e*P9dH!+j6o+vZhM}&VtSGb$>Oa^)%uB!y`gL7jt+7uTJ4!B;@;zDU
zj+=%+UQpg!LN&i`_n>Wc;lyPsOSzWYXJU7^gGveGI1_wM-nU$qUSw`^S!mcgwwiiz
zVP3xtW}j<WKaH~Iewp3>Hg|h#{!bxF?Qi@2^GnswqXST<e)@SqBVz}A1;f-fqD$An
zz<@RZ>01S018R>o)z#HqhN2|Mo&tS`d8HGWpO9C7^6?wW|405n5H4p89ZkZBN}4r(
z2fmC2=>_=t(Y(->^^Lu?`L?Rx)*%n9zq|hav+eS`2Lo#UJCs`l9v?Vjy@QxC9U&h0
zajIZOoT?8<pm!LQT>=BYOTWLt_xk%TMQuJXtVU52Lssw~AmLs@CXdm=*`qmtQ660E
zX<%)9k^*~X^w5O{;ou<MwYqAf9|d!EsE92FZi_!327_|~S;%u*nwlwKv4M`#SU6>k
z;jyB>fQfZC6&#wwAUm2>)3KE^nFFQH*oOY#5UQ%H(@zlJD7B9;96Ap_-GrQ<CJiB%
z9TdQPaiV$!qR4J4Gng>E!XF2m{07;@MPphYJK*4lKS2eSw>&5fdmvdu2l7!hoZ6v=
zmewvp#-n8cc3`}6(9O!G58pTmx|2|c{4xSbf4C$d@0nM3G`^F4mvsCOZ5o_KsSZOR
zYlPC60sy>PKP(2CumCY|IU=C#3L_~27$_tG-0oHQ4nv4l&Pa%NB$E3O`e#!ueg_~B
z{r86I9Bmp8dFXAT%cTQyQG)O_AW!7>C)&d2Q|LL`0Ot@@gqIxLBVg>f5C3!k{Bp3t
zt2MCm@}mA3ok>qr-{Cte%QAE_4fu(t0*s{28(a7|LGXG8uE=EoEuvpmsqpd#Erc~-
zc4kJn4NgjLK<(Ox24~9Pp4A<Xa0~GC#6yVj4?rfaphJi~nEYNr|JUQkPy;@{vUUP4
zB%&>FT7mOM$VmF~<>DJ<reOVu^F~W<phQ5&HY!gv6<jgxov)#r<SH9^9}0+wmUi%~
zCzJG7xi3jch&TSJ-hvlwP!ioRYnEkCI183{KmWUT0dxHsLkIQi=1UF44nUb=0V;?C
z_I)28yetG&R<NF2G{12J<(gc7rBa}48tf3-W#zGl@(RJQpN)t8Z4o$63L*T3Z$H^q
z<1`i)+B!QstIwdFU`_3?V})HBn7|0cTYfRzfRF5*Y)j@Ov<>NH&g<IHx2genllHdt
zkRAzuOx*6?6lS!gEzv780MI=Kf!G6X8VRVUSZ0un)fO}M5QPs7z*j>ahet>0jVr>;
zal3>!Y`W=3px$i!RS?|hpG5(M62Y38m4#=@om2`(D|E!4m6^G6HPgz^&+iD@6O043
zAKSTBM}W_#?nDB>hEjwPT@#G_oJMk$5D*WtVTW0@ssu8&4;|NptTF5k#$uDuu4XXy
z<$(JRY1zh?FRKF8?G`t0zL^CDsT)_k86FIysz77OJHc(LA2nw8c2HX#Jk;&#U=@OD
z1LssYC)zTUv%(Dy*NmymHiYb??XyYS;<qcx;mUOQDb9L#cZ@kdUHq&R26}vY5U({N
z5VsEeiDm71<;t^LWIBT4@W?qU5kp*jG#B(If1M~8jVpz;<Iu)^_HAJT-Uuu~7(<xJ
zIovqMU^EHC&J%cm5EG1RwN;CQcP$`-OWqnJe=O4D@1{&{1{2$!DqiXuT^kICg0YR^
zcQ>a91kC}D+@Z(28MzRA7Nj#qS05D`b#Fc&xq*?9kGK-Uaq#!zmMCXX{TNcVgf;e6
zSnFS5jlzx&EU&-3!?yCBk)8cb(-qfhG2f9ihhvwoz-a<aRVArJkDvDP2!IEc6;~Vl
z?d?B2RtK9D&ySP?RbOsQ!q<$P9LYxgX1Um+iErPLw|JSlUP<m&_Pq}|R_Ki>6T{{g
zMaKwoDWFYE4#(rhjRk<?zek;dAXxG=9`S-J5rUT@MQ9)$GE=sWwPc6DYs#oV;y|0x
zN#h~E?aki$^5tLNz%;DDF;q<@C8xT+jgOB%oc>~GIjA0c&xj98o22@e|7C=gK3X8x
z1N-|G8JU!~$&NTf9lxPnYGgRkt(Jr-UPM-Q_&j6mq`92NX==u3Y%>cB3vjlCB*G;J
zP2W&O6|_c=q``GB6Z$e77T5iXLsziNJtx2qmWGNp13~*2p}qIPw^8u^{mpLrkcO(N
zgfm#xe6^h#jHCv8$G;FXCvp6}yJtxd0pnm)0hK#p&3gJ^3e5JyTfU0?z~pA-<k%Yr
zL4o=p#Rk{~PMwO6hl^rL=i_$c23yy(TTqWXkA=+EU6u;NuQ}QMpQn%7qsc_hDGc6t
z#1CRMRLBJkrKkFI3i2onoi8;{=nE0P<XOX$<qx;646+4jlwV|i;GenYp$8_K{jwj0
zoISK}iZjj~2oFy!EC}gOhm#tn01(3ei)9&rTlA=uKa9FLS(z$Pi7CPOx)NS^+D2`?
z*+$01cW9pW7<A*p`v$eG(i&$n<of=A$cXNFC0|&Gz(Xa<^Vgaf=nlLJ^=KXhr#}fQ
z+;H2Sfgb|_ocnSJP~he%Nd|r9`Ogv`$jOcQ--~T}?mCnWFKK*1s#D-_>fK0DJ&nGk
z(Yi4+Geg5LyaH-Cr5}mARmV9rI8X?F$@jdVdW%?4<eaR+EMVI?l{<1YzjZ=6TEk%E
zyM+bbxrbOAFopF;7L7$R?0Bh(7%>UJjIoaI?H-A4^_Sy(gmV`AsVWmqDL*cSqExo_
z<Bbuh3(*wa7=h^xzW*|Th$ZMqUpy0shKKvhL4$Rj*_wU-6^TnuJ0EgN^>VvTUTc{_
zbWP^?N0{FM`q}#<T6GU^^CWfagi_4Oi@G{oohD=pd}DMSw85uPo0y{Y^=e1c#$hWs
zA+J=>JrW9!D^?*5TJ&nMGynO?$8@@pj)5VB^3@lw=Jcrn@(`2oUi0b-@lrF>BCzG9
zx`bpm-aqs_Z0n7HFE2WbCH^y)uOb-A7<h(oXi0|QMNm6XR$6T-9Jw8M@ia9N1_@3K
zPKL{6jiZ+?hCgQ4puj~3JB|Ff#9Oc{iN60Pv;iLnn~^MTc5?DIv0w%6sy=W%XieUl
zb)AQIfV1EQHT<tU)KQ#lZq@JW=IZXJaV<(ULNy$}H@5**53z3y`*&gYqQoYh93L#e
z-{jQ@KQ?dn3QG#{TEFYes(=`u?BzR$pAWeYId4q9@!L=0a(2G5aL@M!Y8*iJ+T?Qg
zQX}_`;vioLFRSocf>DWe+xw?2;h;E>YdYLvfSwFn23Q4Ot&a|*D?aQmjMA#h&lgk9
zCzL)w$7A(?ppbLQ*Bm-%ZEf|BL^`!4QdyyhQ|?KBN*7{MX0}GF>j*=7^HX&VosQ$G
zr~4_JE|kC{Mkzf0${b5UC=v?_R_xjDuMeaO1Ol;kRFJ_bgGxuzIANjgfyp0c1~cD5
z#Z(=>(64z@(Y(t~v)D?_(!}^Mv5H|jgYGs)=fb+InsBfzJG4uZbrW14=j5b~{PGJ3
zxY^9`28j~)J_cKE!+NnP23xSa82@G9r21LgYvA-0r8F_Taig`VsVNfs4j8rN=Yx$v
z44!%FT3rSo^$(-5-Qf^$Q0_B#p(>9-78g9>{Lb@mzxP?3>^^FnZ$mh8&4oerYVHk|
zC7`B|Ylcg$;L$K2-<QV=ej}4&WMOgf8YeHmI#@A<KNS>XZ|?Xtv4@_$IK@F8;Y7B7
zw6Rgjx_tmc{JUUG_r@AAOJn}AN&^~;IECcQW8aZy_J5!*(a0q8b)};?=2rVd1zSqx
z%-7DQ_v@ZNf22s?c>*JCl-+wma0pusu|a5Nl%eMe3xLYjP`LtRot%Q=ZvIQJrjLMf
zoC4`P^>R!py`VJ6xL1wzuu8KN-Cz+zTW=z~K*FvU!2E=rPw04iT#29tnOAf%Y-d*A
zOU|&OGu}Tg=B`45ee9TP><14?u#moo(d75Fqf>Sk(I6-8;e;q}LSL6fS-z-{PL+PL
zp20l?YAxl^SlTfF$P9As9en?;D3N%UxUM@oj1PDw!RK?o!vNReZMx}3{KzV(iz-sQ
zg2@<e^55W0Vj6*IC+xm_=ZNda6<)0E@7HI<ftWdXt*?_cI8J(y5EfK^t}MPn7-(O{
z0(yx}J4R}&7y6-uCqZG`7DT?{sh?7jnt_of=?qHUM2TMDW3qrLowPy95D5Wkg|T2S
z-z&6L6ZV)Yq8Gpf6<Cz*?Bc@Jh2;)LB5;o{3AA-v*O30Bn;)kgRC$h?9y<%tnd&J@
z6KM}m{Duvure)9}I8u%acQ?j(#H+Zq(*HPj2qInC4!Tfq6~(M<bPP(K(mga1_#XCS
zsF@Ru8}z_ra|=HHJFxJsgSfi3*yYr*Z*=z{B_bgWcOCdu1L>|9?Gk<OS!aPQmmC(T
z#Snk}JYt~1-M}%VA$p<CqVA`}`#QnoULH%Tk=Pskt2>M=wEov)w2HjskyFNl+^PHk
zX1B7@P3Xh@wVuQY^wUmD^*FGT5c;AoT;%vCU=_;h8ygQ%PAMx|l`|CD;aLuAUWx4c
zHvqAVlmFy%QMyn9DuTATx@+aR=wZM9ly{m^$H;3=Lvlu|#X)}-<XYpPOh^3;`%<A)
z*x032_irF3Lt?d~gj_r(Z*lS8@YUhP%Xwoj6F}TRMQ-!kHy+-0uV065OO#f7OC7jp
za0tr~XfTNsqIq%e%aqWHS{?-)y~H#0oJ6DWxkUNc6BNJ0OCf{*H(CbeB0|F;Tmn?N
z*NMciHHbZQof(kmj1Xm(J0l#2S*M`UC)`2cQfG84M8o^nIc@!5f4@D3E=X&Y&jNSa
z>bd-|G%I;U;n20zs)*9hD5lFteik@vVd0TXPe%H<h67*O&HaSOQnfyXw=&|#Z7@$v
znVXn64T=7#9zczb)+UD9^!6{ncjWR{No<3s6$Qkr^YrHl#?WfvA&hm%@fV9f&d@}`
zox3&Pytk)@eIfq~0KJ5@k_!g)p0g{36Q1*b-qghSqss7JJ2u)p<eG8jX#W#Ux_m_E
zORsfebB2tAp9d}qOO(pvb&=0tytq`LTltl2Bu;wLj*c9T38Fc7SX_%|WZylWtnzF(
zRd5hBhJ!|FARmJLdFu5OI6c{A--9k-nk!>uG*r2#1=VASj3>k`;WYC`P5gLynX52Z
zy0TNpgmMS0_E_|nCZM203roxXS0Z?t(tmt|T!j;krZKul;8Sq+@kvn(o#^bu@glxy
z4j`i9I=oSMKr}-illlILJ^WhVFq(-`U}&h;M}m4a*NhYTt_!i-4WU!@0qTs5QK*Jg
z2^`<?fQXFM_)eCWzl}0KoTmi|8|(;EA?=EF%G3)csqkXwVCw%<?<cyJp%0;yuCD_J
zKnT6SF#vL?wR#u_np>FfU<?6&k#u2$M70~bMVEyev82LJa+65T2p92q{eZm6vYfbc
za?%h(@$neYJUSIi%hm#Q0<Lc>;znP8#JNk_-yA031p{J3nkFH5E%TPJL;tJDT{~(}
z1u!eW>Gxu@GG14Jd;QEyR@B>iVJFFP6|3|c1eQkY5|`n%{~0#%rkPdIYxQW#pe6IT
z%2PB$(|HJ4(fhi!WzXHG8n05&SF)nUE_*MOfg(OnF|uZ!V`{>xzv9Ns;$mNGpd2m&
zdjC(3FR<IS?qPH71P(wbXcc%>LE{h2uLM(OG}P8|@4h^TD^LrI6Umu82_0d}YS^{A
z?C7zDpDp@^TRpfwKnU=_Z%muBii5ahf<^a{!YR{t`HWv^r=nqxB5F?;EO^8z@rj&P
z5m&*DocpZ*lXsiNH%o!uj45W{n1uyW*uEp5RM8UozLkBLey^SI!JiXZt#;+-?hBnE
z?bGlV(uY=Sj7f{4uje*4(kEbL*q}C7a8w=P&%>D_V}eX_h8JA*_Qx(+^*9K98TSDk
zjW@K`ZP!DVB>Fk)3gV`}7?Kwa!v!IbXnXzT90w6nM1&qZRv*Z5KqNhHeY6gh5LR>+
zVW||c!AF-&Qg^%wSj6jZuT6nZy84aB@zhjW<0ey$QLsZ=F!Wnls`SLx!Mog%_gA@P
zw3(4nng{?w5SGoH8v{S5o5qOM#io?+?igrc;u#f2%6EycDx2dT!k)1NN4tp$dGv9-
zLMWkcRXsOw6=%qA5t3a?#2yQfwLZcLNPsex%q7(K9%KRGf#JeC5GVV>MF)=DF}=e`
zTZ+K-yGU`qrp0!wpG=P0f@KI<_E=7KV?G@sA#y3DmGzL3I4qWlP6l>JM}<3{{C(K!
zXsAt(apn$l>AcSJ?=ySmFu<Qxn=ow_E7sC3lSyud{^VrUMzBp|*}*5>C>qK%1|PKM
zDePZA_8dl+6P`Cl4&oV~r6x+|X`C9b`<>4z!rVu|0>-2ZzbsbKzzt0cF)~<H#{C<n
zXF*nm<px%<{*&RCO1uuaI#PPB<?-2nWO0Y}>{ANK8qD!2jb46({j;N9v$!1JT#WdN
z&VBMdy0P1va}rtH>gQe3(gkFtH$YzrF(GJ&GdOI(@zQ$#8V2sCzzsj4F3?}EFVc60
zEp5ClvuMe>&C4Fi^d|$qrr2+Va~jf0DehujiV{x@tHlKk`9~LXl!gK`OrF;Ea)+<I
z2o>>O2FYdHecJ^Txyq767e-+#H{x;?IrJb1Cy19@bE@Z(vquQ-`+*+gy8c__zP9m~
z!dd2-f{e!*t^MS<0m}B}OeqgSS$(0v3A(v#^{|jh09fA~t1~@^l?@h09P*F@KuwPq
z(!LSaaSDfxfLPVra*hDI-RE_61rh<SDOz8GJRtL8ixmLTII*uH;Gj1)q8oM!(E`;4
z{Vm7m0{Xv-R~hilO^+Q-t$Xz?VvD=5EDyzt!2k*y{|X>GU-h?E#pS1u<m*x(6cjc2
zSis+)=8Dt51p)r(t~;=($VD)|fF3Caog(obSnqMv>6v#{MgU_XyhV|5Uw9CbWvgOq
zKT$X+ShFPr0%-r(g~-C;BLEH`AgJ}_N6%4Bx>l99zSAtm7Yd57cs-6cLlg7)Gl0O@
z`!mWKXk%fbg>8&T$(^R=YGt^*2Y2$i)t?!7z0v6FPWEzK)17}DiO+!L3kSvNQ+H~-
zsvR1!%PK4JPours(-6&igLzs^)(G6)xVjzYtCiNGiF{9pEC6@LSm$UF?g?ETSd>?H
zgBcwnB)ahHy>e=VaZGyhe6I-OIKyG%_HDw_!$ZW^oXIQ5(nCQG&3&mxr!>2TG1zw6
zRtvTvf7p`^1nI^2^I$MNpDO6*a9KmxMGJbqye=tT0GTy?f6g*t#Cb&9j7hcrIbYD}
zbQ7IS&`rFql^o<h-Y+w4D)uC?7xR{#b)9jQjjhzPp?8<Ld^tX+C^LF`BET!w#7!3o
z)8kd8Nm)X`_|pa}@%VOWC%|jc)}t6mxRe;(f1_kgqnv(X30%xHK?_jFY~T|H?RNoG
zK>L<4eTmDS#SWb!sTcII3A4sj+G$O)hb$mNx7?$?K5!4uRR<0on|SRDV`D*q)arFy
zsdSh2WG$S+ledSbEQMbq`WfYblJR7qeLi!3WBWQp6>k~>xkI#U7F;B*)n~zCRaCdl
z3}pH95nkd0&(GR2&3Zc@nGU8%ikC>RU~8C>oEO42mfV?HSWw;x*+!pJ;^JJ;c^RXF
zAQMU+g2lTp->u+-TdrxWAjL``ruD%?s#@Oa5_o4r<q^(sTOXVabgu%0Q*3&MNO(tt
zGJz?6#Bn4Xd`6g59NfAZa6Zw{3!OR@p&4o$F?L2LOLvaSl7Bi|q=>j;_7Wg;6O8RC
z0k^2a904oDH|_jZP0@$2fvrhNQ8e~|J-%Yj#a5^Qs}nnhgE&y}nn|!wv}iXHYm0CA
zSW82oB5O@N%v#c|x(8JZp@A9nvnWpE5=oPZU2)EggWJFsnq|i|qq%9B?FHeT%^KTN
zK5+K<9hc7Nmei%pX)ul-Isu7`cygtrio&By5Q)WSQo#gOKYK<l5}FANPFsKb+oNC#
zvNzb2z~>_P3gr1wq|U#x=H)lbM~10om1Mqvz|eu~t2?OXP!R)Xc$JZRtv7$H;LhPC
z<qckMCbgu=Co8l8Wm~1N`cxWti`m+?%U-GuIb{UX)6xpFz);wfbmsviF~y833PJpm
zN&Vf>T|!4sU#o63`^q>-;}ZNgch(Xq6f1Sp3P&N6_C)ErK;Cq&r%zb%Z4sNFAuvNv
zG(S(bi5P=O$rJYxj<0Re+~<aU+hAmoo7~g$Rs7rcU-Es65<bhlSyPTi)y1=I6Q6uC
zBR|6%P*kU8T&X~}*!2t}AX!31v{%>G*E6E>YbQJ*wAC;>8sO<UW*eMc?G@i1lZ4Qs
zTaupu9ddxfn|tM>f)#@XKw^D;R(kwkSY>xE_VEBX1Nmn{Psgdy^54|#rL7RECmc&d
z5m-5#8MNZK{os+iipg_<H)5jOJmf!<IOO}nq-Nl$%{p9amw_y+bT|E80`ePoy<91|
z_VHBU=qI1?m&8=V6;F@`2=mIeJUXbV0rMhwkqK{WEOc}7r5){f)64vnQ{^{{qBjgl
ztP5y+!t2}J#MgyWz>z-+C8T+ylBQ=`a~g2ohe=O<+*|IFJKX>NUCbs7+vO>TjVb_Y
zB}|xTYX~fhOg>h8sQVB+9&3rAs{CLtIU}}E$M5n~m(tX%6|uS1J#WpqQ<iedybw=e
zE<AB6(8<*10NZ98&Rl``mkxCV)<Rkp`XGeaF^s3>d0O)gpl3zmI)j-iyhcTgQ`z<G
zAM^^CKQAwj<~#3ZU}J=%I+CeXJ9wg;b5_ndWTE=Lq~DpFt6qckO<Wq$bp7eG_?$2u
zQK8Y}wy(!V_+yAT6Lp557l2X7T9yBhv)L$J!@f))SE%_d#WWiW3ogke62Rl&5@F|)
z%4uG&oEaRnd}J#c)dLE2(j}~%>}>o}9IK|A($)^VJ@BJ_1fM6iz@~f1X5D?sEAXa=
zJfW7|oXz||a=dkFeCn-){JIWs@Kh$hgB&XoMCZ7W6g>LgEJNfvmgdGF7&0YqvcZG}
zYyC?Y2?L>T0TZo{8U~Fcs1*#oVFMFs^$Mxw=;aFYr<?0o8Z;hx?>56RXQ7)4*6M)a
ze}W9dSDwnY*cQ2cpi^0VZ5&Mu!oG)%jdsHjBb)IJ$mgcNwGxNA1^bss@WRKvATt&d
zVWXNR;aGU&$QIYfV9o3Tty?jP2`EtGrS2w|vCZ`Kf?upBhTVn%7gp{E(2MFP0S9?6
ztyfo+x_R!#O0VOcbD#w_pj`=@Ffjt<WP>kTyFiSo?yPjR$1|39{QK|{uQP;6+Nq&j
zi0bfk67e8Iu<|9UR(L)*{@I}Rai9upi)DC%&)*H7nt_OVL<+Vkgnbij4+_B+1_P^f
z+of?ha@s?7S039-i$xFiv+ys_zt&^khfz^<h1FYWb~{uDY!rjf9t2mfu&CGRwub|d
z`Uxl0=u_aa>`;&C<O<gbYjLC=L<YRSK8B;q>eUamLr#@!>{mS`bFhkZ%+@>c*bKqY
zD@?dr#KFqC#yx3_XKQTxSkY~^%c9awk*Yeu%=PivU34tERR6r=%w~?;$jP)H1iB?M
zG%@!$Ez}JM)peVHb8`>~;z$?DGV`Y;N!7hNfK0x9OBRF|PH@`fwvntW2s<|ZE%+9p
zI=L(0JJnRE1qQou5OtxBnOJK>Vw{tOVLG0}-tMlH66pdY3@WtDJw$oVh30R}#oFrC
zbg*ZQ<&cFb<jHXcmMHu`m3?_Ul<nI-LI^dYED0mBH#5wPC0k}}QN}Kl>`C?zQa9Pg
zSVEx^X_ST#SrRRl$gX89p+aeq_Vkpt-#L1}&-ZzF|9F2s&!>9E%-q*~-Pd(4*Lj@B
zp(wESDO#l4RY=*<D*fn%*8WBZU#CE9@booPQ`5Vd;_jctTWpDe;#NZ5977^+Y>`}m
zFjF22=0QuV7J4VU1NVoOM^KQ4uhY%hcUr<F_vzDpxrdUPycMr3QjD%1=vfrB$LV&z
zV+ww+=rNX*+xIMJrQF2mi%+LcMB`3w3xTMJHb=qu`2LErZL$6d?xwXrDUaMEcTx8=
z$}6WK_o-UvrVI8)=asf2dXY-6w@BP+nlXFzBKhLRAz&{x)Y2j~`-)Zw5kPO|OYKL=
zmB3GC)u!lXbZtJ?K<3%HMBKXIGCz&9eP7}5K0!j3A0G1#{g1bl{FCkWGS{A&g8G+f
z1t_SgS@Q`$KMj!rZ$<s_gURopO15TwLIrRV7;)b-f*KW_lGvMIE#Cg1%rl|iutfj+
ztzEQJrZYXO+8PTB3hW+4;wrAYUG9$7cyKarP0jn2JgNmk2PMELXpXL`AYfj{{n{xi
zHFxGwZ4uJG|A&l;SL@XA)~O9Ev@zPpC4c-MM7FGxgpQ9)iy|(Id`;3)=e-?b;w(e5
z%tOv=G_Ts8r!SI5Ey>B&j(gyc%~hquEof}v@q@EInDgYt==M>s_u^=Gk&c@NVFCw@
zubORMcetSVQFrr&OM?fWOY)~%`KVlT^Xsxddd2h}Puy9JhR%EZJuw{EPM+ehv6jZE
zeIZ<&GVvmzy2lZXl0t(I8y<7GX{8>+NDc^`Svc=&<gsZ$Ho(p_Ub}FnfEdazfAdxK
zx5vjWd~CTHSLamop+$uGIrYiK-q8n}k8E@CdgXKik3OYgt2vx)#n~fiw%6o^O2@Gc
zVS&@f{EkJuZs8d=AKN=~<l4Oa*v_;UGs7l*rR`rgIG;Sa;{Y%6erRXwkJ;5%y29Nn
zgsj5%2ujPSv|->ASL>TDhdLu-+lgj+AN*wkBR;pD4#w_stSEO4GT!{w;_D@?E(JfO
z5hDH<QJtviSyosn%dw^~JLbt=|C@Hw*F-hP%g!2_?an1jbnEq*>g7JkiR}m`FYI5i
zxOr=B-`wYSD1vpBg7KNUL$r0KeXq~9od~`^j5AaA37tNUxayh*H!4i8ei`h0(W>-#
zyyIFyJm!D!J6bqw{w^WT{{#Mt{gCfI7yS<@SEsqRSXi9pGuhl6`FY+MKOKRzjV<0h
zwq5pw#A8zTv>H~5&a3ymn3CWfT%90b6<W-x(x!&qyo>r~<uf1cEz%KZ-{@KYN_iM^
zu4B;EVx}KcL9bfR((g39@pkazz@=sr)AO=r8L^%{`?DpIEGqi3=0PYY{jTlEjeAbF
zPrEkw24trGDo@=zrEh@YN$^lP|K99X9mnjW+S+#sS{xREHJghte#YL6owMt;pRGC5
zr1$b`ejxfiV?4Qr|7vIIJ&Y_~<#Nkrvs=lBq^;Lp{dQ;XZ1&Y43%6>oRjpQsW|=&>
z(bo>He{5{)!*J)YitzljPG`8XuK6Ppowi|qo`Y;LbI<j0sef8bt@Ft7LjSx5(~`mS
z`e8GH9f@zZlqxwruxz^PdhuaUUD)Xxo-tR8gO2Q)zqt2zo82M3<Ogr(&L2w=sQXKO
z>oCuq$6K7;jc;ueI9qZ&Ht$H4<lXZ{t~UFH(O=Km{ch`cPgJky<hg9igQ(kE|I!uP
z=`6U)@?Mnum!x&}qG>mG1vYONWj61fU#Eq&t<SpJWoOiW_jZ~DZ?WKJYVvmKvAf@+
zB@JHPJ3>G?#1LEe%pcqA)IEA|<H<Ls$cm7N^}pH6;rQ5BfmH;}{{Xo(kB8zm9nVT!
z{l8$jv^5v8T!1I~8_Q)b7xp(zlPUJdKjB=!3Irl?|AljzZ)9VTt~^rvqZ9WB(M2N0
z|4rFsrVv3JGW!GS`a{`7)<XVPh{In+qJXvuB;L%#{Q=u$Cbky<On>XdnahWpsm7S9
z$CB}JB%PxsdI{U~6OE0N|8P1PSfu{{(K_w_Uud0>MO8U~RsjSIkY8ph(ZJ$lqMKkY
z9Zcf12SAm%WB{AU>E9?Y{pRqAWgsvhar#?MZks_8V7mSw!S?mJUKqn`1hT<kr$@J%
zZi&qwHTWYcXTAXmG9;%MTt5J4FgB`7?a&`USTf5ZaKPD&suZ=ik4gnN7y!XQEYGRa
z2UO+$h{~C5K4^|UV5S&piaAUs!~@XFWNYHKMZPB^Qi_2&?f=C3q>Wud`xLUMKNtBg
z+NVYRIe^2Fafq3SkGX6pfX4Dam~px<GCQG<Kl!#6DU9A@H_~*+wT6#t<<S(Z64P04
z^Z_Rc<H2VqF0D%$*NyWraJR_Du!cG7Bku~N81tE!uW8*icEE3Ny!mYKm*CxDZ(lrK
z&vEcFas}eCzZNR%&+gU#6tfQ^y9X~mv1u8eutmYHd)Kr1hoEitA)N2I9kGCBEvp?n
zkR71N&K6a&w6dCm!+t4Xs<i^C5OZ^Lh+2iu4vs)_-cJTrogbj+dZup=9N6wzFdPT2
zp)FVI>pP&(_66c;&<}!CCG<o7o+IC8*dlYl2my#QDo_>#0!P0Ln|28BA5{CGdO*-W
zn*(qVc=?Y#JxGth9ynz9#ztn0x!30hRBw5xS#TYiE3d;3NZ9<oA&-S0D;#SADr!I^
z^q9@Aw03Q~Ts1_#FP|T|1Tc+`2*5fCY+BFe_hIALxGLaHzd7pwnTA(XOg5>KmXrjr
z_?I_qQFS)zEkv6Nzz36KXAy(LlE7Rv3HoxA&R0MM*+FbiQUMA$Ys%o<U|KcBEOP@u
z%4SaiRp%>U)xaHFr-r?Fa&*+0@5DyvRi5{!Qa5bsF3Zdm<`ZiY6Z=%(++0u)5qwp+
z{`PHBa(pwOYVH(IG#|Vi*U7FFYYMtTBMvn4K4)`XHQONfqho%8d=9&1nqB0%R943M
z7w~Ll(&*$i_rCys^&Z|2Z4PS?Ad3QOjr|Fayaod%29S)QmwalbIP_uAo%KA&EfNKd
z>wv7k0tFFJZ9NRCJ8?Te9}2Qo@AE*~1s!{#C!qug8r*L|RSurIMMzCzBEmho?jXun
z+}P6-?Ztg3Eh8i8Tq-`~9rRCagyJyM86*h`-k*gcIva||p3jJl4PpXGM$S-(P|RXW
zs<21N0hPg5cEGPZ3**~A7%*5BodFOAFF96Yqqe!zG{^45SF{i3p~z_525cl7j)uVS
zOl&gKk@OJ0!oA+!7^SW|P^L10UrzFpcJ5qFoRNS>Fp&z>QmxYNzQ7E1W+s?TdHgz$
z6vDj`biLaAVMXzEv<Pr>J!c;xPQ)9@azv)G1b09&0|be70tfoLkEa6R8272mT?d#(
zQOk8!;n4c7^>R&)m9_QE8b4tqC1Eu)8Y(OrNACi^Fu)3p?opvcu$tpneohWrC+1eY
zrP=Ah7hcaA8vyNc(UQ`a-NXA0&dnue)l^l1x?Y2$ky-_1n~BNy@En;5aOivkHexME
zlX-OWR6F`h1?213?rVOIXVapIy@(5sc7!&b!u2;wzy17$uy=_O-_?cAJIo;?HVW{0
zxGrcp%1p?DzWtq`_D6t3yS=W-*4DOf4KwsG9JG4}>1IIzOX;~Ns3URCv8D9P#Uq;^
zy@f`65ZyV&eu0f16EwjZ8XCR}y9UYjcJ|Wpu!X4r#l1tmKlOg&Giy%h4!a=X&A{S7
zGA%mz^}WY!4wG8QVkeEAvurrog#Gf0-+vyNY}p5l+%K<x^RH3+%~lSCB^7c*LKSLu
zPPd)}C$51%25v6QUb+koY@=zLJh<r{Z+PFreqmFaHG{rS68s}x*tfx3!gb1$y#;L(
z0;@xtBYcN2NZv<DNRt=`Ygj^pf<`*R{8az}jlH{ezt3mR;#;?5W(4mM_4TFu!tIhJ
zZ+n|wxOMBSp2fEnB0w-AqpB>A)76cc1OEN@E0pQ!ggyEjSL;e9-?dTV{(0^Va0&56
zz^-TlZm<}D!>GXO_be1Lr$Yai+Py1nIB&uz!hOj1`@#PGY`&acS{hW`e1x94<arI4
zJ(<LfuTqdy+k4Je`9=u#gY>V{Cr)q=X>!Y+P!?-}dH&&GMQ=5(fM%2V-~)<5$)4SI
zFv+jf1^qz)<-_`o_Q2Q>5ZmJqhQ@AD>%>P+icRbj9vr--S3OVir2XN;HxQwQ-XfPf
zZ=*8)+Lg%{Wx03nW|boQVNSeu21pALOh5Pc^xztso0?v(Z-n!zYnjbp;)-k9nl|wq
z$ZH2-F?k+Xv>Yq<O#><`Hf|iqL_1T{peZcdpA&dqGDcPF8=y=xDx!#n))$cm2Utj4
zx5Anqb*&F!?`VWgS|t^bqF<Z&=!4`{msXX}{Zk?DIgh>n78_o4$8yDm0@=Q<u14Tr
z>3?_g``c#d`V{YO$swRO_Cd+Sv%`J&L?8&XNQGJ6m)O&B>8qYOR5=CI#@b+|bbR22
z`VA!h2ZdYUsq=k-<NZ}&1308XoIyiL2|NmNhWio7Hn@B2W;5r2&+=Qvhlcl7>qrGm
z2NgcN;h1oHQ}s67Rx|s3O6G3i!mwBxg)E-}2DA$QYy>t>6W=6=+k0Weob5fTUkg)D
z<mU3Iwe;w9jQ}Icf}DrmPcXr3WBYwkco}>gN0Kv~_5exCQyD|#$PbX5m)X7Uo3??$
z#u%~zdm};LYaW&4!vQ8^++F%h-`k@jQBYR-u6Dr6`_-$rZwW==Ito+zTXhM9y!}(k
z@kShXxbCSz320H-OS~75QS~;Z;1)lvZ^0Qs!{Xx1O*n^Y*#>53NF--xqYRweAKbrh
z^%W5sxdpHUHf-$;o3Stg&iPd;gisQRU_u%VvyQ<iJzRglS>_}5xyE{XHtw1x)Wcig
zF&HqHiDZC3)&tbo2fp_ly}6^CD~C=diXrs$P&WNDK%<!{q)ad>VYK_swzgq#O!Jg}
zk`iSsa~Ftzs80)mk(=KX<>gll%N|f)u_8fILIN94*eb81bIRoF5Y&fgHNSe<;2U5j
zSxZ%accISl?o<gd$i&M_9ENozUfp#Ej!004hk3`ZrtNKz7uhb6`aR#a^d$0aSbD30
zg2K#uXv@5|A8M^_vw$xhBoK+Uo#^NRXxDapUBQ15D%NloV#WHj=l6nBkg3)H3|q$=
zbIqKquHy1m0cU`-zhBWAarm$_{+L)%O=WpGSKj!W=O$moKO0t`ZHWCC>rljjEg+0)
z9P+h`1o|CM{L^-uEbI?sL3)Qs8=S%?>4Z8-YzB(I1D$Q-eY;>&Somb^Gd*Gy{v^Go
z2C31lhZ8-Gtm6I~#wSml@ScA5Og8COjlYauWcp^6M#+2y)mV)9?b_CJ(5}bj2oKFR
zq&=I<afR9*IM2WR(<8yUVJ{)#&aF<9JTCrzm3Op=ycaHS5yKN!gKTs(8|$NV4A3U;
zQ<!SR>XdemfXa$q`UmcmwjsVeMdW(;fdgv=MTqGhmztZU8aOPJwOG!zu?A1rbSd&t
z6|z@V!p8vi8nR+kz)I--c9_X8o3%%;D3IDOH5!Nt$aRgoH%GqiQ*?1ImQCuH3Z<-4
z5PI|)W_|0&MaGrNtB+LxZ<=VtHqij{57nTB-Gv=?N>=J^a4K?V$HEuDT--m7EI^Hv
z+iaEE&eF9xPS!crC*qC(Sj5k!G*8~&@&0ZxRe-M+V!Q2KqV;o1x>;VNfa={}`V1z3
zYX|5<&j_a2;;e~2E{VP_9F@g+6zzT>Nr_>r?k@7)L9-WySG<W?y!Myk=2%<ktE^Zh
zw@`>2e0=UxbqSb~T5%}RNUpflK9$w4$an>MpOQaEfC^(gq^XgrAuc){2Bew2>WpCc
zD}b-c9=@=Q>EEKVbAop~cyR76L_|<5i&2{iGaR(7LRG7c+uYXMvD5o%d^%_$Fs_UJ
z5GTL=0X_BW#eU+7C-l`{S$3C5ARpwEl~ZpW{@A_w>>1EG*_{_h?8Nu@DsW1=eFcz=
zbGGfi8Z9}CxH?dYa|UoY)ye7NQQ=Pu9lUzgu6toQ6Nx%H4@czz%VV}zy8tjz6=}ca
zPuzR=mx=!8U?>^XR#-zF!8cu;izhVH{4&_D6A{utoy5B>C?MVn$yr-u?(aCs2I4f%
zVZO(*Q5(JdJMFGyg{4HX*gYSh8M8HhPtGxy9?D85brZoVJ=5D!KpGE|uN(Pe{~W~W
zjwc;gqD!`kU(0>+&PmPbmZSa}uE>A@!Eky6HpU(B%2+MTn!+SjuJ`y&X`^<}J9~iE
z$2zL->JtR)&e)jbukY*gYFFe-r*QlNY+EPK^?h(?Eau!G^>kHVcX#yH_fsZZco1FW
zO!GR=b{kLya*(=o4{$2-Z&ynN9M!MY(F3S9WDQx3UB4?k^!R^biNujj+AX5zt4w)}
zdYk<=C4kw}&iN?Ku%hTU(M%wG@XH!N*j*PfM%+Gjc56GG7lwdtWy27F`cWZli~SA`
z`y_PM(7Tl?q~xBlV-Lu2rtC_`MqteMzk=`T1fwE<Es8LDez$IIx1)oG7Yni)LW~oH
zSXVif!gF$SFKm5#BCxo7_wL;`akF@i6Z>;D+}k!P4B^5d#zn|d3EKdYM+Awe;XV(r
zzCYU{4zimEa5t-i9PRBVoAaadg;h^cCs>9A!XIkPlN$ti6Chx3_gFpu8(MPG&j>Z#
zDSB8@_*-&wz>BL&!t~V(c?AW%P5b;Y(50fBxrscW6TmE2D^m;B59^~pmBfy!zc^I1
zA=(`|w?2&HV?E5Lx!*a+KB(L_qiHi&(zM@zTJG0@F}P*>DG|HOd%2Zy@6Ay(Hb`fW
ztE<VV;;65eSHe_%tKz7pULA0w08Ycrp{V8N8(y`DjqxXoKmn}enq{gF57g>94_AE@
zDo^v~UXwSwun<$k^IHcbqjm5Wtw{J0;5~fEC1Ij0c!sCKa_-*wg0TG3Qbh(w)I_A8
z-)%jh|MF7NhD^dU(qWG1>m)U2aLBh10?3=;Kn-UJ1*cjwY(Z&D<<Ya&l2N|CrB_<5
zANroIsD^XTcC>A;6;F!ncj&!vN1+aWnRBtSs`$J>|LXotO5Qrp%^5-c@COaNN21lX
zP7=9n0xZet_9wr89rO&JRC845+gS9n`npp3XET|@pR?ZvCj>sJ)ZE?-d6<}aRE9#&
z{UJaRI@<D?ltn5An!OdInRw!CYZYvT$v#mB^heo3n_<F<<+Sa5gIp42znG$wx_f{f
z+VJCcf=Yb2abOS<l<8rUE?hW5yZ&iF@7-Oy4BSq3=$fh$sH3HoXfeWD;5}FoeDHdw
z|9PhJuvNW_^)}VtJHf5Y>0CeXLin+OcD$I2NVclOQ<_}$+>Y*vnE{A*HVM{FJ2*O?
zKCP^hSrzMi8n?%SDX%N(<PGJI0KOBJ88g+OikYH|Ai;iq?$4YV5Si~e^rn7f%|LTS
z&I9wC#UkhxEZ#$`qKAFEKS;j2y3MW2-m9{|xA!SBne{pKHb1{A-Kf6M<=WJ0=*b#A
zrT%4&MX8BYpr4=70NLC|QB_00K}Oy)(ASr@iu5xHa)Rj|Su5*@=DZ%VYbMq90D_2C
z3XD>Ss;b9<E7(u+nSJaYFbJ8xo)Fv-JL*3EOQtWN?Tasmije1Z&hoLIa{~BkfzaW1
zf2~-zvmjiTXM63&PiZl2(<%qGKbQZIn#>YZF;}aCSoe1D6B|7s=twR30aOVC63Iui
zqdz`NRcRCXtRO_G@6xXr1)|{MlwvwawIRIz2@zwO1+|dzLwnb528SbLqV{Es&84#!
z%0p+E`#y2#Op9rmTyy5xJ#G6eSlq~1IrzL)$)>Tm`{mgNE4QVY_1kEY#p1s9U|{Ee
zY<0>FP<-$m+KX%bd$M>uK>ReNx>7*(R7#R~DZsvyzOi@<AcKAj8R}ntW(Wf^cQ3kq
zSDdofd0B^PN5FfW^J}~h{<Br^maTf^H)Wl)fmE9x;3KCU>mG4hksMekkrrF<ctB|R
z8+!C_IN95u=W@#yQGo=kG|MS86x){?)i5>X!OL3>L2demc3+2kpId%F#}`IapjD(M
zl#Nkbcn{dWI;8c>n~$e%u$5-SzG2DoV%K~oIIfgidf&FrIDHUUr-%FoY^YbbD!!q%
z<=)DiSyyRQNGbmU#%h?Iq6@8Fy)%dy@`-;GV2T>kuYo1CMbPpm-&;t3HM!T+I~=}p
z1_iR0TlP??-gVfKB16PrI{IpBBux1=Rkx?Th-0AFg{jFQ_fX)#Esd!a&`{l^>k|^P
zrh1c_(iX1a3r71C)ZPnv>E$BQ<jBxaiojeS6f!w1uT=rWWkp$a^?NpFxP-YoB#v_X
zowlm5<IxMlQ~Nm{yG6Ui^k>RKYTQ^;UG1*@48RH@GZ3!4IVJrFqK4-BeFcbx_1)yw
zv1=v;tv;5oHBm#*Y{$)vjTO(opq&%Uoxzr!<<9Tc=61d=266Ut(q(AYQ%bcswuRc*
zB3BJ9TOi66u}TpSXGC(tJVgu!y1nUkG4n1FkMHPjsX`e)P=^K^S7+xq_33eYtxTcF
zkgEf8N4A?Liu&{t6_DQ$9HeVX8WTa})I)sLEzc&S=obUh>09FJ+X&6xNgY21HAe1M
zZTnnvhv}>REDC_KO2-|p09bcJ+>EB7A+rCFQsX*5sA3kc*afFh+3*Kp#H1Vg11AKV
z3TwZtwW$yvmp2UqkFETr@A(|ifOHGk6Ykl5yd^P?AmE%+7W@T_{So072o>|?Y;w*h
zm&|<n)@2i?L)pc=cI}kd&U!hQ6&~m-?Jc{&|8d5=ynD_BHfxeUm)h5FP)4P4eD4_;
z7~aTr@#CjYI_;P<x)J5hu=RaApMEGdPB}kf+xL*SAYd?H01^gvI+`n+@^bva1CwAf
za<$Zr?wOa-RPHQt&9K@s-gV}L%{u7XiVyz$5X|wAO`8vY0$26iPEWJXd2Uzh>SU!>
zh?ahWY!kru>uS*Q+qYN8C8X|YZH1xf^cDhku0a%aF?pt!x1bRMq!E>Y3r^xGI(RYK
z^(^wxv!tN)fj;{=YcKDzw4_JQBb#20pNOvhQr>-@S>x^1f-ZxV?OB=PJ0nzFu+5aX
zdV@B{1_|dhNE{`&jzAJWy~cl7a+Pyn%DD^q1;#(w9W!G$lRpZ<L(V=LK^WDBJm4Ti
zMF7lib$<^b=z=8{OE0>}ZS#3!o8{@G>XHVo?!G>I*#qZeKYclZWSZPx6PkMI%<4)w
zfQ$o;EN7dRnj6t~-m6}|&dAle4`fOnHsQa3E{H?S$y4j=vCnRuWyQsDx55IU#quUW
z()6&Ki%TjuWQuyQu17yy4jmPdvF83%<8{Z1A~sX~!0W=rQ|`n|x`!kMibr1K`T4?H
zR8zTxJIQRydt@Ba#*=ZAC{Swpi`(`MH2(77<xD>Rgs|cR^}cIkhPNPx>vU-19+!bE
zTHbd^;2<q?ODxkr@<aT&_Xc@3ify3JM#(!t-*<4X3l0)qR}K|jSpVb)G>A<c_C-{h
z%CgqiY7Rp3l_iG37D67>s8-UzF%s!Y8=@g4<)ue`CHT0r#3rr4Sbete-1-t4AO(ck
z6JLwJazV1rd|<D*Tl7q>)9t&BzhLQ|(FvJsiHBhvVW$jXZ=gMteWpQKS?acBp+cx3
zHh&<Xglu!YEoW0rR5?RMRsNph$HWiu!~l@~t&So>(5zg@^{reaznmA5c(X?27esow
zp)a6Dn?|p@9fNl6oN=?U;qbw6Q%+ZfvrLXE-Y4Jq`T4=l#hz1%WXOyXWWJ4`5L5D1
ztbn*Yjxg$T$anA!5Z^*<YO3%}0juJ2j!{>4qGes^`Mr)~DoM^#q<791d#*=u4y|zJ
zb!_QL-FN;u6w48ZeU(GM(midw-z#yMP6d1uNzQogA2{jUvcOh2xcTjQLGYEijk@74
zi^iZ+!(&G=$Q__h3MGI-f`^gy(D|7eAE~(<{n`wOh+rYOxBwD=kAX-o6<S{E2hjHA
zmMEk8!7c7n4xqCz#q|rAq4}%U9cNf+jC$CYlprO3xhf}wcdl{T#x&9eA)=gq@qV$O
z+j2@W`Z1d>n*V^qk?LpSQ!D&}Z_E#~PYCeq>+9-(w`(sP>RuH4&g<^eKklvy8K9#p
zf01uODG(re2Sn!a=2*1DSdw3!;OQAZb{&rXU2wYBhM=>io@{mc!7Ka7BALM_Uy-lc
z^+w{xfvYR-`dybbZ@IXmkdZbPA?oekIuQn(u>)bVu=Ev0`#!d>{?r@4VkNkj{YJ^z
z$Jk;8b>HOnR|*J&{@9m3jdwprqS$Rc-TTh~7VfsK+}Zem_1R4VaQGM^ezV;CR!`NH
z3A7zFd7st_ximVWWF>Ie@esm=*#V5@N$2(*C$60XBEHKfUv&rm<#qnvYv^m=!Cw)Z
zo6bvB^Y6~x|EqS;;JaW8^e9(v)Kwb->c^nLx%-gz<yX|9YX=(|Zj5YnaMu5pAV~P+
z59m<riqlsK>w~xhfU7QR4IPqkew*XJz26jM?cm607@jJFK7!52m6xhs{9iz_+@sCw
zHq(8#BuZOk?j<n0dhXCVxfa(A0XHfeRm48%t`tqBomTNWE)*Ghbs%8Wzm#?q&IB@^
zI}{ZZn5^|uXv?etx#TSsl=1~;zXwO!?F|A+&ek>UN_<ijiE20v-@y3cqEX*<T9JOv
zdgsnwAt%{gNba}>V?LDuxv#iT%MKvWOREq}pjnDXh|9>x7(&CQ?v9jtVy;kRYth3C
zkYF5ApRp(DUKHa)@1|0pZS%`x<^d|Esr#(`iS0b!vHD!Y<>PkWL22X2zNC93m4>5-
z0|NS@8gG4ntLMxu7zk*!uXmxZq;qG5mH?u855avrrWBZ>IcZ}>*yGdb@$ivb&??j=
zAiwm8R0bQG{WB(@+UHAO-n*|OQPJb;<PQnTm_t&Pt5}g}2z2{2c^(KQovX+Tw61Ws
zUlB*TySj`>dF>l_mX?hld_QT-w=x=Zr?WTGoNBtv#KPT^oEXjgB@H*pH&qgMy?Tcz
zYJ7)%mfX?W0P?AH@L9K$%zf#NYJt`9kkPHm^Esn|=2v}}y#6o@y(^EpsVN74c!#y?
zR^t>n#E47Esf^i_&9`=F0ymC8qxgYJ!jSJ7ckZ#|jh^-I^J+%Bjb-OE74lcxZ|x{l
z;t^BH<4?Io8fsqUHwejm-x_4x{m`3J5nwu^fYkKiF5TY7ZCb0oSw@qeY`W3k<E}o9
z9!eDbR%>&#8vKK|3|sYgen@ni%~7e;GKf{Y5n=H$z!ZDprESQ(8$Jj;@RZ2y5qQ9v
zc;44WB_r=LAQLIPjz^wpJaELXw2Phr5tVEp(+s$*U)#|<jYr%XeuOhzhPvd(xXpj8
z|9C6%&FOX1n_-cweWgAbAKyPQp0kBxaz3WJ+@VI!+v};&hwnc{Jw41S!3#|Gm_?zS
z;W$IuCMUtd0ZbBB8<^>faqh=KWbJe2D$!H>KFULLwFDttGNPAPuNfRNwAR~uoOC5S
ze6YcCuSHgG)zj-GS0q8v;C5`8XBN(@n1k^uzND-yRk|*ow;zgSo;lg_MVj1aems@=
zJ-KV0etvI<{L46eUQ4Q$sz!8<oeD<6VMzGVj!3(kO;nBJFNpi)k_!FC3(T+AfQsJW
z9Q&B^g}Ttd%PgqWl~PmT{O*-fW=JU<r8yw&C68B+gk^u_Umd>|s$FkECVce|<{al*
zZLh%4CuW>9s3<1Q<Vp3=_I<VjAer5TlOL6uF4m5DaG00hY~wlOqa?b~4g?fuKSa?o
zjg_E>j7I7mbw4|*>DmNI1<xg#&Y<lY{w)o4j<pL%LAa#I%<_XKXJ+0D+38+Kq{iyn
z^JwAe1eHw%js4KqCNMpff9&H$C1FQb?vp(=99iYv)()e`_S!o*e2}XZJ6L=X>N^uQ
zWDb3S3dh8kh#6d~ckWc-_`S;?*mb+88*Wdx+Bd~TDo#Eh%UW^4=qj!8J51usR*=mY
zv~_T;%I{xk&{6A7R@svFXcQScUb5mv7xY|Yd@o@zwxy@eOiU<S?pgQgX$+a`BrP8%
zNmxhK1l#%2N7ah!c_La$An9wf&~UBm-pEH|k=9c-X-!FO;<+D0Tz+ibxO#u?^{Bh5
z=OMf78!P>N@)oqOh3v_r6y?Lg6hY$c+?@AL2@W_Ks3@ASI3&5v2~qjb$4B3I?OfOW
zQCHv%6Gwh&sFdczg9?w6%7cB*lVGgYa6%F~*N&aE4P={w7&vs=05wyHxO}%LkqPCU
zoWC{q=jz@*`;7CMUB^O6Iqv;Ss44`u{Zu_S0znSp!bZ;qDTkkHMMRWDI!o$aTx~!!
z<HPx`?Yh4L`Ta0aO2N?;*?)>q2&9z8(JoydA5BdBm`qr0P~EEWP_ucJ+tVyDPk&FI
zwyA148~&`=q32AST9P%>rHpsdakQS_0=N*~^R!&yd<|sAmXNmWZW49qKU+J?vENYo
zZdFE4_=SD08aeLQ^6coinKC$KDQzFS>G0i<poK^99#0u7*!`3cR6IQvSX~cgDLD6c
zg8ogbIv;CmA#GXC{9c}+lM~z3WADF9XMtlsCzhs=W-{Y!f_xmxPNu&(AyoY9z$(o=
z*Ed`JUozn=$4&OB@XgqEG>J7WYPo+mFghenI0Tv8d*Criy>&!7CdnE4<PTfMJaiXU
zeRE0(a)Ph7IBY*EFJh98ul~W$t&P>f=QoLP>iq+Hg2!kbZ=H}wa9SV^cE8SNu-ffW
z>*3FjYCerueH^d+@UZ;d$i=rqC2xipa}SDNKPZ~LcjndL$(MuqFZy$5db6K(XFTmr
zpT3hi)sZ~ek@Tef=;QYIN3BQ3Z^ew=IQZ~J<Y@DO;cLM|R|8mA_dlrjyI1RTx5i_z
z#(m(jTmNM$wXbql?<L21<nfj6GP^q$ZEj!K(O$CS);a5&XRVqGxA#}=YB*)_av--R
z*Q_#|%*-$;Ni{A?GCUoxKX7?>?%}ODhjg=|bu$iXzvw@~#mPxKKuifGBnIP;25KSu
zH4pE@;nl@r_Cg~VCfH3q(rZiT9`yiMRX-=HvX>oI$!({i%l1uul`e>b8QPXCXJaCJ
zt-#XSSZ1a-YrEmbk)}{{eQ7hj4JJBL+lZ2ecnN(?ab4_s?Jetj%I)5dUer<*!%~&k
zKI_TsE~9LgTO%(myir0>LW~;JbICyz#kYnU#!C%b#j}c^d$=)(Z{-SJ9)QJiz8__F
zm)XuguKhew{b}Oz$FU0J!`P+wqh;@gFT5Q-|Auw$_5H%xyQg2>J@s-R?|EO&vz}v5
zyV9n+=u@4vC$|$Hx5d93DV=CJJbp8J>}J%%>k*^Z!$+FJUi2RyY7AsG_&;dacfW4$
zy(?aKuXqkt@9D2{?W=I^t#Ilox9?)wbe8U%zC&weSYI#N{&u*e@w7!9a?-pu&%FAC
zX;qHtr7TieCaE;t<N|%$RA&l<W?Y<XRG4V^<aWZzIQ{%1TaU-;9gEU&wc2#Q&R0!A
zWTNFzQV4#sBQZWe^9`#w)(>~k8x!uSall=J9!?CRQq}hFQr+jQ;_FCN_O_=gdDw1t
zw^7`^Lt*a0*~e{h&X)3z+7QIiT;9%9E<Hkf$2J*D1L?b0Jjl8m3XU2W5hO>NLbl?>
zi5lx(-#>#>5#2&nTC1)oqOu7^RYtG5SL?lLqp;itYM6{9HEe_UDyem=W_pi_i}J4%
z;h$)UoxN9p5?(1R$ji^i&BM*5D7$*?8a@sVj{m5l9kB5UGYQWBZN^DiM9^p<mEG;@
zj8Zr`?xnuz^z|AijBUyY9B&A0HkN`v#}|&qw)UZ4JbE)@L}pdcnc1QVBgS-Qf*3_!
zmG?45l#-&v5OyGCl#5>%wj;f{OdE4V;ZLJy?a8buI#XVhGNQsTbxJ=+)3rs-)6o7_
zWY%^%vqqF+rpz#~C1q41v;_-PL>+ooykiodiT0<GSv7R#H!;dnWk#MOsj!5my8|1Q
z0bgu`nlD7pMv+;<bSA$jWvvQhhmD}yW)($S((Vg1UHFzX^sEe>nJPwEt<2crNP2XR
zcAA93m!W4x$*f*F(@BhST$y2NPbw^>El^PNacKXr4rDT-2|X)FW{J|7%3=v4r|8UD
zQHq^1@8w!Cij?YOCz5rg`1LO^l1sGHrr0R!OEle`sEC_rf8CDBh<Nm@0h#qg^9Fi$
z6`7SpXQqi#f>jy5Hl%(gt;rdMKZ^EOB(pr}%u`~Nd?m(n2U0(Swr~|aYun*NZ+(51
zjxZmIQu0+94HQy;DNWZ1RbPUh6(F<b=uA~H$^rO@J!y9(?eumO9zG>WW^JW2e=9Mn
z>`46=X$zOpvoT~A7o903N+GH+*4dLDou@6FMf=N<S--`Is*H6o4dt{ZYg9cAJsU}8
zHPe}7G0H&|##>vGdKIn76+zV}qWvw%EPXoj0t{Y>QDje2zeL-$12tca_KzmB1nA5Z
zF^Z}R!_k(cUryUaM%9<2XR&0~ES-5rY^M@q*oIVDN{g{X)t91Y_mNqebY{IMWl)7t
zWJjv3q{X<Q=3yG7$*eRw^N<+jw=L-ggBAlrszT33AY@hyojET?307ecY)FCUX))VT
z^{HroJ2Fd;&g>VZ6sSJ7BL$wLjll|vNBgUiS;KVZY8VkrnjPtI1#Jv2kcys#5B#Jv
z2Sq7oRT+`Cq@Pu^1zS{oEqWF{F+ykV7NtB<V%&5fy(y<Hz$X&W{s+k{8C5#-tQh5x
z(h&;jO&M)$J8J$C+Fypux=Cj~u^&28?l0jmf04ehYHKJxosDnIw-(~$7t+QM|3)}!
zfoLiAfAcZ;MSP=zTvo>S7xFT>Y1@pF^(bi{W~516j_+nR%*{xFB;@Rjq`BMyg@jC*
zb2J0X)F)5H$=ptlo{GyJPak_KVTSSsB;wtv4gFKnJySB~iU-@C$hSOExbZ|$HYeS9
zTZ-8luPcw#O$?H%A8k=c%rq1BV2*2<uitlJ93dzqWfnfvD|ooobmcB1GVS<?an^_l
z86PiqEF*Qu+?=W$ZN4cYdB|c@a;D6Q^!NwX$b%g??@V3$^q6}TQ?0mz_v}n@M?waj
z0{VCD>vuI*i1g`o^XlEBb|BNO+fyYn(-d<AyEoJMj*oqZpKZs!9qs$EzL}P-f#$72
zW?PWMrkV(u7*DztB9oW44WN@Z!axp_4V|>6Z{11PYmSh~2Sv<u?P~{#t{H^g8ThNw
zS{@miUKu!_Ol<uj%)ZPm`!h9aW7R`5)oPBYMq~n5^ADHa;mpmI@rsr43YU&<O39Qj
zOF&;tlDm*3TaqkuE@fk3D%@HoBA=RRrV^v=l1|b~B<Usqrqa+nRpw+Gz$)cwnJQ74
zrqrO_i|9((&(AlSi|&2#Ok(Dlgv=@W^fPg)@}W$CW{yrv3{6YkpO!MChPii5$`W^_
zcTCF3oTi(L`^(canjTY?8Xr@Y>mRF{uk)*%z?4tm%w<9V!Ko35{9)ju7mw+n;e2Y;
zAa~R#bC{eqY-+wCXiGq5B5Ql>eH*G$Y^Is|Av3j@h`aXa^o#>{9fJm(P5G!)Hu`ci
zlBp4#iQki9E*0qB<F3DhPNjBv?dtM2(NA>j+`G*%$>z4dRa<~Lpf$}jVoh6u$=XK&
zjww@=x(&G*YD`KoGNl<_KVV=**S{Vvmzkkwo2J_ospFWg?VL_*j3Q8}8F;r0t%hh#
z&kS5c4Aw6b<Da>uE><HbQ~k<efZVEvXR1^qROOgVp!AE|9G9thG*hAC=%(@nnX@!B
zGf|FB>6a|SNC8Sex$JbawLU;`s1}-OF1s$2%;TaSl4-iiO{SQp<({$CCXJ+%zy@#b
z`2*g}w-x3T0smtn!okbY(!v6F^Uwc^UaiV8xp-*z*PXofB<U*cZK#OzXnz|rYm&~C
z6Q!6aGcp}X(ro{L!e2-GlgO+tI&-ZUW%Hu(&nTry?ndF07hTb-MVI5H%IKt!3M*;4
zW~hiNv_BV_MFRW#NsO{yiJ|B~vaV_*p(0M9{VmBXdoaJE6ekr%DZGA>)?|r_s7L#o
zl38kW=4(+(tt#WW4Qcmf+G$r59*nRrnN_*ywXP~N*4dEM!T6h?>Z{TIC^G8?o!KEu
z`Ae0t5q@zY${bZ+hxV5sv*hVaA2AAYOofr>M5-*N#cV^>)6ui=8!)Ud#3)--7{e5{
zsob>(HQ$8xmnXAa>CA&*5S1C=mIBLY3pS|wdi3mCGAnY?@aZWrBJD|s%SJ6w^SNmM
z^<)+i?4B6qi3%eUEagSo*lyJP4YdDiGOL=-G!&!kQDq=Sj%>rXV2p|YM+trqyl;Xi
z<u#al2a?cv+G%SPJ_p=#$8R@76$URjHW;Zz=r#20Ix>rY(ODi+We9`yte~BCK;e_n
z{+?tOhR)m~`uot&3fck{6>$+gt4wBnS@cqOR2c?fgTZ0jqv|Ws{zxd9MW8c}iBZy2
z*b%``25rm|HQzj~L1wK4e=5d~AR25)H(>Ns)I2;k@Ks@SrZqT6@E9;bm9#Nu)O<dA
zHi*nBpfiQQl_;@Y33&N2C)7LyBMyr`<{GRS6^5H5NeDc!E2_R>8eI1-gw9+qN@-VS
z48tO0(sr4k=Fg!0!OzyxnIA+cmy{X2jwF4!HwZt#9~zQbzvxUvl(G{h$dP0XE5Hm@
z4-*96B|>M4iBXQJGJ+P}@R%72e|#GJ<ViX+NtB|g$}oi)t)wkDpd!wpXVGL99{i!9
zC}pK8W5Awd4c;FDixcSC&19AmTpXemCB_a4=_dqFR;Y+(w7)-@6<qGm?SMa7u4_d8
zxvE;nOmfjDeP7MVzd{>F%-7n@N#?@i^AGLjOq9oI;xRa!Dh9V1gW0SsYhdsnmlYM}
z<12uX#o`J1Xg5xE1dG+e5j15n>>t@6S%JlWXyR}L;<DG^)n%_i-^cRTwEma(ExQI>
zh=7;PA8_N8=hnh#>g3P6ac)AiFj%03W&iwRFgiq?rLSp1X1?S#EgXhGSoRuGbLnTb
zG_`b=eio0@!a^$x2KncO@tW)r{(CS4tR`;h%n-0T#HE8K;0ViZga~uJbf$?|g7!ZK
z&AvVcqm985*`tA<zh?oOsFvNGHkLqG`aT^De%bWvU~x+y9TvVDzhuzx8bTy4nHnqx
zi`QK8Jh4~|9=Bv#u~?iYVaXR_u$tP-))7{dfL}VRSWTE#_6@`R|9!_;Egjs_FT`kJ
z@JlX?!DubJJ9rI`S^inV@<pgc)c)sS{>(qDkEPETgU9~sjqGOwGp)UBFnD+XOCBAD
z0K;DPn%2@8g#AE7mS32N!7m#O5v#N8?udBIvcV9wHJ2_pSX`JTj~Esl4*TbQ$bY9F
z*4y$CY7>de?oL}<XW0OCaQLNm0i%P*F1xS}jOL#+vpD}cI{1HViN%@5VsOiL1Qw&E
zv;2KT+`qmMK8?j_FS8Y}T9>UYES8{!EWHyfmZ-V>HJxQ!jJ?B_4F-qDES-KVj(}S_
z3s_(<{hvW2|6Tn!9qlFCjy(rjOD}>WXfLyHaE)bl0S64}OV<bNZ2Z3m2=kA{<FQLG
zg2ihuA2nWwxNK$!SlrU}fhFLym#zhv>1CD>OCV}#BmZ0s>}N;#UoJw#E^|6qB2H`B
z-4QjHZBIbeVV4a?8~e9^(fW@E#A<6UzY}f3vh9i0*2d<C_;89YUpYEUCl_u949n7o
z3R`*EhQ#VDzik`_w`~7_$6It;FjN0sIXH|CX6Z$6V6m544A}F;rE`J9;&qljKpa+k
z*`C7TH2=ME*_ImzC#y@>HV%hh<{M$_VV4b16T9qT;h><t{C&h_`wXWEPjKnV!D(TZ
z4+d7<vRTj~F7paFu<J{$2<+u${uhVG5&m<-$bVK24v+t*M_)8wIM^#or&^P3Z<Z`~
zO)!#6moWq(%QiSfVoR4Xg292oUN&kS?6MEzbaa+2Buz~M?%$Sx?N%|%?4}luxGb!J
zc#5bg`^R(sZNBjEP?k<L#8b<@5aOw2{u1J;WiF4vp28)w1zY*Qh5-4W&=mrzWkDOn
zQ(8+01M!sB(v=SJ)Uw$EcfM>^A)dl4d7N1G{cA3<n-EYDml#;^Mpyt_{rgVX@f2ps
z-Ld1TrPhWWt1tCD?3j}M=<@aUb4n7yac;2<4i1-vE6Cc)Zm|gR4Te}BZWR6xl7Iu@
W9%12&DFA#<3z~2h6v#VG1^yqv$X{dt

delta 69080
zcmb@t1z1#Jw<x^n?ja<H7)omBMo>DWyGua{De0j>Py{w54T5xspwcL*2#A2B0-}Pn
zgdlS_$al_n@BRMo-2Xgho@dsqH}-m0?7i0euC?cR242DxP8}TvOc*I3EQ%Bnkq{LY
z5rIn}#RWt}Kt2pt)LX0BL<ZHAkTsJJ!<gbUysLk{NCX9U6MyVV<R6jW;KPmhkdA2L
zn01?(j#dc0X_!n=S~2J>h7coGytXGQ!_F?U+=qyK-EU+4=U{hc^8R8l@^tlN-XZAM
zhVxpi$r0M#v-j#LI%K<70>TdmKCiA@k%STt_M7hPX4x2{Y~Ij?4211ChaNAxANFpp
z6(-sZj6IrZvuqqilJGwkc%g5gSyE;F$4l&VYTMcWRH|>$mb7*oeP8X5v)FR}>Xtp7
zW5nJ~RcyH+IoY#HmX2VV(~!f%&%15dBTj2?bPfF4+otiZIQ-^0ilCib{irljNY?o(
z(>Y{!{^jeJov4$q`!Z9@n|>snZXLyiN1`q9lkN>N@8iSP<;eRjUwEsB3&nh)k75KQ
z4j47w;&uJ1FHUVYDX^2!)G`W}e(^pyfpDcBckNZYuZz~g^D28Q#`Xl|5^05xd8{TF
z63>hsq}1NFKko2bti+^#VV6{PE!@5EdqLY8a>dYSW^NfZZ7_Hs{SeV&nt;h%(Y6$c
zNm_xEL7HXzx&McQft7cqLr>cdZ*$t%uPkq4_@m}u(?)4Dh1p~kcik~we2yxg{`$sP
zf1S7G0J*0BRHt2>&SLo4UH<oP?RW_txoK^a2|4I)co~`0y%`JmR`tSg12fd)ld;5`
zg~DzOZl<B*ViXlW^^4a@MrrzQ4DXp6xeh)REWt}N|1w?Ys$7x|%rlCcVz8zp6;-61
zOgl8NdNF8rsT-BIB~q03eod<<n2xT<a=aU{_uA(zMaAn>Ls!zLccer?Le0n>Y$L=k
zWZFmVnGXfol~%8xVa{Wc7GegB@RSr0WscJoeb4Kewv$FZbKP~=X*Z#Y=MVcXX(Vq?
zWGk)SALq-*v}PHt@}B>0f8~38%*dZ*Npyu*=#;4+U}Qx*SEwii-UgK`c8CAy(x>RA
zXqCNvd~G~JS3h0Xoa%bOcl;7+&Q$RT-Fg0=+nNL=xm>BF_=P@+#H-6H+_@S`-?u3>
zZsq6-<0uW<qwo>EY#&BOuZim`4W<(yK(5rxa9uWXr3bh0#l(e^q!M(C#FZXk5Fm;;
zQjbz~i>#C$<Psn#B~sh+biD|oQr6(9jKqa2vG|Dl%G?2B*Jq9?G~`osy-K38dJ#!;
z!i6jC1PHF1+^;cd{&)^t<5s4LGCx&>EAvF@3ti`ajgpPhzkP#SSr=BNSD?)O+967R
z+K+E;wtq51wbAZqmeKfez){E@-2@@uE1^`ZESzC#shq?==GHJ?Zk5jbZl8mD;nhdA
zJDzU1YL4~CA37+pQM`=A^3&X?`Bh&M7Af}Ac(>4mAUxZXk>*;D`g;+-dS5+-!w<tv
z(bZjtQ5Yy(!z^0qTtD(u!ynsPU*nSHXe8gU@`?|?<z+gFTxWV%z`S79ziBn(_Hk12
zro=1BV*cH|&08EM?$<(BV#BPktcn+~5(5d`J9S2_w>tbAf=-)RK5ehW<`#?H%-cE(
zI$BX!kPnfU4GQ%B^?h5R7wr7m5!jFoUO7!857O8|rCI+Z-IL9*&V@-J%(_#m%#KY;
zX#fuSuS=M8fy;!!_kZ=4dX`M%Z47WNZ=e47x|$%dz8V%uZ=h8zH{z88li*jKd&P*6
zS4~SEH2s1ReLN-D$)t6X|2ot%`<XZzHiX}a5g#q4J#qX=;rH&3$qCe}le6#H*{U|L
z+C$I2p)yz&H%le8DGdo@slS|*{K%%=DsFYzN#S2u9)0?-y`|LZ?iVxHyP<>{pC8H+
zpZy{o`^25o+*cbO$@hhx7FO7U!N2rVj4;uU>i6A#$s(?e_H4FZYSKdiNzIXvgYAe<
zr^F#G@B6p!EDgRfw$x>^K-9edbDH;)P9mfxqtz8PO6gXTSbHe4qinOW4=|Gcwv;Kl
z?v7%nvTVa{79(2D*eJ^L$-zB}d2NRNu}0Cq;e1N`t|p^WRiJ(bjKYpx*6_e1z#o69
z)sPErXVl6wFtb)4Kd;8>RkT}J!#nGrqC2h$?=F2elLfa)>H2)yWrI4IS)zIRqTK6#
zf;k(CZ8(nmgU5jwRr5e#?VuQIfiggraSA{6)Sv4k3lM3uw=4AG3D_eHKHiOGS(twn
zeDYN%2IuhB;#y&geie2rb@E_u)e?`(1ZMgkwnYSsK`etA1)n`@l)7)U%}sxvJC?c}
zd3ZiIkwmHZ>GwFNsXIz#(r<ql*mH<*3dyuZt*U*S7AMqYn&lACLzupKVoTfVa+A`f
zB(dhuIigviGt+j5mKmGj=6h;q1(gifwm92$7v@)D+wJ%*^T=(>=kLXix3RBU%vcWG
z^X9&~-w@~YIJtVommr{Elthp7S<qng;HIqVT)Ig8b*qI8OCeBU-gj^VPd~vIWu?^h
z3&orn;cQxoN#J7D3lR2EJPFoP$7nU7ebtT;GY?LDxuc|EX6`<775G?29aMWQZ3#2E
z4l@pM&(_-nP^2d{GASpSO<uufu|BEqw$#uA5-81mD+qF2@CCAKjD$auS0?HWn_3d;
zlo<EjVM?mdU!JybtGGj=mMo)hixbr(i;4)uS>n}vc)(Q>4tn8NsFyqR%xX>PtMF+1
zrkRuTtM;kA2*XK~h_W<H!|YJ@b04C)8*w$xl?*VITaGiNCi+2Iz22-mWZMwaXKXZh
z<;Cl{4JH@tWX@WB#oFyMp<tX-(|WYF(IDxIHuoV;$qc&vGlKZXb>(v;+;KdFm?$rt
zI=mX332Hsn`|oByYI4qpOfj^lcKJ(A1U}7ROBv2eSoqc*_ZopP5I63NlM|(8AoAH;
zNc6p-l%zEEvI$l?@;s}-GmyE3N{i2bERxFbZWpIN?Y@Q}&RxvA{Y}c_ywTe2ovGV&
z&nEUY$Owe_I%$HKk|_5bHR(Cv+heFy92V8-L~9$)Mb+5c_gCfaemAv~4J^qBzJio^
zDVe&xh?lWJLQ%o$Z3Vls75ga;JH=ATB`_+5CZ?ewYCMZvLsPYkUnsnZBx>B9LL*y)
z`)7M$@D2PD@CG-Nq|$dwN{#*uUFp@R6ePKZxC3`KO`&6WR7xSG#(@_16S+cEA88bQ
zEZu<Cb#4mE!aj>A%61A3J~i%SM4?JKHsuce(5V*pm}Ft!K~#zXJT(}vaK#=Uanq4o
zhEHj*mO^9mv95OtcFI*ms;ofaN+tmU?Z*8wK#7MQ{=ps>lcxcmib<}-qr;lob47{g
zM<M>h2zDj@D7GX_ekC4e_S7C!i^J!IA1_uGx;OAT`1Ot-cxZO5vhSwI@0{Yb3v^eo
z@7*l9`Q}4m)<CYiwCyKwaw#l+w%hv4iq!Pu%-H@1k4)iJ4x`Eoah=_Qc87aT>b)GU
z9=i;WSw44u2`2Gg|1%}CVVUZTRG4vpvUoTCM|)4uiY)D%J>y_-mXo~k0tyvpmYX8}
zwqmxb%KePIQ5xa4S>b(HG0v4Q!~^)6m2d^?m2l<!SdUPdN-TggD$*JS?#$>PX9cel
zjt2CY+3z;m5LlLQ`9QNSXL8(&-duZLHV(>9-3hLh(`-tU?pVk${*Fk+to7l$K``s8
zhGEeDG^VMdMAH#v`b;X1qONu<_K{d1frmvjnT*7yp`y}JQ~eD=#TWS>(Ic(TiPVPa
ze_yBD;&Ex*(Z5+`9KTq(()99{+3)G%p7x<}B9+31tq8p`H7!Z%)WK)QWx|BZBivVm
zJr?=KTEo`*ANKqfda9e8sahW)tZ7*^#Qjj@Y1MY*0Y|d&57f6n8}syzI6bA8mAsE`
zl!IX>LPMSG0hJ7u<A+aEefnF6i}r)`<D;4e!jje5iEw<`4SxHVd`T;qab9jP4IXqn
z^O^h-_hINT$!ftQfgrQ;TD>?ne%$mc%(&otrcKMzY~4g9Qa_avsgH?v?S8hZq;r`l
zDa+JQj6OyxR~MkzY~KW~mT3=ADEg92-uX`XfO(@_#w{ap;J(~D(2t3|HiIF)h-r#~
zLQ=oH%58umAiSStn!F(UQ-nx)%5}+7rl|pv!Yq$Z(ZrQuu9-C&ZwK5B-kFOfTq(sT
zywmSH0tbO!BO~F5NdF99W}&W?>+75}*+9aF#5;Y%4nGm7JIX>4#N^j!HK%D(C5#YN
zmEA7=zNtZTlrQ}(RdtnsO4oj0t)6(X>>52f+~ahO2igid!ky`Uib)kUHaC{ON8?a;
z(R2}OP133649^+4rs}9vwbt0A#;CgdkOCApd4C>7mv>jIQqvR8U9S$zrJxwXb{r1O
z4NvldiD^xu;32tm>d_Iec5W?X>lWvA__UA4G0QA@k{eP9%9Yk+)>xYx^v*F#V2yVZ
zzV-P-j;|$JS=;+9VWSdLEwm)5SU*>EDp0yXC(yJ0L^|fGL+t9e5EY+*8)qB8HgP{B
zioTckrO0i<OE|s?x9T(Xoa|F?yr)rd=UWI&bK+$-996GPeP94=l0JK0r9Mwq!b*S`
zd}A)FsH9G&q;93;riWi#!k%iJsrw0E$)%Hc)eVvAm#-_sjy<l<mP*Q4=p#T-vV4a-
z-%Dwb4j+-tnyQtc+i*>3P?rD^#A*0wLC6_b>A^L8L>_DEw>VvUex(O<_+o?{Npa)4
zUk#KV_@M|8ew?XlIl5m0l_puqRjhk;{RE;?$k<XXsS8)e@Dcs0+{da)gO4aR7C!3w
z4MnAFaek1M4Ts^8YkbBmgc*@*bmJAmp3)5!5*N~JldIWL6vE^vG!$tHVF?r(th4pH
z9!5MJD2|hG&DYZ5110uPgrdGaXmmHyUF4!|EkH#Din6Qq$Cr@_*MncaK3H||{ebsm
zTK(Q$pLo-<p3_aX=<)X85hp!$L@@NtaV>~A(04C1a%ab}GSq+lG!1k2p!XN$&G9OP
zq&m#-_I)Ma&?o`k@+d**Ye169A)uSPSd^mi+fwk}WFE)329wQ}=GAgN_YI<)#Mpuc
zRNMCFmJEG_JK+S!sCp(Z%jd+bHCNjx)DqAA(53R-aKOO<DduzZ*@fsGNpMZpZ#ZYL
z{@mT3Uutr{6u<gve3Gs9tBwB=VOD0}W=m7yL8;TM+fa?8F`{%7VMf#XNlKkVr{I`B
zGkV`lh-gwG09F~@a6{#R8NQ9sFs8&$Z4_JWhp}HBO+|rM8s`Gk8!Lhr9-A>o*L(1l
zFMwv7t!HMFhKm_y9KZMCXeK`Vp<H>|z*1ZGf>Jcw&4$KE@X1JiO&Pt$wT>-viOqxx
z?2TarC8DIjmw986F3G~R)_%b4MwN9FlFCqm?cM07%m+4K;?(VwFz!j8gq~grlRHFx
zYeI^^vm+lmD;4Ks7}j1>QZX?9X#6^iSeTl&*$4@L8x@Z2HbNX1ZLXoiAcEBccT~`3
z5J4D{6dM0DA}08-c1S`c0_g0>yE-^uQ)04e3SA~&-NY(SsG#iTsune%Q4fY~71$@Q
z%WNcxJF{^{d(oMj2u0ZJes~uOB(b6tttQ0b$?^JDx&`s9v+_Fm3j1aZBG;2XGC5lF
z8mUdL7Cd^wia%&r`sj&b>)v|`5e(}W@s?sv?V>C=S6c#H^fc62nj@|}6w4@hY)-)3
zl%F+GWRoN_F#YoTkJXB|Q}&S>Aa#nH)wS5Wb8E$EQ}FyV-%0wQ<lx6`_iM@0Q3N{l
zU6xZl3hxMfh>VCPyVWJk8XicKJ0)X=W4cF~;qadZ6-rJg(wv24s7Nd}Z$D;H{obbM
z6r##Odh&j4=tzLYzG5&YDT(Tt9xTaNZp+BTl)|uA{(HXY_Y+O+gy$XF`Gh>?M~4Na
z5ti0O=nnP9LIa0gZF9={V%}!;H58lQ>xIutbp`FN5xT@#8BS7Pthve5xz#ySIn~O_
z72!OZ+|>kyO+HcMgbYIrirhbG3tK9&#}}wHRHJmI)uYD4MReA@)w!8$lzt{rsXe>K
zZAM(^Xd0FBheE^ImD@t3&~ZPCQi5Cqro@dTDZHT;MejzTw&Kj~4KKWr7KNgGN~zJO
z$-N^|_~r{X<rKq^K)CKMV^m5cYw9U^;YtlYqE>}lN<nE*m42uuRd=^FD#d{_^;Dv8
z<tstS?J!+Jdi;{<9$ivJ{N`)X*9dRnmz2fo5+>r8(8cQ#Hgm^3jeDq@Fq;@1RN3?6
z&(j$)OVefoPdhQS#x~78?^t=%IJ>6f^CHW@lGp5-O1N^vtuxGKY!=h@Ag5Ij=3rAK
zVv2t1F<)||;WaJEFQ)^Pzp+9c2Sxo8_9Cm@sgoDE4%-Uig88rrH%%#y6*>L%=VXzn
zs<=})l?;!2-gL}YDPC6%%P7Yy`_K8<s5-dWsB~6s6p8$OqK9%da^EYXD9jio%VwCQ
zLkQCG6pRE|6D(+H4ca2^E)|8{-7X5fD?}S=G)<Vp)xymTGADdNx@dp79i3RaSMu6{
zpp<;^2DY;&%tB!}ck4HwL?$6df=1GI-7v?56oJ9cbjHL_x5^*&H`?M*!^g>`^f%|{
z;;+^RrpQUkY`6W`iJab4N8M}u`G$RR8SlvykIP<@xNK}}#S<cp!XFzE`eo^wl9M5W
zt#nQrpDTp*h6wYjb1El?@GL)ZYJ48z(<98d=Z0T#lvRiDFMvhRruIm>xP9@DPORB0
zF<RE-Rz9;2nmh_k-Mt;ezA1MFCwcZw#m<Rvd{hhF*v$|j+7Ag5@=GXl<q^)TjI=K&
z+HfsS?a%w0yYxHKM+??L&*<wj@M?6ze|4y6b#)v>-tIcIZc^9F<BWw#-BEa!@#cu8
z`TNB1-i@S%+u^hUOK})E2i$=H?>7piLUC<hU2)ec88W!@IlPHwVz}4MA^ubGx791H
z#;*Ij1(tL#4;+4naR8bHs6UxYGkW9fKl}FwI^|MC-1JiMuYmE-cpCzub`?*Maw%uJ
zFD62@$V4)5MSkk-D<P!}CnkvkimU!)W+L9jh`RCshs;@iVuAiX9QWTD{+h;o_|!LW
zs~$(d_-B8gN4NOyXKb8nLDihl3N_&(K|)Ts`y2iiBwV?2g^(Di`{O`r#eqX$?8xDJ
zd=adH#}r93Be|kXQdcSNyJ!>Yun3Nog!A}?yui*W^zr=;ib~rX9^DOTxsh?FH*bH8
z(&~3bod+J`g^!JLt@%)_V1lUGPaAeCkW6I#7mjdOVz9M`V3tpGTQP6^WIy>n0ll{L
zNXk@Y0w+PPoT3swN=rVqyf(SG$I!5y_mPLE4c<MYtY!NT776Am<yhZJl$DqG6^9iq
zl?@3*#y%I{8l`TpD+3ob0&Vn)(PTUg@-iLaz423(PxMuD&@~y<%EA!~`!!1RA94f(
zjr58Gkeo(jmRwrxe7SR2#h-~ep5Tu65f{%esPWRPtrx%rQR(4LMYx|T7*u2&;BNWh
zP5rpzin>WR6T*FpiJKg5(J^UbeLtmFi=DgHfQ>b133JRAP9h$?)}Vtm7)8P%Bat-F
zb<Lg_>w)n|8uFN2gHf4V?@D2xe-tH>(sf@Qo?KNp@;ZvriArNchg%9z8oWvFx)613
zS1Kyyj&Q0R9jb8U8$JT1#@(i^H29KILnl*rcQPtPQzBJPp^%=LTm^|;2y-RZpdcuO
zwUTS>kVG59a4B57DZ^p<6dK7>^>J=SU)yhT{|+a5#rs?ACT!odc=G;H*Q%9nKr&ae
z<2@d=XM6i;e7NZ@<3cn&pG*Ve3WafL)R!j3GyGn6ZlF-%-`{qc5?6Y}N@zKlb{?u(
z9fmZ3B=dZ#*l(pYq>P9E41iK>xAU~*j5{yUk(dM73WUA4Vy#=?dt4)B5^KY|B+tw%
zWt~fpXKfRxTDhm##x^D2ft8M}Hy`I>X!WebUq8LE>{T6};8opy{xx(Jvm^e|N3)7D
zH&_nD*)rm^Ymro)Ivm%p7R71$z;Kq)QC$@ghx9;IA$!_{wRdvD%5~Q_Z@;m6bd`ly
zZRfQ0#P}7coM!ZdW~V8e20hohR?);Vqx2X*i@%Abd?a+G4N5sE=!N#~8JB4cI4b_q
z;UubfM6YFJ*qDPTb5s-pae7@lIYv-?xtwnt6<vkQbe&RT>ezS**pmh#Y&jDU!MZb1
zV_z687Bv&<Xp^G%C-2sFFJ$nwh;J@D=G*<+F@Fe8=+7^mfq(T7Ott4_<L0;{;L9PX
z7VtwJ&X;0z@V%0Vy4||Kwk|Zx1wW!x^3d<kLAn!rX-WY#nnNljJ~mj^*mer_w&qY`
z=w#;^7s+EM`kmKfGfH@EgPkQ<@8FybrZxeRpY}V-uj0L!1|KZ{bc%jyD!XUu+%1xH
zvm%C9YRaAv*CR7>e>#$RXQ(ao(6J{MR7|9#*sq!DT_OP$HCD(GVfDERB2RqQ92;b1
zNXp$!b>2WDPkzfuzf<;%BicgcXtj9@?~*Gigz%7RuLACwYB+ks%kWhK&s&`1n>qNQ
zDUToZPX-|Uho4l(EnoYvt2Y%m<#_s}cYSpNcj0CEpJ2Od@gA9phOSEAc2DIqhUfR%
zPEIv&*rkstTPK5w7lm1lk5swKkG>8)Ij&ODy7DvmA(7rLe?WOuWb}{&3e%w-yn1%D
zJl`4mdvyY1mw_(mcSg+3nmm>c@$fT^K>U#8*qZw$K2e|NJ3G#P%qpDGF_Q^T@9+J-
zO6$c;y4V)R5-np%v_~sQd{S!_ciK!;Yts>MUu5EYJqG=&Ae=v~0-u-|mgciFCL~mI
znK1*Ds|$M{M+)nZ-D}O5jYfT+EwKJ66=EbUxmxr^(ib=1M{kXZmgL?-K2!FamDQu+
zDpGg%UsgKGL*(u#zl!UwU0irup2LxQD--2(A8)+j@<0U!{W*AzCiOu5{<XTEfj-<f
z`Mp4L;=pq|{AGp0#_SoOZDYJU`&M%9^!NVTz0yuumb~?h`=@)LO|3g`C{s;s=*t((
zJqij|xqMJLLV@~_=4t+s_~Xi{(fozeGMjJpC#X5q8a&X>2}T4Lf_vDz5{iq9N`jqa
zj9?}$43tM8z~|&&LFOw|peCg=Xh9Fd5C`?HvCE2xh?@xM)`?<LI>+D=epN{)<cYDo
zCLfnJ?Bs|+F^thjto<;IFG(7E7*LCBUhDE%^>p$q!2mvAC*K5744h!K0w=gmc^hPA
zgn_rHK7mF|)Q!e41`O~CGYM#g!~+qu-rx-uSYs9KJq(Z<4r}zFXU70rSg9I?896XO
zH8v_R!3NQo$V7~RAq6IHv4ggD<lsAIKaib+8Z={h1@a<bjXdy&&|FR!ILI0bu0X#Q
zY|bDvH>`1z?Is3@!2<&&IrhNMJXDSH2qFy7ikG-?hf@FpoWDv13UiNwVf-+Vnr9fC
zfqwUSZiCMRU|2{oNsv{C9i^*CiN%Wl@`NxiEaltpyq`XS(`V>UT`d!loKafW>U-x%
zzxDVn`vmQ$iyqi*#o$Cvbh&*KR`iX{C1Fo9qW+zZqRrz!GV)oft9Pk?Chg!$#K)jP
zlph_*E@SU*QmIYIy=e41Km2uKjnh-gOm8K+kwH+UV*St{%(~1iO^=cAIw|4-SB1!0
zbyeT;8SdAXPMg+Gm2wImZjyXpogfRCvqg8Q6spEzUP%maN(k1tef2R0sEdSwAipZO
zjHCv)_*=o}!c>hf1PCxNBpUk!VHn`_ZDO#8^(q*Lw75{gA+i%wQV47nPQ?@z2X#ao
zFh#|{Mv-VtQ3)`?pB1za71I=l3wk<vxp+9j#f0F3KKDJ~;*xN|8*m8`xS%>*0vgsL
z6x4=GLW8<+NnyC4K3q~1E@%jsl7I`^!KI|&f(~#&N4TI997Kz<VT%$9dVy?W98{vB
z(7mY-mzO7Wa(6txN1?UN#Ktj2MH~6W*|AZg5|{U`tnB%EqLLTWp*2ON{$g6^9G#PZ
zmKQ_*#dP6f!hbP+xR}Ua%n&Yiu@oW1j+ofrJ_op%_+Jc?>wF=IiW6Myat&v=xDe`Z
z=PkJSC21G9_yuV~!MkwrOVVy|@xM|Cy2HgUNka;{B<%?oza;Hx=jG&n*U8!ETzSx9
zgn}16UM{z8LtU5hT&h{(uTXacy`Zx1UnacIwSB>(x2K(h6I|j_9v`^G<)Y_yfoyRx
z#}_VfxvU>t;!>gjxWwfuf#;?=pZA}NmxP`eDzMsw1H_lN2eTBYz!3RxQ1%+sr|=kb
zQ=|faDcuG2lwhC{41p56DV2iFN<178EiYt5H+!wKw6sNh`WW>h<%v$xHtXO771I;{
zC+zHX&i%9Ij&SEC1FhGc2Tf#D6^BdAY^e!Eb}`AGAFGz#^Ac&%ercnocw6E}@n+WK
z(>+=rO=xZj%;Gq><n&1mx<9m{s(<8LU20&eDpW`u<<rue3ioz4EZ!eX6#n{6GMOtc
zVe4R)&rd3pbe%~25i9lD5pQ6Gcx2H=z!oOGmm=C~{)k!m<u?SJfq>?tp8aOdYLrd8
zpAU00H>I~ymZAU^>)Y?V&&acMs~Vpc=<9iw%a?wu%15o*Sn`8ADpcSXB`UC77179f
zgAfC>zfRS7UAY?r+`LW&uB(BdkTUV*v&aY5Xj_0-sxYvQf&*OCa{$v+sT)o8A<s6Y
z1_O~Mx4;l}7^rGG2{LHH8l^0JA&0051K-;sM8qMF3n*D>vg0_wXXgg=Szjj&4}8EL
z8Ci`W`08m!7iqNWdF7f*W)Wizag8W&5=F`aId&?LLJJ1=TB?Fp+9ZupHjoz})S<?Z
z0LN_EQQArBq}N%AuOH_0(3VAsbgjvDR=l{q)meQV&o}&Z1@0*;`~Dt>fRE$1hly9S
z8JD{n;SOKMB+-Md@_k6f`67PP48Q)F5lZhKVI*dY%HWJ_Q5RXiB|fEN21`d5oXzU-
zvGJZ6xIg+_X8!SuCTAPDqOJ!U_^<0QOv3)W=;sgD>^ZicSjpf;I8epzhW}vG7ndm{
zZ#LZUs)%o#&%WwOy?;7(ee)+yGrR2Kg)oOY=gPQ)A(XMxg24fKH+E3Qkq}c@61-=|
zfs%2@MiO5S%2%Srx79n#yA^Jm@b=HFtc!jzTfeZ2{=~=TvB!U!whcB6_|khVPgo}O
z8%*o$<T+bMZhfgY@z#mX-xB)i9?Bdn_L}e6Bfl>*_lS@W!gi=dG)(C7sHW|@a7=wt
zC8`gEMv7*qcyYQW8sqS;iQ<j_8G7L+!O>?o$gz~w1mCvwE7O9Ko4B-!InGmTceum3
zo?O4NqxdP{VbPP7PlXfO>;82qwAuKrOR6Q?7CLP*T=I$IWn7evUH&>=EGca{+2uR(
z8odHHa1JW-;yYOmUA7MX5Iv(dq`c5UsUFGY?Q||Y0j7u$c#oa~m7)nrkALG(UfIf)
z0}GPAm^)$Q&+~xygB7=lf7QQqo0u%c*!xkMTm8L(ncl+L#NpdK-!qjAZ3D}hPXt?E
z|2Th+bOLMNThGW-#RzojVmHn^u6-bwom~y;>gi)t9#ZF<!EdY2rk5ZbV_yFbPjAEv
zLiE-=jcD!Xp3W9WDK7=-;Hc|x`)Oofp@1_v3Uebf;zWzhj(x`&qkHReKwI(Po#+pV
zctO@`#xA@<strO@8-vjzu7{PhlbZx_%VM3&-(DBJv>x;bshH~cab@A>%MwBM<<hp%
zieSb$FS9#E9qaT2>z2lT0i`{J`9?ksLKK+;xpcmmn#ZwX!UHMN4_ZwRzdz(EKmId|
zEaFH=mNKJa$*uT7w&Rr|^H_qRaqg4!>Y2h#=ab(!4o|#JF0^@FpStmZ6BPU3%aMR)
zA~fK0XE{tsVUWz95yW<(0NHODVu)S_IR?~!2020RyLR5U;evrqULJ5k4|k`(F%OC=
zg3cbkUgx1i(A&lTJbVZ`ox5*B$bAbc!v$5&y)G1qq{QHYzV41rUfvEKUQTeN5EK|M
zq8}0o(eQ*Lkq`wh=m(nZ3r7k=Eqk!#HaV5#UuXYMZdn+dx&0PX5()B)$2SVQreJ}t
z^28`*xa6hNSAk1jx_l`9Ub=jHJ1@B8rPFtWOI|vCC%Dvw(<l7PGhFI2uv~~Fbr~_w
zg_XJtXP)PBTtt)0s3di{l9$_gV24HsFVrA)xzt~+LBamwn!i!%T=a|Pd2m7sT`md9
zEOZ%1|2H*V2Dl5oBZdC1CNB>rnJ|HMvIrEv-ryrFB=N~hLUExm#CqNO6Zo`h3)+KQ
zn>hxbNp>kS{=sysWA|jzGyg&EvT(HBt?RJ#c$~(rW>2z-2kW*>KYOVw*X2ZY*rf*X
zko|rKWEKL5VrL^`x>@WN>i(tgbEMe6wpb0{4zA|>EW>W#LYS2?u6%OiG0`5fuXyUp
zSb79He=OG3>b`a4XiELY?v}C*9!sqgyDZ%Ufn~j_A+<Hp@!d|!A<K^YZF2;rc<RE!
zHz&DFSgT1T9P>LUvR|vDi|izw8A=-u_OzNfrcaMQA<jv4doq)JV~_R$dhZHq`45iZ
zRYSdt+gHRC23m3=^xnQC=@P=nexJufhr#ght-M|;=GG!^Rq$L6vvjdRh1zZUF@M|I
z7}fAr11fXJp$tP&!zwq*XLl3s+JC=!a>p|rxx?ByRo59rN}D4=sKe-RL7mBr1e}+{
zgTg#QT|`J<NLNTy6eHys=bL|Q`QaGkA{j)SnOM$Go@8Q}sl*KMQ8`>ssw$+Q9G>pO
z<V~=>0=UE}OL^{jw+gq80|A>?v@a;9o5L_ACBYps4#RHhE;#=6Ev;^ReEb(TZEVQ=
z(07#UX?NA}RUSssKmC~aj;R*Yn=G)fRe&CTgS%N<|6pIoflAr=r-{L%JW)rY$J#0J
zYR?qc^B!-Y$mUp9w3(VO)<9UmKqn;*6|sb2k}x6S>sxs}>?;OYb!1A6<9})m-&@}u
z+-ghEyDhaG_ofca=uv+1E}Z7TEn1ss!S@r+ol0*E-<ct_plqv6N*U$f_)}{M11roq
zl`eE4+=89*##x2%S<J=p=Rb9EC7S`$3~q)^#FmZW%#hW!A7)A}hpX!=M9&6xr{MxU
ziF7y@91>c=u!Nxl*F7`nIHBo|!%95sO=z>EzJm8z*1*W>)qS*E?nv1W%$X?Lelr7P
zJ*Txj{u(PfMbB`wXU)0LpNs%KdMc~6dyVF%?>hpDZm|#8GKDgAFlTd5lBc2bWOm&~
z-7$Ck>Bc{|c~W*a3^=!Eaz2s;akug5I<Ht8yQ*$W*Kvi7H70F#pt97xnB&tzCcm@t
zHQF>N-cM84h(t)p@A!XgYLMvR-Pm}W>ByezE#YnASG9Rx;0yDNRbaL;I^W28xzvGv
zQNgjt1h)aJ)|Rr`_tvg<ts1YiTzhii!QE$XtOYFB+)J|>4Ko{!Up}axUHk1FJn`p*
z*6Xpw!ug)w+sDhv4s>-Q1ZS+Mp~KvHG}G5iypF`5U4vQL7H?~N<t3`j@1M=q53Uyp
zhhR7mi)lYI9C-Yq*u%_jx3af1UUl%6X-(pY<($<%<4(Yem`}+x>6ll&B<-zToaB!%
z=Q5|MZ#n*~M8ntO8T~L`#i$;jeUIoT^7rd-B9c7GS6p84ODj#(xl)8H*6`W9j7A0C
zAVMeZ(r?*ieF?JTvl@`JeausMjsJn^fHY^lMvF#;I0u4_`?R!X$ihT*7B}uqQcRxD
z<3Dk_`lU~W)*o^Qxu!%$B7QbddSoXa;WX;1Yy|r#yIduasm}4<RuvSY_Lef}A*vau
znrSVX$QG+3|Mfm0F}P@ol8&ZnK8px-A7}}pNOXB%Y3W<s9IaWMO}eJ{=tQrKjZpv(
z<7M^aTk7>!UYR$-%_k!|*Oy#xJJ>trGiW=ynFGA9<8^T;NQoG2ZsWX*Fs2H)wijyF
zD8eYdn5BCsy=yhO8TmV!;wIjek}8bA1A=>U?`gVTaNUTCctMdS6!~drP^DQplB6tD
zVLD`Cd5gu8tBBy@UcGN4h0@kjcgI%5e|dQIG(34aKH^XdwkmXt7JC+`GF0e9G-Nx$
zgWF9b`=NfMu6m~=BcAzp5KeZlb*vM|la@1w<m?eg)|T$32L#?+G<g}XRZ_cBJQ4(_
znS!l5HZ{2K={=XcPAfA;ver?*68JQrPDG2A%de1NxGor$Qoy-!qaO7tdG;;Y1aFaU
zwm%1hYd2;f>l*OFjNya&Q>8ZyWkeN)>hCGUYP)ydV2M7=CLm@Dic>Ajd6VF<k;z7+
zI8FCH^8Ul#_}GGR{&Lou2b;1PCSB1sqm)wqs#l(k{LF0{S$<FM)-EP3cp&{zj_Yhq
zwWB6~{e*0s$Kuz;eF{1|k%8^D=ev4@MdBa@<hKB{p(4QmtAoN5E#^;Xi3rY6+t}5L
zKDFDhZdfjZHBKMBv5REE2<FYPMnCSmv3NHSvAAUc`ZvvU>vwhU%^#5e46(6xKHI}G
zA$z{n_x1$G@(Vi;q;D7~Ye$T)<>Y?L=QdmndL-B-L@qtBgr1PFxSkNQL03pzR8I}L
zf=Ljb*=8x!%_u}v%oj`aj1{j&AognHRT4n)CK>hxu?;(7P*xcqQ&<XAM6jduU%KHS
ziPz<DX#K-}HOq|>MZgBn+|+FJ^=_%dc&u*r-;lAUDO0QR37+0|z$ZI>7}u)j!*0+1
z&hga_v&&%ZqkWaH!P~{c4|!<~^-kvUT6!OvN*^nI+>H2&zu0SrvYDO`v+FM(eo`-{
z$7SoQJ4Bu@B@vHfgl+TTDS;!15_j(7{e=!)SiX}<Ep_`RZsU#|AK{PMXzgh#P0|qD
z^xoWY(pO5?s5TtPncjC@PnVn$FS*MfiB&0pizEA_pm;@eN=a=?^J_%REAI659Yb+}
zp&lx;`j){BQI|I(&uCk=U3m~uPf3K!sBK#U)V#lpd)|3UlvwXOdKE*7^p;v%QSl$;
zAC|>eA8}hHnoI~5S`j^M_Eye|5w=#6_)6n9w-_EIIaL?RS&Qcq^}IuHk9-D7|D91C
z2n%?GSC1O`6pY%`r3O)7=ypsF2ENi0RF=HkzrYo*FM0ADqe}AaJh(Z5%~wS}<r+;!
zET8tFYyOCJpI(T{oT8LlqW<w4jVYg$fRoakH(N2mLU%`(o~`5jKBCvZps0tWg7%!@
ziU^c}W&<PS1`l~8BaT1Gj~45D?0BKwIKIsgyWZu%$TR2EY}y7(i#O90e*42S5NO<E
z%E#<4YWzzq!O`V@$Jjov@|3#a?Eto?o%avE|7y#9@j~{OxK;m%JcjfLUwsKT61j2>
z2Xl`<S%BtgcN{2oC2)x(OW48(Cp#wn(*a8FSbR4ilo@MLRN0Xza7{;Uzshe4%gRxQ
z?N0R|{#!a&bZcUtRNRM=W<7@#T;to%z(-jR>`aR!f}gzP@NIq><J~?fGWF-p!3@51
zTZV1i16;OFDlOuV^}L^c_}T5vYj-hO;xypiF|_Zj*!`I;qGsCoh$71OjFuU>7ZN9q
zO1e5W_gfhw*jbVg-)A`bNPENU{^XjT4^xSdZadHXM+&a{!ZE@NLZu<@ACpLO%t>7O
zZMC2FkltetlHqA?z0v?{8Zg&k`iY<GFOu$!HTxv%W!4Ju+Hw4;tpC;ob@ykiZyK3Z
zE7*cv7+~(1Y8{u#f#^UgMQvhQ=^wk%X0<gYYMHRPBr};j6N8xN1Y_o+U*2ndlk{m=
zp!1HfTG&cxbS8TK5ySlB)<B__#{%iMbo{RYh5OZE%KF#R9(t_j^em!JdOF@iX61qs
zhzRn(&+tEX4l$e{4=*!TEy>b_-Jv`rbTWsYbxq}wZh|go%QE(|^gVtJBbQIUexTZ6
z=SN>SE)#RGu8GnZ@n$`heB3(u9jy+Y1j*G=gi5ZN=9QV|I`cV?X?H|z><9Kkyb^LI
z-E+#+=R5K9)Y*B8?9!<Si=MCaA1;0B+@%w8y9V4;)g#SC+c->s++2J#vt1jBiEZ1v
zp-Jfjb4PW~6Q75-{}i~_QP<tG<+7t`&6@2o_vE}4o3Gny-Uo{dFnr{&bzn!<z0KDX
zpK2S;tr9E!#s4kw;up5TOsp@Avzj-Ozu4=?aDHI57=8FKUK#b~_3xKMlN}l^?(Sj_
zy+i|UTUtL!XEdmNB-A^+vT69CLQl;yN0eo>CdjKzy5J|FPOk}joa}TH>_@uGl{%M!
zr0-?dHLoQPrNUAowXUjO(M)^GjQpk;oMB9Nb@A44a;t^hCfTIm7B4!|^5iRyJPMEq
zvONChZ3hvCBpA+5^*6JPQr6X^yv~Y08$_5GMvgr?p;MYLb>hL0m-}6biXeYLpDOLi
zpbU+_VV<{W^mTdmYcc$GtOazRGI!~?8+<x4yK%!7j_9npzGOyBe*te7*o(cslTaTS
zG=JNrx~j$Vk;AGje9-*3F;B_(4FN(&qVR@|PixRYZaYq(JeINeIP2CYuAXCxhpx-T
zl*UzdTy+U+W>M9~p+T*0f?joSia^CL$ez$938_p4)<fr=6!k>M^J706W?8_YLbf)j
zUr9T2xOfm*Wo{b&kTs%9)5=iGpo6bCwb8KS=b)8-=*r@aC%ju+dm6?Xfoe4=trlLf
zukxlj1GLx%nT7puZ60sQCEx0l`_fUG{*W^5fp5l<;!iErdxnf=^_FurH(aK$B@}6o
zdT5cit*8=E^m5hXTBk*#c5<W)TX*(21+VZ1YQ0>G^c~PDu9m~@5g^$j6qTMs9!PqN
z7DZOH5#U(xNRB^m$ybw|cyHm0_h$Xjp?)=e`b9)T%_k{`@}&n;Y0-U+44H#m_<aWC
z*+ukvnXlEo>#da?nyVfN(70uRJ4A2XV!X{11;^GKb%@zw+#RaQ$Lwa_G&4D8e&5&U
zgAy6{-*OY(e;1pP7qikJr>R-qk~4wgHoea7&?O_mSF}XLSVkZ8xojiRr@L|S=3(HO
zJn9U~oi*qu*nJNMJ3o#79}kNJxZ}gFd>Mfo0m^48U;l9gx~O{KP(d}15x$XdK6Vk2
zf**_m*F_wJ-0bmFkw~nDuun_GaTiIsY*H#1v;-F>^dFrapNpIgmLg<4Z$bg`@?*cz
z07hjqj>E;T-I7EM#M*jBt?7d)8ppaB`}{Im^1tG#8hHNb7(4HJE4QV_-Y7F{jbi@7
zUpu^o&Hh><_topCoE-u(@=v6wZ`M<%ti2y|OM$zjV+W`zNHgKgDtmz2?9Q4I0=Mt^
zuiM8CA@5Z`KnY3Sq){wA+F*F7&2@ah#QtuPjfC1~0QT|E7nP3-#UCPnhbKJZsky^8
z`?FqsC!9iz?*|E8@k869fJ*Ax7%l=+R`J40w`-2Wy(#T=9By+5{%mX&c|+}vK}5E_
zx^4_DdOQfWy^y@AUm?dmscAVwnOjvZM|M~i!S4$2j7K!qGoR;64&=J*El0P^jC}in
zB{uX-H$>_?|0EI9r$5<;Wsh;Df6U(K9qq)b+a%AY23gB(Bn#x0e_8UY-gOY)LGkdf
zual_+2j4k2960Ag1(h`rWamyctQU42N`o?0V(DCrjmc4Ah=88-2<T|xb$+xsfmy;u
zRBZ3&ulWjF6(24dH_R%tG25^jFnz3k)-HS3_LJ6h#`DZs`}-#@>bFK*%<PckUP#R8
ziI~!GDc<Xw3G>v2tI6VlpCVSL)74Q8MbkL97{9(QW&QX|2)#Q0s-@kqfYW{9yENaZ
zWzo~wQY!^X-iKAMVo>~#4&Ta6lgv)zuSS$clU+e-xYXk&^s`*O<^JV>yl3*8DZADc
zQ(xCFH$HGgD3nT<v#uA!^w-Px50UFB*HVXuB=2+F(;xfsqjk{M_Z_BhHmwM$f_c2>
z{0~dpbn161h7FQebF%dvxrJeh)<gm;&m3(sSUTfFnCyI`uf_p49}UhAFbs2Y%h&{K
zfVrs#qZk7zoRYCc0ZPJycbrT}?vI}~_vN8qpBB;<FZ3ku&E4$Gc6aSQ)bJaoQlGz~
zjxgg8{DG#=KbT+Wq@@c3lSimQ`C@#~3`vA3EOuTVgpx3A_n=hl@N>e{u6%vDwH?X2
zlba;F0@DZ;Ohs~DB);^KrW<B&hI}A#|IXpamF_J}JFBnha>h4ri|#XKN{(QqCr&wp
ze1_epZk3oLmCcs0mTi;$oFvrX4sYS&pqR%u;+Skn>CRRZn@gaKzF)+r!cVP?SA&;E
z`{u0N2Sx7Ts3GtxE%B;zqRwLmL!#GPp2srw*veh)AI5xY^lr0*vrWTg<LWZcOU8?x
ze1y|<Vl-hs3o3^q=#|#a24;gtk@AxX5(yj!3C?6s>Rrd0PgI3_2m3ht-`X4eeA|`z
zGFI4|2~U6S;~|ddn$f`(o6*s|KV)V?7PjY+1$=#v99(*a4-)VYVTlNd|J`#-CH4vt
zZ~P(*wZ+&;DLZtexC^46%UpjQtvKZEc{@NG<hi=4YBm0RL+E(YuA^@%W%MU+A8;gP
ze}&R@mmXJ^@AVJ|<F_0uo8IP4hC^rns@gYuO+@YAKT(sB`{|7nyE-Jya(r3R&RP0l
z5JY;FGS#o2!%--EowcWlH0nF*^Zv#jJt{K3IpU?0->uBX)4048*_?72ghM<gNief<
zKUUPKlTyq__eX*EI4vuRwV!%7hb;%F7#ARyHOVa8$R)>;ekI!W7di@Ii%HOE(>2NE
zvsSm=**TE!z3)r=>SlDP2u8-u`IJ_H1s^!cdhX!6C9N2hmS<JHOE@XrNDz&$Ab)kL
zdGko|nr_0?uIh2%_<O7uo+pbI_7LE>sFo^H{N(<(TO>96XLykD$)P|;1<Dy+WM!#U
zG*rzswXfcAa<wz|HL!E{*7k7s0GICbV+u*0=W0d&<pe@O6%ThGB_$7kxCNYF3@Y34
zi$Iky38dtCa#0dA_7}lK3SDM*>ER+!sufCOIykxez(t|5rRQB=Z@4Iwr@bBEdE3by
z4({Bd#~=iWZ}XW5I(XdmfNFWr71z%TbN`&#l@uowG`>h=LZw0^^cJY#z4J`2pf}u#
z5X#yLnz%Un-1deh{7uFFXCfD3rT#t*=q^Sh|1ZUXlE-)LZh6B+ME)zmuDO_?#G&-*
zKhyrl9?$|RS_=P9e4z~MzoCQrcZ2`;*uN+Cf6xDS0$k9#kpJIu`2R-qzsnfvUvc=~
zCHCK-h59$P`M)LqpJ(j<r~Utxgy((#ZN~nU{r}s<{>6RtU(x!P_WvK3^8cH${|Eb9
zod>J)oh}mj&wJkMkkh&>!YD)NWz|RJ!j)arX|y5qvi<}4Ipk#l=&wgaA}>lZgo3DZ
z-}l$UT^5s&klVeu-r2?PeDJaebWvME3SZWME?q5B_<{pML3bCZ+JqGTr_vKr__74_
z4_AF&8@r%;S%N|epL2wQ-qg5o;7H+1j_yHpE*XOAYQq1hNI~d7%27^!ke5e_T(WXr
zzC(&!YT~j~C30Dk^11Eh1n~v^<^De_S0a~e{4Gskiim-yA&d-2xaeg`Ohp7Pc{yK2
z7;^toph&1Vm=sC~dWSN>gakyONaJ7!zd+98grW$j8%j?h096n#y2a1kxuBvb)XUzO
z6)KN`g5IowlmT6L!Gt=b2a!uz)gc`~;q0<s94>MxtvaLukxOyaAr**T%Bl|OK=e{n
zsMG@&y_8cOk{=3%7j#sR{Qnt$`IS8Gg6k+k)CDmp9{rz#j{IJ?p?6LGarcP)^R;d+
z?oecvx}XbP`oE3&y1NJqL6u9S(4{*6)vy#a{8wslFif5Vio$9aMOL`5h(rcP9R@ot
z63&fAqcikqFdU$qN_VLkDpOmhSBN}1-=Ww~l{8EvvAak=vK6M;xZa>jNSVOQo+b$_
zOzK;)$L>F_Ah8!_j@mWWlYg5n?aL{Gn<z@O=qPMy^pPcWSu~@sBX#%@qO?uq;a4kv
zo%m;V83si!>-g#3zTB=@8fm8&$+~YRK~qIK8qp@TGjKYSuhL6ajJi$vks9&)2G+uN
zca)fHdWT;^1<zP1{kEbY`k;O#qOIE2-P+PKi|EU&wECt<x#Y>mpOPaoSe1<o7F}Q8
zGeq4zm`1s0U@eGp|74*z<w{_&bK}cDh7rl{X}&~kQsJ~eXe8-(SG=3kq2d-EU0&UZ
zG20{HVDrVHK_=P0{Ek~kY7ohS)Z5ynRXviW;p)nLJffH}OV}tGf9UQUX=^R^$p@b7
zHvWP~*DNN~qU&&dhMxXuR~pNsy~jr^9R+U^>I-CEgyqfE;)44&OU6&dP7QttdS1OH
zxqci0)9y`&&3`-0TsYPIL6z8NpMfET0i(XS8_yk#h`7Xm_?q)qH-t&g_geqnW`*Hw
zAZ|4kDpS!FvYT=zf8+}TGF{KaWaUD6{qzN+VdnDe2qLq6I@bY=94lfYBiIHfl0zW(
z;j`4!v>k^t|A(?4@jqW9QK|6GF$$Fm9(56TV8niO+gr!m?aJFyPi@F>^ZG@lb@v{A
zHE8w8X&dH$dJOw$(Y?9Nk(o_(|6o*}o}@DwRir*`lKPF^YNz1W;pDGoOV{S8D~R8w
zCa<QJJ45&(tFdQh)5_?0E53Sy7<?o&e(ROl!Ln!175}7r_ZZ(P_1e~0Tr=yVoS;ds
z*P&79S)iBSL(l|&ZEpxm4h{!w`ewfVdV)B7!P1OFNYwTlu&^twclCTpuTyOLJIi%N
z9u+C0vnS#o`X1}Z>xB1DcZ8ED?dxBm3Hh?maTl(3hx|x+J16OXb<E(Y5;Iv(Fl$}4
z;@97MY>7QfMDPJv%=GATMh|$>ZI5U)2Ye)S1<TQ0?M<s2Yef2@Bn<ldI-ULdZ_$I3
z4F>(@)3oLm?#BO-8*{rb8TkGl4$(jMjw0exphmImfBnFn8?WLm6)IiZJyM8VMS)Ds
z2ahW*@F5?YSpQH8qMz+0GuAI`A3Xw^w}wg5uZQBuPp{L45@GL&E>CwycC*vILM|s#
z+0l3v8j%$27&7|f`7Okcu1DtOR<Sr*{OEXf7Uny%Ctd!_De^%fX5FDtu=Q4~rg6=P
zb@5H(nMz-eG`ZTwhC0-MU*Xlt4KA@7xwI!QKer4&`szGmV6cb0Gbu8&qSc9cv~Ls~
zE^rDP-M-gJJD|4{oAtP?Aj{UF6!qLK-1~vYuIRxr{(`gK-j2<@^WDxruXaumSyLfW
zchhtoDhFqKqpCzc<@I`3RE$+t(@ahUxH&fN(MRM@b>V&$P?x@ss$~m1d(C}D-SFJ;
z=l*wcAH64Bi{(-C0=zNWX9+I~$O4<f?Awj}SWiBYh*|E^wCw4Wzy;qvD?_L~T!=G|
zTB+l7rAX<`DpOV?y;DTPDpmF1Uw5vs2o96IYq)#sf43eudJmWA-1T2Pgc3sF`m=vw
zJPwqY2q8Bb2S7gp&}b`kDS&Q(kbX2;9*uTGe*n-$0J;J|b3mOT=sgG;q0tY~=m~Tr
zfW8BuEqS1>CiDz|?t_p+G&&Bw1E3E8bQ6FkhI-b~=qNNJfVKtDqfit2@S^1*WD1=D
zplbni2?{`mKy78T1%PIS5Os7Xfc^*}Cup=88r_RFfN)H79DsHP(AE%s4~>>aTe?G7
z4mt~hxad~^8V^D;(db3=4G6JxM}G&<TmV`MKzl=NZL~iGNzw5D`Zj>}1kmD8lOD|n
zpf>?DY7jshL+xcWx)pr_pv?fZ9@I=lV*+OYa0&qEXsB6r3;+iJun#rSojd1{c@qFO
z0N^_StU=8ezzP6-27pBXn1h-+0QxyFb3RRP3WDnpQt$x)#sOdyYRUp55bOtr0H7a$
z<VTmGgMhyC*_1u!kfsv=+98A%cmcuBz;g&z0nO(_Z0LNT0RU<t90^ndKm~*x17#3g
z07@Vz3KRiA0ffMSTmZ;|5VUV51apBj0003X3Bpr=M*xs;J`{#VJE7vvG0tcRrU8)v
z5C$O*KqvqN0f0XM_yK@70C)m``}wq2cL2Zz0GuHlGJp!;004FnP6=3_k0x21Ljf}g
zt^mdWV0hlN(>sTIIsl+`jwq@_a12lZfEy4Z2q>ZeKmh<`p@t@ao&%%+Kmx*(ps6mR
z0Dy#Wbg>`=eIZ1g4?;!&-t$gju5%cG4g)v<fbAR~W;usji~v9nAzuMn2zCS106+;L
zEC3k<>7fa0=rah`q0zHwMF6di3pGa3WEo_Q7`B)q5@2CCRmPb!1}TU!4nt)HSsG2Y
z^h?;uPY4_0>)yK)|KLGU3I}%lW2K1~-$*_$5hbY>6cDg!$ZG`aN8lH!A;|rsQnTZa
z)b^s|$i|~0d2aZVc}>LMDf_nOt)TERGhb?ILFVS+<b(FLt^DRg`)cIZ`|qUQFnYU-
zqRYQ!*n}RhuH~c7jyLCDDx4jmmLH=`_It?`PPhLYE}{<S?=KobpOD&bi_}IYCML^w
zjEpA5D48oNDtc@xDl2!$uXL+gQU}#-->;dqJkt33T`U*xEHdFNf=KL~<b99Djz^l!
zY;=n2wN@`<5>&>|xcgg%=$yTLeSLrZoPB<;`|!sPS65;3jz0&p9-XM;uM97ics)P6
z2LuEhM-$O%K%aLxQr^#si&rqee`>yiGUz+vIV#*DhFJLFfooJkGp{W29=Fga-oUb>
z(Aj`N(E64C(e~%wl#g-!Ew5g^%IV~6NXy8u=?Fd+wkjZ^6?k7sD+sj`efGbNVd0T7
zO8Rdvb@#@S<xAfCg2L_^&6QF0=w&wVxAYV|Wyn$VU;Xkr;hTVe;p4T@e1*}#<c>TA
z6mv&_VB`NH?XAP2e%}3mKtNJK8blgtkdzdV?(XhdN<ez)?(R;dV`)K9kdzj71w=wg
z6_6D8&H6s)bI$o*pWk(z@AbX^*lUS>?Q7<qx#ymFK4xC`p1s%xnEYe);NJ`S=7nN@
zM=Z4!6%{2VC6cqj>?4a$?L1?Th`A;rtYoKI)8Ld`?}0@|M)th?v09i9thl%zyzRR>
z`>_W7`9-Qz_$Bo4;Y5qi>&lIkiDD7&U39YE0*$@zGvx}xKTS<cCj7gbnh1i=STDcE
zbH7>YdC6^hN=i&zl9+Z{@X&Z8XB1hQke3&G1e8iN_aBKVkbOtNjsjP|@7&{aprj5A
zS)Zz^lM@pYfA(8HN+9|IghGc%;h$$MtJQV_#h@Nv(Rpzml`*GeU;AGQX<1s*-I3m9
zWnua75!mG9O6B)-b%_h~Ny*o<b936jI$T%c`W4_-8`KDH;u&WQ{*R?WSEtxyVj0E7
zxB3q-*g9bl1k7V&IPn)S4-XHT;PdrpnxK;zd1IK%a<lbFQbEDP-q>w2GBO%H=m?%S
z4Ff9&2cvqzmq!1vxzC?J7l6N?W9r!1ZBG@7zH~*vAh@5ZRPzOy7#T~L95e$1|Ab-S
zk}4RbJw*J`lSt<S_M+4C#fz6Ob~;B#N2Th9Ccy^{F==PdRs(+YO;2l>d<CZ0Xm<T;
zga%qrRCKS^;qpz;l|hjvblS)hUmg3xi95sDy)@ZE`u^ckvo-ii1k81%o22#$D=T)9
zpzG&O|KGa{*x1;e?|@5X<>ku-G=Uv&Pv(ohJTy@pXBzR*cP<*O1=fZ)ghvr!c^JnO
zc5>p?DMhNFq+|qYtvdqP`T6-zV4%sA7`EDBU_vo5qd*Ihm6a{M|KP!cX|~=z=TBTl
zGv0Aw52x;~ZAQkSNhucKE5`f@hrEv?VF%^N;xKGs6cO?N1)6CnIVGit^J1MLWuhFP
z^>D&SGR?EBHqnHaF3-NwTZa$^rf7d=5|T7&cUqXORL&lB_w{{BV0rQ(mBA4hpWOsB
zhmf2+M#7-Q20JetLztB{w&bOzsxmf8%)2O*&uxx#a<d|tU&w}^n&GacF)0%i;gWJl
zaz{r+P2~%@Ju>14-^n1K^zh<K_<f1*^R;uG!10Q3PEVH(^7krc;A`1<L&JFK=t3z3
zzvJXa@AqFF_WT&+VM620%gM>X8iIlwE)oXa3V4YT?*vb(95Ek@H5xX1FRyeSQT9{N
zv@DZD#us;RXlN#38W^a!<yQNT;4@W?z~X_;mZ-VCx!BGJO>W3kv1iJ6L{J3O539b3
z$wSCW&UdP=Fshd1X_OSX@-EQ*#A%tCnUfw1KYdzq-wyh*i2C8fhY1972_TN-=vm(R
zMNUJLyeK0p%lRelYZ&3VURf)XSa?|2G@ixf<>i}GxN~DyXD6*ez}evnVsMZiT&$|N
z?B%N8H)=&H?h&6_&56w>U_XDl<6OA&a&(qIBcL}KfE5?hSZD;Y`EaJ-J(37~YB!Pd
zWO8y6I=L~DEFY(!tb7dYIUzMMF}gcBy+d6vyI$RZycaX7M@os`@ixYbW^b><&s{ap
znYrNLV1v)KtOk3?TUc6Jdg{G9Ukesh9I$zAWm78>)2y!=z)cJc3`jcRE|bZ;bbl*#
zw<`o<Y;2rC#N%RVnVOcCb_613v<($BE+z&AYHeL!UtiC86y4a!oiN~PU_fsCEtAuc
z{}MpFIh6&V!Z((eO*VTf<)$4h?)zY;=7q@!d++MBfx<I0)6=8HOab%p@d-HHUuJMj
z^mPdWcHNm_U@=Go-Vsu^WzlJ1AZp@R4J>_A%AmSlTVt8*tgNiid%z5CW@l%o)v>z1
ze6gqtY<o^5LZr5yXr-C*_09Wd>u;;V!|&vU_NM0KDC9)nqZT11BqUtl-xqV7tx){P
z&IT;4&BW7%reizT#o5_;@9Wnv+@J`SJCa_P(x<6e7Pp}3D@e0Qf&g3yVoM5!MIiX(
z`S<;OysywF*25;<UONx6`qc_WN{gZ{a{27h^7K@*C^I(g17y^H7H4Heb*%SmSE~(#
zPiABg^M{XF4n~-Zii-A>m6d%`6e3nMA`^zufcEa{;^HFHOElUSaOQv9sKDd(6dRGv
zWh!k%uTsIxNblP7eK?T{3?D@a6+E7s3ZK0_J)wgy9MqJQaPTw-(fI4vITRlXdq#w4
zSc=wECdU+2l|2Ohk*r26FP9EIR>|S9yg1r21)*KU>Rk*WRFe@|)z!PP6ikAHLp#d-
z!Pgr23}Ou?U4uSaz#9YM*Tx;LoM7w|mLMe|dHcGsklNV)>i1qWh9;I}oO}iPAhaS_
zm7j$lbw$u_f*e*MA}rkOy*f4Jx(Px=rbNHT-eSEmgIod+h_U0qu5?l>+Ec7WS6S?i
zd}W&k@5x_qGNP@YFd^H30%k^DQ;WpypW~)y?q3E%Gw^<<KIYixo~ek5!8#!!498u*
zn**BckUTCfZo4_PCbu~qR0iIGmg-N%&fY!<#;7{z?F|JmD&oXP;{I(FOry<-4qJR(
zz%HgspL<!Bkx;={4I&TNc}6ip(6!FNjSY=}LcYD&98FKHo92D|`0*0DBB;?<_BK%X
zpRywIXTf5^HdfIlN@T6f`^&A-bZm!iv;u67j_8$@3DATDycaKy+nql(9MpVRU0pSs
zeZ;%kOwI2wO$$yG98{3Q5VW`dCT>%lB(6bt%tEo$?yMh5JWfeyJ*ge?c;i4S9J6%!
z`$X{dWhrH)H}RL4?d@&5!&X@zleXe{DV@(98G|GwB-fb=7@t5g^9jDRgd7GY^dm&m
zvKU8vpjzz3qaWD=G!3NF3ChHjMkV0!@H5a%B#A$x%#Dx7TLxe5R9`FF+1dG8fI4k_
zVU=RhUPaB#S>_^Mx$$UM-GMjzYta@%)c36|T`(j``Ni@;KsyBE=;vUq`EvQ>N6pR6
zoeYj=ADRm-i1{wOgKw~CU3=blTG4c2u|lJNe!wRfC3*f(+}{h6m7Dt`@N)bsJKtO$
zOSB`Dm|FJ|t;j{c>Qn~#K_RAR5B}i1u}tqKjoEB^j_is)`%B1?nU0Q5GVto4W9@KA
zS5Gf0zM{~j*ZPXg)>4Lcpay<7vMPH(58PS<IsKZB6tx0yu&)}btD*k_9h5_7`MVK^
zA90o#qj7;}|3JBfZPCQ!q~@Lb<UAGwe=d%Z32U~swe?#8n-3{;`dw-1>7VKhTjgf&
zWmr4g5%URib8|PAm4#7kaV=3BJ@=TF!d8gJeO=Jk*Vjc4SM}MSF1=$`{wg=Pa3B)L
zQ3OraFFwBMdF4$-(!7TP7gXbf{_*nCQVC|&LVFc3kjo5QUG6pZpPrnUDEKR<R&1qN
z=g;KXd){R#=V_jQp8ARrJzz+3(>p}T;Z6g!s80p`9ij+k9F}R<7cX8c>Qf22eAu|J
z`8MAEONtnlnZ_NEMABU8Ny|{Ew4-ZjdwRB1S66?-<?j6{{cWlc3gT{kwR*8c5J+J=
z6^s}jA=>}oJzzXNJ(U)FkgrgN9$#~TxlpA_)w|LUg~DXCABKhH;ah`N=28o~2!G_Z
zk>wir2~#lX?)%~4VYFsYh`PGE1U-H9y}?M_(53nL`OV#3q^p|UdVdX5X;-OW0~kJ~
zjZqj@4-I0D2JKO!b=~CI7Qy`&-?q0;kA9@)=TmXGEH#DNiZh9}r+_pd>i1X(>Kz06
zG837*<sT&4L@~%lUTdDd=8OS3Kbf9>Mb*w+bx(J9_nX_Bs~_sQytdbuzxSSjSnv^y
z@McCvMr_Df1^j3Yz1(@csDMK#kniq!28BsA^E`NS3NrIk&}u^zB5ByqYnF)AjuuL>
z@1T@j!wDJ=<ABf8Lw&zZQ4>c+2nT|i!r3C0?ghi*Br;K>7V~un(GK=ET0lUw06sjp
zI@t*aa<6WDbyU`84L!ZZqWCvi6vX?#!8Z|qkoY5mQ6r+LssP0ex;zPWL>rVlKqi|5
zRbN(qot(Tgr8P1(c3bWB<KqFFX>&$|x4*m%zbh{%Cue7GZ)|92sA$x_xdemf27<Kk
zHSy&Kv`dKV+MB)<`UVNj!8@NHNu9aBcwv1JL*Pg~f+y`%k}=&E@UkGvDqD%<PKdki
z&jI;>#r1}U1}ICoK8V+8Jo1T@ks?-2VSbk<J9C-9z<dcL^8MV%Y7+;>%KT-B79AWt
zQPFt;Nu_&h=IO~BhE6OXAn=7=iw@h$gFyvHFG|tZ0s-#Y$3wEh^dUhlF)0rN14FU@
zZf$i_H_Z9dVXl3V-}bV7anRz}*eeh>p(~8_MW7^8xh@b0MD_7b%~SAQzv;ddsC_o)
zsp*(6v&RSssjj@|BK?d0&!Y~zNlLLE_w_+!Wfe`yj<cTDNmhtEuYqiuEu-Abf2T5=
zo`C@w8u&#;uQK(`{4jF#^z;saDX7m?sUDx5on^QAr&%LJ>^;G30-BzNZZw}8Khz|u
zld1M;&aS;q*9x}kzsCvdyidU^bM8iV66)R}^R4{pL+>r4E>ET@g-`=y<MGq_%F0Tj
z$7%&jAg|>D^%W5tcMekb5woD*x)oKHama*Sd6x3mQqoqK=DFrJjJ7-Wz1q)@W||#1
zlnsyR%p6AVJk5l@GO%GKEVGZ`)56gUH0=)#0@c7tN68Y2JvTD)O*gH-|MnsBrA#)S
zR1wZB3>$uuUagYLixIyBGMLdDgK%lvxVsLMSK|I_B^DnR7Dz5oTmt=uNeo}r)+)M3
zozjUfEH2KzqFj!Q*VDHt0n;B#Z&R2Hh2Em=corvAdvQ4{5(Yd0LNvZo5@aub6xn>^
zIlqGbW64iTi*g$2U}sL!c*1g3si9%s@UfWj2z@SuQq+e-*|x1)J8JL_Dk|y;(cRz_
zn-~z3#Z}>Nf&xIDXC)^me+0K3gWC;8)u79$WDrU#EAV*^oBKf5QRT2{Z*Pb4I5kb~
zPyN~$abD=ICG{~cmrE>59+W+25T|`=<LawkJ~zX@iQ32#&6A1-0htFJvi62Lo?}rf
za%UXm?I^#%ZGNg&&5sg|F%8Q?#*`7`3l%O-PEOfh%P@%XqDDJ9v(syh*V5dz{O2!m
zKH|Lbh(E(TMtSq$gMy1C6nHQuUHerW{=;DnSrc>fWM!c@&6O$`4vMd{9wK1%-puy}
zzni2;koEDV#v8q7TPkJSStGn1<ol@6j;bV+$+(rB<b#(U{EJqLvD|VfYT?tTPtUYY
z_{khXLBt7g>0x;k`7<N}Mf*8+59gv?1d%K;_OqsDJy;u`agh8Olv_s2&@dMF$pSE2
zTiZ}vn!VlKn3gR`IpOqQUBTBP7AzK_7X@Wt92I}n*m#$dhc%7qK;~~dK!)v0)`m3|
z9ubvGbm`}%2T>7%duxM{EKP=!V`EnRkj|c-4Kyy39R}(Wt0AS=Y_oImabjX(k5Y=X
zOC0H3N4217i@qbUBcbQ9<2(eEtnQlb%_!qqwV&ML!U*CYKk4e}xq}%XxQ^nn++yn$
zokV1;^cEDd+2S{tM1nEmMmMzsSakH=^Jou6Bk|GZpi14TO&@7Hzcf6)RPvMoS@a5P
z%*c!lU}}L+-3;3t2<fbXbjH>!&0jI;yn`wk9if;%e?EkqRDme{brw0vYPDCF+%Poq
zXR4PPZH5H#bxm2&-uO7|ZjohKpD2P^2rWv&fUMQ>$l6-5+Vk4B!sC-U_43lXkebFu
zc?tiYUr?XxuuyS;M$pbC4CZ3s!eC<1`Z$w1ZSlj1U_5t>Lx)5xN`+k+w1$X5oj~&^
zQwtOMLia~mO(g+NBe^{mN+oaZFoMa)VjpH^G_M$u7x^mS=H_;iUU9%Qa%xzfGpZMd
z#~mYLf|*O6fi=906`>~VO{(^rQY3-Ek4u{O0Ri<bVZLRdc)%$KXJ4A0x~GfrHx-Gh
zM-qke<*)GHl}RQ#&~E*N7BhS&d%<kkqZlJ1jGcLBqynyA?R)-XY-WZ~H>N`1Yje<V
z#aSt$!8A2xucZh{omSKsHq-U!r|T}}F<K(_rI%+=^14guY(*n3Fr4}`o9jncyu}hQ
z`K0y0D(2mAFd^B}d81p~0<qKD-Q5Co871Z0tN99U#Q@W!dXI@s=+#(1CoU~ocDD*j
zwpthM{9SZe!*9aWEJYFM>ju~YJR>q{Wo;+WtRi$pBPdvNadc`v$X&gsTI1zSpOMb1
zQwk>;)EaR9QpR$9YcZFN90MT-e122u6|3Pb0y;}+yAQ*0T>4+h#4Od#Mr9t&&^#Yy
zbnMz(S_IRjKW)(Nx&=jX%(JrHOVk{Z7?IeRTc?|m<60)<utW1}&hHf3w;QS5|79Ur
zgU!d#p#|flINnY&?KJfv;;!72bn{J1MSVJ@-|VKA&SL~S-*D*&9dGMq72srBOO)?b
zPI<_)E+wVk56lFAx^4dxTanr}EDGy?rHpv2+f`;nSO%q4L}(|~SAzK}rnkdv|K^_j
zZm~c0bsx9{W;wO7{1(m69r{NYly{1f7&)^SKU6%a&#e<+a%`(&OkB*Un8{1yH_}d%
zb5@#lP*tR?XH_i!zxpG7+II0u$TOW=48d~@6C}%thm@R=f`$OUkWl(+?Y~hp{!jh4
zG?Xqq_$M*cVA6Gv2k&N<b_?r1&x{0SwBmlVPkE2WX9kZY%Vfe*ag?5REypVU(r2NN
z2k*FC0;6Z&%}?3)3}Z4&;-l1>6JrO<cs~CM3FzuB$M?u3x0GCQz5IrDxg#MVCkDTX
zmA>E@o|&2;1#9xO*e#XlO&ZN=MFn)Ls8<CmwSF7WsX}kg1@@<X-*@<8N#4{sps;Vl
zkM3bPzf_ZQ*%-Hlh%2k%1<mOiziLlU&}yRj$_~9_!76OSK;qKn!HHrl>0B&LN<zzW
z$B9?Ys=I#z64|r9h=%&)MEP@Cvcck-fjn~*<_;anXzcn2!K}M;Df_TyUICl*SE&#x
z{9cQAsC>`Tw}N*WAN6-G<L$SzSyrb17(C_RG4s~A_>lho-EXg%%xu{0mP1(j4|HcA
zM5Qyi_rtAp3(o!bSU-${tJ&zc#ss--hYkh0kIdgopN#|_y6iBtK+*}>XujsXYhA}2
zHJAGIK~(aA>*x2S#@(#V?^m23rxvW<RDW&z3KJK1`_Wd%0vWertX2zRS8*|JdroO_
zZ%sf=hIgT+VZKRNcgb?}o}=lJ`(3Y{%bTjMII?EzjEZ+}P);$dc#uFK>0e+0>3n{E
zfqzNLPr(5&y#Gd&wB_T)Vfjbs015|?H~!H!{;ja_FID3oJp+gtK*<0y#y=Vc5HS8x
zFMxFMk8UCLSFix`#N+IHt*Dm&O*Xinj&n=|Ep!aneTo;kgQ1nhOt-IX1i!sy|K`E4
z_91Kk>GTxww*qhs%J_KdCTD57cJ;<DU$Hj$OSm^2N8pv<tKAf~2jZNfeNT-VKkY3z
zwHv{V+WZf7+VVbrJ6?7X%!gghIa#5@@AR&05sZF2zW9TCw1{zk?t$ZjgMIEMx?q2Q
ze<<34rOPU1kWl@-&s%lLloQ5Ere(J85*D%A?0ud2PZd_NEeZt{0-tdbhM!WbrV)&e
z6i*p5y<91nWOD-uz^(pjk%)Oe1TSNk^Z7o*bv$J`lhyQ1XotMaQSx@ZQE6|1YQ5I_
zlfz>32cspN>j&d6WsjQYe$;67tx`TQ>Vrl<dEwA+XDAgw9^MgMMEI5~^F$7A(WqIi
zy2Jia5`nX7M>;x^()diXRP3u6{I`F7@_E#(nz6;SPgqC2Yx36&1=x&A>Feasus(V2
zw8X;%o9STe)td$diIWHqC*o>~*R#Ab9T+WX&VhJKJaKY0?#6V}hwBG|`3e%9-IGv+
zj*=Xe8Er~il=>;9)D@GjC`oF;Y-~4!VR*TCN8#^bNsd7A_j#Y~gC3&8#d{~&(#{%A
zdi#2Iu;;YqHdN<6%NxhU>VYdlBvO0TKNu>Crew@9XR=5+U&Xb2Bd-)dgWRkhnqrXM
zb?u$6Z`fO{&>fa~yK|&tl-pCX@)nBVVDJ;NkmbghW4Ncs;#O6ay_i|iu8upi9hQae
z#uvL;sN*yx_hf<HK5BX_sadunn;g;>{p1evsu5wT>RPzU35VhIf)mFY<!$enj<aS+
zWi>z4+D;#Sfjmm>jo)$s`;BT9TcjyiPQ7S33FRFV$$1=1-y%%t{iuE|K$YQA)YzF>
zy47^LO7xfkWFPCaNMuprfBIHlT`pEd|Bmzi+2cr2tEowRsymJI77?AiS^o-kC5}!Y
zHl|NCHtW$QhiXVxr<aj_iEUU%@}p5>-RDtgK?0);mHK^!Gt8IsuOx=p2zS)4bs45z
z*AMVhU92<{t<u}fvO0HOn?sErByVOE9dF(}CT(NtUHOxo`WcUW{uEZnYp-bM?ACu+
zF*!|IlkC%Mz#*C6-=V7U+@ZWCO)pO3TjDvM@!1#EXS}nkbnEDCNnZ|z<UEPA+lT~G
z<{9)(zZ}NIWIos;<togwd9uUmAo>=e!r;fiAF*iabLOz+_IoewnS~XUvH#AljDivK
zG;iWELL`b!eYPh==0WSn9V?oYw(S!N9*3Z}2u-=8s%q)TAKxvNz51pfrLe<@g1$zX
zZSh0KDIYyhmqZL8W@J368Gk!0*K%hoi+p>^Nj0fN3y%$B{UKOV+R#nJJ}tN$&;vT9
z|6Dr!vZ-ozTtcxf>0k+*{}q~7RM$dc*S0&>Na7F)N+I9UK*gq$q31d&Sgzgin%Z^4
z@$8%Hwl3@R4N33h(=?$V%Gt%;K2ybUAL4qggheLXyOpZ@f=9%9CHRhFtBcJQ_;YYZ
zqBc7|n7JZi%YwI_sfsE5aN4AVB&>rWd6TR<+$BB=QJtyFrUF%t_jZ{{DujJnZE?$$
zXqan25Z!@1_RV)>{3OjvZNo<XQObzH2R(DqSnKSKxSz@Kl6T`!P$9O1F{rOG-HfdE
zfJ=vDRrlF@HBuR5UNZw9VLkg)Co<vvWh}iBc4(Z~tJ@T#-gVNyXS;P}9i5jo$68M0
zYP4J+;Ynq8w4srK*iLBh$(Y`HUHnq~q;vAx)MZVC*05VvRdrw6cHx#MHeBzg;H^T#
z3fx1qp2<f&b|x=hryEDNYWhL*p9dsH*OM(I4!Um<Bk`LeQbmpatN!nHXZ9D{%;83-
zT;!GYTJyR|v%4{jFHDf_SIz$>0&RD1WB(1BP+A`W)J`bxUczPz(eZ8o14SG6PgwAh
z0@nf+dRYfqQ=yFG$}dQP;1=l;HfRRM^5sdJygoF=)xZ5GgZUQNRTK1zE%6Uwo=+Ub
zaN$n^jBC@bXr#v_dW`DJ+I*Zc>!sxtnV9plQ0v)!jT1T2Ucb2-2(PwQ%TUXuG)mSh
z>rRJ3e+7_)RjAJKmw02i^+zZijv5>1EscG%YE~FSSWM|P80ff)2&h`y`P?FUF%G^y
z=@sZ+F%~sd>z`Tqbm<PKeZ>e73DtWQ2dbHBRPK(WBjGfct7^6O@tWy;Ek*Jo)x2H<
z`c9OkYlrdi#&wCe?r-eXtYtY~#gE2ks&dLueGAgo<%!u>;YNMZx(!P^uPTf$)rG<T
zF*)t8>V3Uqw)&tR;ufyB=bb{NNR>VRXGmkZJFMeE&a=>=(Z$r;D6g%l?f610^EB$H
zZBOHV^bl&B^iRP#g$B%;<VCZiog_$kn@i{b!p#eFEJkUrNJB~#$L;l(<lQy3JwjzD
zeAQXW%jgUfB5wcEl);%Nxn6P)XH~+5QGZ1pZRH0iYU^TVA46kpe{xn~%j)zY_3Ye^
z7aC-HHBD?HKeT_oFv~9`9;PQ{B)8AG-&M_?jqWmdC<=eUj&$}&;^rllaS2O3Q|5rD
zN3z3YxP<nQ!^%BgXNP2+q8mpHBdGq*(-{W87}pTHHkJ64UTKm?Yp<wn^orD~=SDNC
z!5nma%M%qcyt??(krq_MRm}3$rAngs8)fAovAitdrh+~bt{=cksA+w#zNeaW)$0hT
zjJADk{E7Ek8X*94(Fky5pWnN>y87+k7p8}WbW;)D;DG;xLoU|RiBY=kTdOwDz}JoM
zT1Q#RH-0IQ?0WW@J(G}-kj!uHSorxw<6KlDmZIL2ot9#vg`;|IXI^9C+ly@ez(_^z
zgXYZApn!mY9<#<`U?qL3KVg@)seib=uXt;ac@X|zSQD8C@dDg6UFzfiG70uQBL+Yn
z5`>g}yrEzib%%D=x=FH3-fHxo{YYhsf!Et7^zTr+E3^_)wM`iL!2y8DcaDq=GW)kb
z`abB`B^Wii3bDN;mHRNsFx9)GQ(3#IMpB>Vta}pEi?1vyV8o<v>3F~<dx+?oz<9NO
z+NYKN1;^}=z3JnJDziT~M11Sc@1dDq;XKb|1@FV;dN~ts(XU_`I=ycv{1`j#=Do;b
zGWaZ>VoR9S!C**g=_i`@-`;K&!`^2PG<bB&&(crc9SeJ7aoN<J=H4ar>U(XA@re4j
z+x;Z*$StST%AL)^1sV3O0Npk-K~kGH+S!7BO_FUi9K?!t0ruK_x$*NfclU_+Gox--
ze|}ELNWM=7gI-yv5V33vpLx6}uBi>qwEN>zQjS0TN0y||V!58o*a+Q2IVR!kjr^8R
zP4Ss_O~_rUt*Mt!Ux@vvO?0S5x&-epGmCTyA3sle^pF3YN3s`5QAwc9NRLEu`!Ke?
zy;H)L{B{~OHhY&encA=79-f$7oG(fXla>}kk80!>tkMx0`46}5LqT1l#YB&1Qa9Qe
z8WYPjS<zS5Hqw6J&dkbm63E88bH?4EuK8-4QF0E}3su%z&9C0*dS3cp=6w-rh;v6T
z4u>4zbk%YnuQjjs>p{KblVdiu-ES?N-_2<Sg)CJwJr?qb3|pKE8Py#uAl?&ax73S!
zd0#0f^Xp3Z1G`G!vyuoy)>Uzq^)*-JMbwuE1V6GeK5R;Lm8<W*aPyY$gga}VR2tCO
z<H(#`ew<n=6jF~j$-|>!k0t$@$YPWffUD&CPB}k{Z$vou1HYQp`<#Qmb!O(Ni_Kwb
z1)*ahA8Kail1)BKt8W9DKe(o<<leJ;9Z=>5qTA~h{6ZLF)IS+@lbyjG_U~A#M17{?
z^@n89G`_Z8v-k`<Q8OUYdB4J~x%s9hgc5g9@bumb`qJM>525k%rDGk*{hNux|A7mG
z>0<UGB`PsA_dnRvim=uf_cV-X7*igxD|7Ztq(1mwHqxYg{|g5WsZ3#6g&=+^zHCu~
z@->;+#Pef;!89g{c?Mh*szfPA(%z21(bv@#4V4ybC^c!zS6q}qcUmxuMtT&S3M1|-
z*3bQXkSuTSmnK>>yTrMgi~HPbo4pLPSY@sl2WlhO%iF<KhrKSa@L&(_?AuFA^D<a}
zW#Z1CuR3d-i&?wT2ZpW`MW4gF^_5Hw??m(V@hrsS<R;5jQ^;3ttn2Y5DUA%(+da%o
ziZ-5n%0_*^BhN$Uvfrw#Fh}T3M<nm6WUy(kFwMZoFEb+3cl!NK;@hKWQ8t2KmQc(N
z_dhzt@J(&j3^hlxUqpCteV<Ge-?)bJaHSimlRrcGm}ZLLWq#SNVfkv4Q{~<ouK#UN
zLXkOX&wvWwdeNR`9ao2AVPK~(9}UrAm)%?Dz#2W3aGZ`1;cnK&$#_1hMVcxp@z|Fd
z{V1W2Tj>6o+#!+gzdcBh?>{GZyuAN@a>odEuL5ZCE|N||(t{mHAP$MY-O?j5I{v@V
zVmAsBGz63)fEEGQ2Ux(1zZhdNl1>8@8Inp2L9&eiKfA32pM8YH_C~-PUL<S=a7X~8
z0YVJWhPRpkC;N*MdLYq8R}?6K^pN}-5<^S_|B?duJR~{^C`CXH0umDNhuKIl4ar9W
zU=EOdNFef-8A+f41`*(GfMx`UB|sPd;SUv&tlEDuhZraq{|Oxar40@L2W=P!{SVv_
zkc>#&(Ci=9P#4J>I->y45U`pb!K(!lH2g~$q9E}~Yw-J$zl5O_fExdcF#PqGFckZT
zFf2gwlK?S9VwnFz3~$+xh~eR1q;no1hS2}P7$O0~#{UKww)_h)g#3jIG5-f#sEvdR
zk(ebwFmL_?E(H7|n1cgS6G;}XBKgn%P8R;f3LTMHq0E0w$)Nxy{nxY{$((*ha*|+j
zj-);TR0!VC{bdRPdCBn~OyNH?Ard7l1mCm)P(r{FA|XNmg!=v^2<4FYW<U7N43ZZF
za4BFO0kR3E{Q=;YfC^nk5|Ov}QCPDHTT#va`?NosQUsL<YI<Ruv`m$3qj<`p$YhLd
z_~3!Gsvmo#lAO<E0>^SodSPI?fHA#cT2$N4L1NarGyd_7;@aNf=aH`BZ(=`Y1EF~%
ze!(-|9+LvahX*ejN2~!*FrLk6413rQbixc^o4^=P4LP!qIyJzR&Vg$1erRaO8ZZ;-
z(0!i(pne$w1my;h0Z5(a1OP0^HFGn-+j#;KsnyBJ=?EAvFE1t@IZp`y0)xWC!`A>5
z;R*n}^6TsCMw2ejEu<O_9xC~%(Y!zSEdaWtpFc;^OUTO(Md4EkLf~zV$AG{?!a>M?
zDgt<17xcxqDNd74cS{qK0zm)#0J3ya;O)&dl01yYqu{M5EiDCN$2Ai3@dOM5P)1OJ
z;!?;1kPTKKeCA37iTwFqI$g!GJe)6;u3vA|zT3aAj0EMBm7gE0l5FP#EXe`P8u57K
zkwW88jPGknF^B0AshCb6tU{~6m63n~l1O;__AR*K;D=OHRHFVT-;o71?)ClkbuwSb
z9_aOGa3I5iHTu*3o6FZoRHwsbxrK>^#o-8`3eSM-SPS%nbzp!xSOuJ1JSnHq34n6$
z17Qnj#?TwUcaZ_q1<~QQW@cg{W)HAPWcdrJh=^Lfc4jL9vtW7!7|H`smD$ogpL<(O
zTkR(E7GCRzOCzheQsX;6Hh)Q!1$s<2hap-CYV(TgN3xiiz`clzQ_`5Xfv8XNxasAN
zCnu(+iiF%&#V~Ui%$lv<#{sT|-mY6)y->t^41ow3PN3i;@L;94t3p5t9z4)8Ffi~%
zs=J_WUjiiQ7)cTVp!6Fc!d6+@c9dX>RnwcmgDwVuddmjrWeIlqMc6g{4B9c%J>1yM
z2cb(`1oFVrr>}r|N*PLCsLLb54h6PeCuqF{q?52F+!)!V$W8=O8V6NE6MXnt*iB|1
zy0>>FMLXO?1z5QjWSxTL{f7W!%Ryp=eL$B4;%PN|8+)cpx@zfYKC%&cY{>Dic@GBa
zD{uGUJqK$&zEXlI!gst^*$A8qNth@H4f~$kN48PK%4N|~O6G<-OaQ%J5tDX1BNz2h
zX2Rh3jEvhXq?Ph1Kw3ckZ$AWYBvn*YCK~&1{MUiPj&neHJa+o>6sZK0v9xPAOgn6*
zqZo}dY1<HCzIzu@US1w5{ApnU^~K_L2nGFJJW^p=#!zy9GOTwFZ-yc+rXGs<^5nSb
z=;+L^_5}bPSOAAeQick6eg@e$038SlxsN@%Mg#o=McsZq-Jso~$`{G(1}H^iHMJ=u
zO<I0!r2>zkXWpT$!u`^eqAcQLV6>eOV;=hx_cxX4BKxk8*hV1$_7+`TFV4>;zvJWJ
z-~eull7nC*){AVAt4!SM`*bOQ3uA$#8lfWuWXFO`=^n*VpGsDKzmG-Y0Y1Rf_|Kr0
zZ!G#hJoXL@f68I=QKM~eB0IyvdrP0gfX*tsjx4v;T`!jd0lANdhxe|Vogk5fT~D$d
zXSV^k@a|YIl6?iOoL=A)rk*=ScS6itL)Nzbe0>-YJQ1JD<?ri!FBJ9J|3HX}EomJl
z)5&Q0kvupZ-AXHLA+J&Df@H`I+90Wt!&in6O!l3{8;yQ|n4%s>PVasDcGp|KX3gR|
z==NCi5PD$J($aB&4kUb%(<q%^ZgcgXIB$PzYs(vexBP359Nt8z$LSCdgbzv6V|&}r
zeqk<zK)!pM1Y<-q<?w0Pb8NV`EiW%G{lO)f!s#W6Fgwv9@Ii%gT2F?M_s%0RM*)6*
z6w|0FbAZe~Wsmf!_OlHDh=nx}3S}cDI-$40Iu27!o}QkxXbb^So7p<c&GBKj5A*IS
zZSR%5o<#X3bxz_(8)2HzwY(%Xpa*Ms5X<<$MTm`UY;JCjkBjSGTq+0zl}qB1prAOA
z`%DPcs%hvZ5+4%-&~DxjO}p-^C$u}Aj2o$iF@~Df?OgXWo^xlpD}0YUVrO6XT69;y
zCY1s}hxAP}zN7;^t(Ci84$9GH^1Lakhp%sEb@k&6GbE>Hc=IV21<(uBNSB+Bp7ycw
zUrYcDPOVr1e>>pM`LB(^K*jGXpo`sua=2LB!&0OrWh|v1Z8cl3LuuX!<(;{U{?4WZ
z?+xl5%%5<4K@`P}M+A2<G0{vh-zo5-Gz0RH03UOSXjcf&oizpjVW*};a-Kd60~i1~
zF(QX8B5;E6q^vz7_H*@@Wl2Z}xt~}T-7ULtx;xf%-=ONi=>^enk+hlFqfKZ?NRCQs
z>U4Yt1%WdwUqY$H&9_PTGE#_*0|AW$zM%vY1w9{h*<J$;4fh)W5ZUKm7Y&Cno-^kC
zknl2)WR$(vsc9U>WY{>AkbU}7@jD5V0bURCvZbwKq=^CKbjO5|R3#I5?oS1O*kipT
z@F#)KDZ#E(%13W!pn({J37QjMDpOy4mu_sxm25Ga5uu~t-dQIqlWGBNM3T3}D3X&%
zMkPirORS5N^6Y!vV0l>?DbBkub;NKq5GX*D(7z>J1Fzhs-CnWpm?|=2a_%y4D2y=~
z2%j7^2y!LRS+!&ma1vNwkSI6$8T8OmqrV*17zn&JAcNB35GI2FF`-}DS78(InK&;H
z^r-+QCMGaQyt%#r1E!GcXUSuXtH_XdDjn(S^w~1+0%Xp&CehP=D^1}LFuX{5*_}xn
zHG0mElS}{nolT@dL(h@z(`Sn)GVi8QbR2H=TErnZs=-LTHZCp>Ig%p-OtE-?V2)b{
z6kyCjAoe4Z2E)xrr+X=hNCrc)tXZ9QiZI5u>@A<!6BRp;&P+-FbDMmu>JR4<>=fNn
z_LZhK@3RyM?@SOr@6j&3b}?HP1mp@JBlN&-193kvB!=I;k7U(($b)QSxN$(6@1AD=
z77CwM_LO|H&pPokmdBho6&hwq_LYmqad?GNvTkK!yOiu3T|553Cp2UyH!iaQCuFF)
z0<yW;s2;!#?F0!qJD!NXw=QQbl6X@ftgcFVkoa#UWZw@<Tg1lht2j|&;aiR;nkx>;
zG1o~cSl|~Nn;;Bt)pDR=SvKQOWEKMV2o`g|MhJa<Jv|A3=*f4&6opZN7iFQ>l3Mki
zO8j_m=0U@m#aO|O1$=j0`%L9i!x=+5D=$694g3dx16=Y1J7N(OG=Fjtz`9tPHDDuy
zbcIZ-p;AO$Zo0xqros>?X-HczL$uj}(d#7Mjg#tLojWmG58ZJ^V;)3+h_A=894rvY
z+|dSYYg=*=e7)dA{R9x8U?T-%iu&02cqy$g7$T74uMDEEqFzP>zi&x!J-oz<;jPDY
zRGaE%-_u|d)R$k|*ku?`cHzttb=X+)n#6E>CD@8e=_ryx11z%Yhetz$gFtB)VWS9t
zhmJ~#ZP8OUjTbXxs96@e@dBRpI2YQtj*zjcU+CPbeXTQE&3JArp6lR%U=Fo9#oXQ^
zhTl6LgMo`BR!V`3(UHt9&MQ{NwW)e}>wl;B_47L*i}4OG83c(3g(I`7WW_{<&k$7z
zTsu|md7~>OQwm*_pGG9iX!Nu-mw%ag$vP)S+6c`t<xgriJN@Z{81Gi7knhjv2(t}T
z*I5+e7ebp=Gs?mzPWd6-%lR6xBoxO6X(~I{Wth)wt=;q{z_pD|bPR?GkZndW`g1*a
zLLv%fy21)E1#`$zt%AWTI(xHG{xK_<$q;VZ!NI}LXldiuHpW&ss!0h62{Jvhr%$DQ
z*-FMIG`;WHVxjpBF+pv8T2URQd$aGee|U{`)b|T7SD2eLzyqYjg%rioqSB+MZw&dn
z>eIzMPYt;L@J<w2(BN4$&{AaZjz1TIzo#_o@rdT_nd|&ES9}!7H9M4S8*>r+X@B2E
zA(#a255fc3BIDMc_nD=PVA@vieTgj|$LCJv+(doCr?!Iow9w8Vw}SoFIPipHe%{mQ
z3pA_mv@C6jO0cb}navMsM<13MK9Gu&Fb8K2YNzUu4RM*jdU8lhzUaC-o?)23n?^_+
zPD0;IBu|}XGK_umL<LjeAxizUAltG8Z#r{FY)(7|RpE+NEY42Lv5vlSZlO9fEjV^b
z>Tz{0^|P7qn72^NR8Gka2t9PWj@an6pDop>1cx|`-pGdBU~u3OIrp=&1IouxUR!1X
z{jSVORz5h_v~3GiGHczPFMr-t*oxosLPOteG8i9pS7+UpdLGcITke<L=aIMSpr6F(
z$sAAawdVfLOLH}!lx(@=t&&T(A65-EvdFh>GLk*xg(hVf244`M%E!|rcEnl%nvlfk
zbs7XDDP6Hav>IGG6F6<ZNT+$_--~C?dAkHZljc9TSh4Cdm)0^>c+o5tSrpgX_uBaS
z&N~}49fXu0>uMqW0$U_(rndz$A3XT{y4c};p>Wb-?TXc&WVBv{DYY%LL)S_eh4bAp
zyX($r=){>bF<g!bp``8LiA&|lI1~Lr4?(;BYmwDx!&f<vF(%7p;1@Htju9BdZQFQl
zx33?_Bq(^_r=7B*S!UL9pvrV%S1lhE%uj5U*Z0}$?P3jJwQhq?>V}cx)PGHNxe>0K
z2r)vN5-s+A#-<y{WLgU0?{it7tCC9OHG=d)w;Z;7ihF)7uJ2Oy7fP;nXS4E^aI&*A
zlz@KqTtGc2<btj3oON06&$vKWE(s-s9>-(ZN#421d|<|>RJHLrZjqAf98ntxk<+^j
z_ie{P=l1qz_cAyiwJk_4gOp9*Y_=Q_6mq-#robzB>SB`KE~Hiag#0NX0yF3Qmk`u3
zL6MP`*}h8#eNl7F!Ez9XGgt{mQZ>Kne;T?H=OJIS_<dS>0`O&3bD=~dLh3ecHdYi8
zgg)Mp`M$qUjX15Q3J%hS{?<cru1@+og9OC^X{$sM3^&}0%Z+5+Sj$E^=A->%CMMzP
z359H7E04To*A9f@QTzb#bQjbXF_Dqm=1Is&(J9~d)WwSD=)3#c<jQN~hn&m&w2x^O
zuQ6vl-@Wq@s16##3K(7s{oBlVK{IQTV#Sjde7>v~|1i76+j$_}1*=Pj-3@E~Ie&<O
z@yo3uoM$1i6x^5ffByUl42h<>)n#eZV?wYIIr0Xo9b|EIdE4?JpbMo$8w|1`Sz;(^
z<e2o^wGE4wJ4LL8{EiRg$F$acBNv^_mSHU(rY{ASecuoK8ur$o9(zeMT1v!e1e%ii
ze2Tr2crYzS%}+Pbf6^c$A4^BuT{y8o4J;Ot+{r#O`h~5vQGRRl312)DFDDqJw?O8M
z#%hTn4d%nC*M*M4hKTb%59`4{MB&vgmaH5(TUjl=vk<_dkkg+Q>2;UB7ys6drbJam
z#Vbh=?B+?q`{PRi_-v`t_Um^o_4c}YVOe#~-R&G3yD~+;-pVJDzSI%cXU;8_R0*y)
zUy^T;j$Ev=p|Yb?O|pq!2vnadb!k5QFw@<$dHQjBR}H#JXY@504>%NC1vmIS8wZk}
z25F}d=rU}(`bmJ!)k)ZP6c;-8)+KmFrta8#tBXa9ZP>5ni4mviwgV>`>y2pS;%WLA
zOp`AI-;hRX?=UWOT!=kkCQbPkopaGP;efQsGR}U6UR6yk>NZB&S-YiPFp*h4?zLFM
z{-TB9Fm%D<)G#`H`JUSbMgKJFEh0wx6Z_lyxD6UbiUZy3W$!(c|M^fPb3e(;buY*r
zN5*^PQTOUa!<YYbwum}V)98~vc0^5iVl)u-lADOU=Zk~KQ~6TJ4TUY@WJ7_q-?Pya
z-}B|b+)l3h$o)i-U}w4UAlvRb<>NGRBQhT-7>n7LCC<+rJS(z<#}b|ES138g3EHAI
z1P<R2{$5=XD*LJM8dYELFqe^;IjmS&RaMs^f07d+cq;tx?SLMQ`KJu|Oz&_j_;7n5
z(>jeruJUTk*GO`!H*h($;D-<;r8sFsnT_bzZ!?>hG}hYP3$#gDcySc>3cN7thp2U-
z;T<a>_j+D+8S(7T!XuGo#lPxs_RJr)Gya@eFP4*t_uTcY>xy{;#?^Z;T)a)-Vi5gQ
zQ?zBW#`Bdl0;FBAIK<MhDfi3iBdI5|oj%`6ak?O1j%uA(tVy2sD@ZpA?kN+P?oBBr
z{;fxWaORGf#uw}3kt=E5sw*{6-eD8do{#R&KfJZ29}-qyi52Tw!ikwtUZ=6qW--Gn
z7%*pR6J$adf$-RRN>okw5K-?c5QFDSxjOt}&s%fj@ou8FDI_+IJA>~Y>WUceECqM)
ze!;Ge!z8D1zFg3#1cC5~5?fu%iiq6aZYV{Qsqn?z@5W!vIHpJPMcr}??2*sFK19@_
z6(CG<kbaq+?%k&11s!8lZ~{H=&$CXN(PQLVZ}yZZDh}FH!R%EMRPq1aiu{ZiSdq{9
zd!RsMG5&+PJTLRiN9e2%Ysa~SrITgmIsEa6w@^yiIo^9?uwp+rROf}!#jb_D56tr`
zN~If<+|fl*(3$-8x>KOHlr;KHqv<%Q4^{YTkBcGCs)i-Wcp$plZ=2?GsYlN5f3K@O
zT6<?;AiP{|$`edJBg(=oN=mP$xC|v4mXatsdv9HJ;z1$!F&n$MARuteK(Auo&99E+
zQ?#fb_{m0Y^l<YRB*B)i?5y3&yFNa$o#=-KnN3vOv897w-9g(E!hDV!sL7LIE9Lj^
z3%vMo%!V^u9%NB4UES|>dbA^5`|(AKqL8jY5R==r&|2;pWlY4c4o0!yk`D8;aJaj>
zu>`?<2xV_5k7i&Jv6YXjAhy1RY)1M10ZGQ#if{kdX2?y6&0R5Yng_jGc82a*e$wgv
z+X+SMADzxwSf(uSACzoltGq)nGDRor_fUAwK2x3GDMsOgNaBBlEaV|Ff0y9}c(ZTF
zQ2(8h1?A_#VF8=c!H)EQ_M-o@5gjZMgEjbn_MiW=`5Y_^|7+X%|09Z}^B2MbYwlo2
zcs4;Rs`>v|eO;0Q&BIy$s|azFuzbz?s`>>A5?KQDliS-t!_r#SmX}<dzRqjk;+=&R
zt|o$C<}sTv`#r-6Z`p!Z@OH+Q(i?oNrLJee@e`EBO0`|qoeY#Hu6E2bTdd$DT9ONa
z-{Tv_Sg(WWbXM2L{^4}FYl4uze)|nP`ZEu<c<cz<UCOG@u!3Is+(Te#AZ8f5_}!B<
z5<tp&0J+s1b3`O4XLB|sqPJh8C^oQFS+X`W=&G!lEix*m1qQ7Ro{Bo<zkKWi|L`fx
zNF<We`eFz#O+X#i(5{#^Vb_|=o7Eo)!J7BkRBSM5m20eLs=v{qs_lh2WjIAu1NNj)
zt$Nl#aYzsy>LfbBNY>nOL^t=0V}3EuQUhTZWjV!_#;8~|w}ag5+=c;@kTXThGA?H6
z3sedii^$u#>@8*vPyY7NJ3F}LZ2BDvhtZB^LSrtSEfRHB!4s#id{)g~R6A8%Hg4ly
zk;0&Fs$peY>CSs9&33O%-5SGR)j^ERUu<P)!pESmlhI+1G!W*6Hlxc<%GHTkJ1Z-u
z(^*3JaI;5`lSh`zDQhg)H4y8JhE1Ert^xA8#)vO%^uvOV@~@IbC6?l(7WK|QJRiP>
zaL(PpCJp@{)xW(cV4O9OB*x;;9ou2$3mt(!oES2eJK*f1+>?;-;@OU-dJTlSN=wB!
zUO4nK;?kaMDiLk_X0b<|piOm`iESyb1Xj%`+_@)vc3#K$+WJUw(X6Tf#tqkXyt!l?
zT1085_DCbidnKYf?&I34p>h*akL~2lQ^Sa>wK@l><-eA1guHO6u8(+Acprv7fBH~S
z&(V(lVV<y38|Bk<4ox@btJ61;2b@j;Fh;07XR{(~Hqa>Txj3TSt)2-_@i>@v30?vl
zQuX}FHouV7?VKFnt~)&Vj<UAF$a*QM3YIqK(q2#N<UGi(r9HkV*5G}=V%caIXQ`zG
zRt}!YkRzsq$Y0ga9@Z-iw{^x*ws<WGiO%1g5DGmp^`x>s*jLl{hV!1WnptDG6hafa
zU~gA{o4Hx5<dT_oLY6;$wW}g^DV)AlornF=Rm?i6sbA>X=X7NtuB2?Ke9R=R!b`do
zm%5-AL25iHn?J2u%ylS`*p9EHZjoOK6HwsA?fZ4iImyrYxzepKrg6u3X|V+MjA1lw
ziBa@fZcQ$`zV6oN+b<AK?MYbt6AUN}XZ{pR6-%|b9XwZYvK3AB+elzqK!snLFd>(P
za|k?%bySE$XBDzXd`K@I3c+^@Kvxv}-V7P|_)wWf_9b&Jk%tq+Qgk2A)`p;4%`kW4
zP+w>bsYh!U4`ZbI8Km4#6FbslLFdu%=epueUlivZC*zw6M&(|`!?f)r+(c-v{wSI;
zhEqU=bz1(K19qaK$NZ6sOGH1{Xp?s+{N{vFdw!;F_5v5t?ADiuv&5!>uw*v$;yZAp
zis;~sD-$NE-Vwlc;hPuCv2n`_r#P<4VeT54)7RB4<Q{FhMrptPt*CeMjA?bA^I`YC
z4s+9_hOy!*zT58SP_C=>M0cp}4_M)O5#drWC@THv*0-<oy-z|RQSc=8Q9rE9b9Md&
zIsVm?VVS-%V%Tzy6T5-`(yLX-)X##W3EMn@K1gcuCay8*{GtVq;*@pDeg0yp<uPsS
z2D=j>yQ-m+=chOG16d*P2f@~981k!c^@0^D{ON6}Dx&SI$EP0G*g}tgD>qTUfE+7i
z)c-jbm=rt}h^3}nc*edhaJy)(iDOJOpJn|)k;|y}6XJ{c2;~UJut62nxPr|Ey9Ofh
zf$>}Fx7tJ<(?x%)2u|gLLia<2!3zhi&ueRILp~4NNlIJe+YefNDV+CQ^x#c;t*f8F
zRtd2Iy-@hJf+zlg@einHRR9N1{-RM#sp=ke(IKMBl!G+>_=M9%SOf9rD!oAdU8gY9
zfwgA)$8r1q3u)1`4!80{n?f=ph{UfF0}fKKBPO|tB)qX6D{;h&K(A_%nnu^<jjtk~
zVDh|};`h@ep>~({sGxHm@mGT|%yw#}Gz_|@0amJ&ueK|L4D+DOE{R%;Q1c4T){B{Y
znh87F_%0Yuq6v(+<{$lk_~+fNd6rIk@N$pWfg$7gd5n5%yIf7AWw!}eb`!Na<QPl!
zwI!mcPYX7dqn2_l{}VpkPz|fXwPh11c1HHQXXL(V%10FHiB-}{m5yxvi>6ey6R{o%
zwbtP!L+FOBrckyyU3`}jO+<k>*#Tq0m9f#<5$wr0-(gkajv-{MMwKjkd`ruz;nQAr
zb~f44cFloCx=H8oJ!j7L_<8}}bGaH8<IAtyj?OFFoO^^$eP)e9`IA09D}ykM_Q~k%
z&Dp0-yUX-dZaZRK@%3lJi#=lH>g+}cfC#4z&H3~MLBV2iB;?6Ce0$q3N8Z(C=ju~U
zv&$kEth5Lp?j-6TpH+Qn#U7w1xDTdmKh6S{NNXUWj5MV|?2TRUDHOj(su!sTGacJl
z3o0q?Z-Rn@vlucS7M)&Que(1jSn6mhEQdW49Ay%2$=bB@u^c>s<W&W(8OiTR$ouTS
z>k$1Zn|R>V4hMuX$o@nh-UHh~+?uG}A$%=<6UEVj>Q%#V*_vG8)20QT+WMD<x`-KV
zF+v2`aP|@z?Y?#}UC=bVFZug~AhLfw*71q3(9?gx00RFW2KYC;e|Di265vpF8j{3|
zf=&{DE^Ot@csJruqCrzTzP~Sff0{}l6r_xgH&K2!gfg;ih$&f`5RDUIe1)z@OPq|K
zeu*BI?2{|Vhw_9x3b1u0&@R;vsPSEW|NCAn)=1et<{!2((sh<>8}lbcD6a?F_iS=s
z>h0M6dN}=AEwpkrL;_90%L%HDno&9-@QYxeN9&-B>bPf3b(K5ue0u6Fp+5ZX_fEgi
zZ^C@g07Vm*Irnz?xMBfv)yAL9BDEuC6wvb;@U?%|%l-E=e?@!jEk*F#D-GqAV}FbZ
ztk~b33%eIEvjY*mD%o$j(_Iy6oGG(oRBmdVB8n0~GtetmH_`<+wSuk<3Z4ZQbVgy`
zcO*EjG@kCYJvA>(JRn|ThP2A&5YbA=iZ)(HL@v5avW?w+J3;kRun?<-%7YOUO+661
z#n!iQBy3-<*|~{tJ8_WMpcf%DJPQy0RYmk-4)gKhI_3lk7u)CC>I6gholhV1j>$u*
z_C@-1HfpsIKAOhb&(L28*i!tHQ~v7|s;5u0;iCUGr~Ee*4xT;IiIYx)lEjf8ZP0s^
zX(Ux1mE*oWN$lP)i}%va4yqu=Ij~Nk_j2}$qI8R;jCV(rr0<bT7;f52fQPd)=k|x(
zWDQw|KuNrEwA~|fti*rhTJ>#=LmqG!1jq_~(QkC%HmQ)9Axn5XAi0DfFgH83coQHJ
z{=UcJh!-_V318$c^ov(7E2ebqW}YwR7pYNE*T;T8&SqVboqx!SVv^aFLr@p8?Z1Ca
zd?Lg#YMnpor%qBWki$%NPI$0jsfTKA@_MKa?M<g%v>`^|lLqQWrgW;Y&9rjt<k-T9
zXoxDO!%O{rdBiVq@!}4ttF{_7I?csT1`V=0;*wp&3Xcw_XrQ%leJzPmu0y~5R~Yzj
zcvClrb|uS+%I|yga}f=6YnS&mc}Twbv2S#CBU90C%*QetX>f$;(i$u8#lY2D*7uXz
zRlMxl{n?~=+5LCdb&@hNtQOg2BzL~`@yIM#(0!%W>f6>Q=P+65LS?}J@u9D;LYh;q
z4c^o|h>&i}l{6wXa)K-lHpDH$O7GcpRF#ojp<Yc+*!@H7{O4XAejdSpbyA`KeJ34_
zM*3IkUKjuptM4d^NBR<wJsM|P9jjcGas4v<j(L|nMUg*nNs=}8n3VBPHZM;bdKl5}
zx4=zQWtl3v1nc+w5gv6pQ9MZ`a|FZ9R+NKJ^;DjdkHqa@K}Jo5j$iMIwbv?R{fRR$
zHYsxF6*tYT6P%%Qf^;Z$O1~}?r{?*b-U0oukNf*UQk5s*?-{<ny=z&fGDcW_H#N$2
zFVNKE*$6)8=1rjpAhvT=Zst&GcN5<<sG0_dJDqU<*L@VVanfx))(&^Xx~=sIdKNYq
z$I`=jKH(R!%KYkJj_dX-u``T6qK51gQ^AP$2eQJz!>`gEZ1G6{KB5*m=i(LM`Bz2$
z|LtpmJ`oTC>=W5vLJ6GB23RIQAOYA(<}aZHm?eM`fn(bMZY1`XadP+zIDtdV0MG+~
zC~)i=AfPh;QZUYck6Z)ivH>y(@JIk=0!O3)LJ7c80A>OhRmWd$3NTdQ1UPVp8o-tw
zK>t7D-a9I)WqZ^G6i^V!8IhcW<P4H?&P_%#GzbC`gcd}ifaD}ONlr}zk_-gNIduaH
z0s@j15CM7B?sN7%=XcM2@BH!Jcx&uEhGXw`^;)Y|RnMyW<~Pwq4O-B)faZgM1MK%-
zmNdVABbNRRSIYi(Iocmu37|@VQv!4inp3*<Z=4c9xB#RCI2<&gg!?ZJv<~!)69!PD
zzh<3)A^Lmb3D7Mx|Hbl8{h8=L^k--^Ddc}mLIGg)uk%oVef^ac1SE54C<(w?0Pq1&
z+26{uzcYi-RFVmrN_t=iK1hZZp8b_01ZXcXH~kw%0<aJo<N_EH;U5eM0A#^vuNgqi
z(C861+T?~d>;dQqz+$$4up+=30gw#M7y<AI;9&g!n~W?YEf(~Z+;0}7s<eF#%2?Qt
z*jF?W;jf5^)NZ6cqkE2pqkp~hy8JDwgm4q>;~I{dI&Eok_*0Xsxzjfb&be8+<~N$}
zTAyT}<3|rTgnl1>l({gXv&dRD6se+aD!ausCGHyTYEa>xTy{!&`etB2y=e>Bp`LL3
zx+f_aJ6f2psHpgL43;k^CoV2N4<bSo08apN@W{%_Di<7Jri<RC(gp|E`v<g)H&7-i
z1HPmZB+(~K!6V_&I!RkLLPEkT_t0Q94SZe^64G6uz`>aCe+&+gP4DaL3kSKfa5!98
zR8%xbIu8I((`aE6P<ZWt9T@FzwlLIf+Nqz7;_-DmQEvNnR~S?26!}W|LlZ^q;Q9{C
z$4`!r-#N>>|MZYLtDgIIJUc!8^aRa6k&=+0cS?nKUn6RSoQ_yIk3Zgak7Pq_vP6}A
zD2Q#Fy``_DS#rPBL1NekDmT=8LqFApmWGA~uu^UyoeF)4Xps#JsLTYw#g)0LBN1Oz
zpRn1Oq{lUgS7UkG41NpWDK_GP8<{^%XEJgIE+1f<Xd3%k1u&@7^UL1=J7CmMW=c}C
zv$F$dd{frB>VZnAbUK_-4BD0t!0S!+;)N@!Bx$uF5}%}#@RIi*EVu~M@bdHb#}anY
z-nb67C}&~9yy~cv*JEq?j%_X$#4y>_uAVFKePjx$AU6zTNHZ!N|M>BP>TPf=vn#R+
ziAcyAFil-wmDdTj#k8Av!5C~yQ85jNBYIcUx$sjd=3ij(^16A^Ac2hJ$NA;Hk}Cuk
zbrK70b5V8eUCbCUx#HsGJ-#2@r-yD=c~Y3%?@HJHW@xTZN*(g7TBa!bh@t0NOr5&K
z={@*-(P2<0ePaJJ5zjk@At5r63R61ba|qK?tij~R_V0{dUf+fD3p}z)p~#JkLA13|
zb9eRisf3?|BflJeHq9T4x|)EqKrPsZ*SsCKvt*x`G%GJsLK2K9AWB?W6x^~%D{L6l
z-JP3nP)tnh3ylrfTw<np8nG}v9dR`cPeCH)a)ndaQ)R1EQU%C`o03mTH=aUWcORQI
zboKJN1DxK%f>vJa*_(=ro81TmVpSyjB>NFmYIIP!_Lca(Tx8K`A5$}aoNGpOzj;k{
zD`aHJQQ=gAMl8Cyh1gG16Q2P42-aAZJB#oe)yi|=HXp4$$Kc|4@B#jO<EbO0GOexs
zLu<PvakZY{6ahQVW6IrjEV}MhUC=?Y(@UVi)6PdFW_-V!kf!p2?3@(#4Il4`Sya5g
zx8LWq-pKi#f|jC%;d;&Js7^#ZfXM8`g=?NcrGPccdlxCfC)^wEoG3{Ni}NUSX0hLE
z#Dva24NxOn%xt{peJbE)3*P&cy6lselZZ=L?!erw@^yQX)0OmlOeZ{L<GxfbD%ED&
zjgEWPB?htFMYt}Qi*s{PHk{e6NOP!#^YGd?`()z`44*pL93z6!r!}lXX+!D!IMGE4
z$QKsRB3oU`T<>_Gva+&Z)D3lodK|ubbvpuz4Vy$g4{eUDQf52a&E8Dm|K<&SM7~OA
zF$Ma1u0V>jc?RK>kok|JK#N{U96I=`AYQTF=(&X%N<)<enSpGRR78!2sw<nKTez9P
zO+U~r?9ju;N{SZp`7@S8yavO!tF@0HU7k@S4o*%gd^G?_gQ>O=Prz>@pn7d5Nm<iZ
zuHLf%zXI>QankJcsyvB};>E_(xQaQSoExt!toe0lJazcr+X(MgBX+BqosM4Y&K$S3
zNf4PyLs&LkVqAgJ(7eRBm^TiBW+pF7$S04E8mYU&-!X8koqy1tTv#yQuBCRWwdqdK
zU*Q{fgTRszHKb0B9HTJa7!&HkVWQr!UD|A(Op=NijSrD32b`;pq(iLg+qXlomOE`b
z2#VkLGJ#<Wg;Q#ADFHFxR-!f3NF!FKtB~QfxOQ||La%@KwX5*aGEob18ZHF7YwmzN
zn}w0L{JE~nu0GUteaUJ&_Uw#jvC|m>-Xmq0;<On0e51(aLl{wwJ?=)6`V4$6aNE)=
zy=t01>eq5X=?{DsZOuu9-=5ZOyp853!;CJ3ij`#|F|J=!c!t|Fa)`WyI-Psas8^M1
z794s<F6C?L%F2C%UO^L;<_I!Osvei<bFv{^pQ;DM-_aToCHv{#?Aa9rYlS{+-O*YL
z9>tRO^fY>F>Ezk~tNCriS-_vbE|2GIME)^2No*l_CTdSif5<*F>N8RlvdxL^Pa>Hc
z^Uns!EOT)AKd&4Ss&jG9%lxS%S<Q<<dG8qv)0@#fme;oJgw(0$tR~0a%K>!r!fXns
z8LIf62l2@yUSwbp)-)d~`bY@5dV7_p%N-4Et}I36f_Ld9Vt4RrL@N&{#ES84j<m|m
zt1}0-e>~DFYA&H~%S$Viu<Z@-&g!>a^~=}-Hw7lN)vnKw2u9W6HHLNw^jk}Ma#C?K
z>$={|ihAd5V^Rwigl!}{ekEh=Qzc4a=y)3fttNvReez;-%)g|RbA$LLH(TZ2xdEl-
zPWmA`C6jal(12{w*HBuYVXZuYE{mFR`5cN>HwGt&=ED^h5)|d+s#z91g8Fup#A<$p
z%ywiMt1F8BI7^zFZ%3(pF!Y?7Hr~=k!hr7;QN5(WfbvZ-Yb9EzKWdO-**@c>Q*Lf<
z*k*BAu3s(mYp+zD2XpH4+3?De=1;~egOGGu`3^6nv4h*F^M{oK{>b~mV-F!6*db<?
zme*gG<<21d`n0Tt_snk!ESOT9Fm5wIYU{|1hfCCmSt%g0(hWD1<1voqA~_V6SPg!B
z{OM+?H#I6bhZtIgzFif%xyio)^MRjlz$_C?mhX~Pb=>>v?9-LzDq(Qp5RXAFmK^cH
zj;V7*?QmqIbKk@rsXK{~nG_0C?g;d;Ch;B!<;LX_;ib$IhxjHJ;bq)aHu&A86_^xF
zsfYg-C`D8imEPDJ^<@^^&;`5l!DE6G@NhUZaYxHq<jKNL-J~BcL~r{(#M>DgCZot6
zlg<>Ug>L|Fd-EnX@*bCwD$snc4FEgFEC7ML`KK?>PY)^hghzI*qHsC&4#od;z*@DI
z{VL+#pbwEY{x*TVs(ix};TSAG7FPLU&71l8_*O*%P-t=w_(Fc<pk;*sQ+2t{JN{bl
zn*0}6h5$A!`ce@|Nmwj<lN+QIT-=3Lo){TP&u$BsKhw<VHI1E(#~1|w4avdern~*@
zF8>XjXFoow>`_<wii9|YhAwN>cVGRMQUjRQ$xh3sP(|i|mP0D~--`(`F*m=jtN@O>
zU-6yDZpWYSr18gd=%}Id17bNMe?@!h+cejnl5*0}+`S7cHxwMcCWM2FJ7MZ8Lx#tw
z!N_(wH|~YQg+nHwF1xYY=xs!n7qUDz*YfxzrHnvg77^#M!mPVeV36K^oshA2>fxr%
z<_d_qbnr`3+`Z?WO-(8D*0tdW7Hg>EW54^?WXbT}X==;*Ypf7Sv1cTNA*Do&rbb;+
zlJ;!;(TOmr^;c;@U}~ey-7DjpWRFWJx5>aRM0%T$FvrTx)3X*tYryasqf)GYft;KS
z7gyAeaNEKT`gliDOjdR@7gMVrn)$W=$H_@HE;0BG-pduMb0zrG4e0F0){_Y;cRHUQ
z-0UGcwG8>L{!3-&{z3gKD#D(GgxfvLAQ>KZe10hbj;*aNAZ;T@2Z!<T@tb{U4*lwA
zh#yTk=bO!gkaIO<+zbYjt0dYJSC%|)nG*j=Sw3DIm_POv<l1NZ_ksQ_QdXaJvkjZ{
z!Ky9KeYVt(%DBSjIzJs$dvdl2%ije{=K<tu1i%ItXt6CgK!^)Nf&&fVzj-5B{jEMj
z!vem!2mD5Fm48Q*5pb-0JQIB%(PYm6aC;(L;a&Kj*1Yw|WbZTHsD(0H!jQuk9g9^g
zVkxp^C5MW-W)O;m+{Z1N;7~9GYPg9Si<Yk6z-<PEfPrXK75%Gpc6RnUx`BG?)2GC>
zn=q36F;g3GINzAS^%KeE(~Xt|w{#qI_(lle=L?IAPXKc*g&zN9wuJ&AJ|^dzAFzlh
zBgCbf)JnhjbM7-wFb7bjqGNOd5ORlhf4Tz5ziQZhTM+1SfoNl5*B^LaDf|2TVTZkx
zHUP7FK?ekVzy!$&yi>5w%1Sr1fQjhFbwJLd!(!rjz_(2hy$+GRn|%`0`MFMLb&}0a
zrFcSIZ3+w^DfZH<iw0|77AM!5l-D}oot<}<l`<bPi@WRU63R-E#3%u3AHx?-GXfs)
z;XEK}0VUUQhIS8M0&x8k?CSC{fc2dq5ad7#j9qut511W+==CO5NprKv{cF(%T#Uai
zL%Zdvdo#hQm?T{w$%x%jX4#Z}R_FENmsHU`hQ8#{OG`@|%W5D3v|~DEd`RW$MSADs
z*ckg{1!!2{-)jI9j2(bi|8e1h1PfqZ{*p+Dvkis;T{)m5mIrqW<YKTs8}LhK3We^X
z^9FR~E`N}=Q0xhi#j5}--%uD8C1r+2W|G?Vx+xIJq6)!9)a_X8;z?ytC^h|NRYKlO
zrp$11IXb`G#FZq9QNjbBMPhe<fB!|#7Fup(M~5^9Aaig^Y(jv)Sm_VE4w5@qS54Hx
zVQ#)K1Ov4GDil0`ExHEARC;t*2)mDgJ%CQk0HCIwi^wkPSL8_}bV4)wGbwRfyw>|2
z+su)Oh4JzG$J-$9!HbDea8k|Km|QYu^(S!cMvN^3R9eN{oEi_ER{}ay{NUiAh6>)w
zTpVC@Eg=vE>pl#qmsc@yH6<njhCtvP#Kz(&^klBe85$TIgk}4yp%9;lg#t6xU#LEd
zP)oh<VBVbby!1Anrlo%`-z^lAJVgm4O|8nnz(9{q4y0@pqIUh;Ecra`G)0bp(fTUH
z(QzGn640gAok7QV4_>}{^#V#)vJ6J!BI2Dsiklh&KhTL5(a&RIVqj`x*|YBuckIuf
zMYvSlkWdn6n%u*`=jbfbqE6-N#z6E`tdL(NZ|Q8}AsBupC&642K0K_2ERqPl`04#~
z@A0P)Ro7ErM@Lo)7}c}*c!E~`*)Z_RnO$SMXDkFLT}<Nq9|tRnPcqByj3ajad$i~s
ze!JaG=^56Tn;8DK3?s{~?;KFmCpQdWn!K;9jO}K8J)x&ZDOPU}@V!Nw${!h#U=|Eq
zq`3+uKqdL}?e)+XAAm?pUS1y4+QQQEg-3{HMHCKG<b&W~TJV;HAQ4sxnFE)@=DmWM
zkIb49Y)j^!GfuLp;2AxNYbr0tty%!I6OV}gI|>R4rWF`-s9wZ-a+!>wW3<)_#IJ!M
zDmVL-o|<YKMcxBi?7Fc1WQAe*!x{&Gka2Qz;}dg%oa3(Q>RYUjJUu=6B1d=qy@cA9
zJfFNr=dFM_Wf937ymPb}dN)peQ6u3)YHk`I9x10Dx#`TU$qTT3`?5$}^vDCt;Pd=E
z6)Y%n<Z5!#VEW_ccaVv2-$GBX9&}smRR_hNe(vu0CG)A${yS8QbY36scZOclu<&Kz
z@4l01YHB*H8d_K2>c<Dfzd#;(K7{h`arUX(thVIjiDFZ!RBJRFnasPzhYS48cI84O
zF$LmfN^#1(f-69L#i`H+49{USZ7{Sral-yCc@MDW{S4d5PD=7#?TI0!N&|}qpTm0A
zee6E;Da*y%92QT%RhkOGXM#L=(owcMiGV)p(b{9vW#zm>Q5a(}0MWohhP_v*{IvhI
zHqy}hg_Vwn7aJ>URvdaJ++xIF7@^SiGA->nGNYK6lT+U1JrxnBLV`SOO97vU$Fbd#
z4{i#9#1@J>MQ4u;e*E~BP#d*niSk!(n(xSon@q6en+%DVS8XQiA9nuo8a%)1ESH91
zMQr!Ag-#{+>Hc6VLABFl-hqQTnW&MWp=;PgV6k8<891^>D#gXbC?5bJVr0XhV8qEi
zYe3<vA+r&NC`9i~T%j|VLn7q`dhwM&1YNKPy=EvZA}*Mr<M7`us<$M9g(UNLp5gb2
zLU>pLrU>u#mUP=0$W^F%m5L=^7Q5L`hT@2XJ{5LtWLXt%$0s9;9~|8-+^>HjwIglj
zpV<Ns>thUtRPp<44@rueq+W;+>K<6M$zZ*_4X@FfOM%#5Px$QB_Zv?<Jb!DH-Act~
z2Zxw^OaA780)blaJJ(tm5+BCL_jwuXQnK0D(}oFJt9nA4V@jbOu*YU>Wa2^t{-*OA
z)-{>P&$|rGDr5>miS0prYAuVY(+0hgkA?d`|C(6xe8EE02B{e8tktu3<P8XObuCE8
z-^2e=#zni=c7BsWfc9~!Z68HPIL4h+D-1=4!y2*-IWeD-Dr@FPeR(jP(QB-q7Pmw)
z_K3T0l+CJJbp+Q*ov2$i`+YT;yjyw1AuZA~Ia^M^<UCmvc05mK-u7(PI%u&d(a+hF
z#*dodd~b&6ezNYKNZ6SAyIhHP{MRGH<}3QyF7BRYq|0VLp#SazYu9-ew!Bg2$;@ke
z8X{YJ?D$5zt`lAxM9@12!}+=>^ynaYv=<AvS-~xr-<Uc}vaMmg>p@w@3(~y{U4hU_
z=zV%Qi#6+j_}`^x*&o}j+!dfOIiq9K+4Qq81cMQ+U4B5Tke6QCIxQK#epl>XYftRA
zMf|SL&(xbubw=LPDO{AaV%Vo=9rzdR7L3St&5QQB9Ev)|bN)Law@H58tu6k%w0MO@
z{*Z?d{XS(>*J0ko0?5xq<bOo6VB!Gz0jZ`77#RP$a{G6B>A$Yof}$1wufsvGzba7t
zy&U^jdg$Mau>UurCXn4LjqyKIK>tquWcgD&;w}aT-Jhxvlo<c07eR=DVd(?@1sR~6
zcvg7)8RSivkbgmrZf7JlfrQW9Tvr>KA(B4by~FFL*vgptmh$)CQk}kLV4`vO{Nzga
z5sc6ZYN~tsHZ%Cs)8mc_D&Gw+KVGYuXRzab*LzeK?!xuG)^kF5;S5x_aDI;O`dieP
zeESU!uoPiZHKPL#5M4h8L4shGmJ?X>0^t`FJ@A9|5-^~{JpKJelhjzc&{>stOQ}__
zs6yCRf=Oa}swZDfqNCSv^bg^rje@(n$9Z7|WZ+tHQYb#3ZC7`<5ah|Plan%6F#o9p
zd&qhmWGAPmXk8&#UlU6iSOby3Ac%=pFD|4#r`ZT5-ef9Os8erT;BLKNT`d|9#YExA
z!w#Z)Xhd#=KW4_d0yD3Du(9pbw9wJs-Yz94S7*ePh87!wUy-AQc(6*dhzkn3c_z?_
z^0~sB6e4}2x!?&sh`ZVFG`bhQkp2!vV&0X`$L&@OUBC|PCz<;d98OJV-#~sTIB^D0
zZGbbPjpROUbWCKd5T;z%c{huB1{n|-DyUFGRP8NF!7V=1pXB#(MaRifxwi*nQ7DU-
zd0>rNKVlHrvb5Nmy1KeXV;@lDSq>A`XwsM))Zbu*+q^}{PunMG4sAQAXvUm?un;fC
zWTyWEmPDFHp*UOA%&4T0(DxQoK5yX~%{Lw_a20zLq4ohxBl4F%&68vV(3e=-*d%$;
z#^bm-C{=<iT7VUxz;r=_Ev1!mk>fe*>aRrJ3~{p3ju`(50$mU<{yfI3VQ$#9oir6(
z6WKO9$BE1oZRY3F^F!{67ED0EBS0q%>2h&DeAfCkD~tLeT0EL__8Bvwr1S=GoTxY0
zv%ugs{RsKtlVTZm27}iiv<h3;^2JzkYpw<B&fkuMF8B6s=hNT0bEkC5^=JY1(Y#y2
zC#KldJZy&zNnVOxIV+4$o%f$K^-;T|vWL%a805Y<_yGzaxaQ~Ojl<<z*fNF+HHDJX
ziTjJ1of(EAeP`5Mx=Wzvho#-mClDyuE(rBo!2<>PwwTcJsdujlAE6r$w9|WNgO30o
zFY0gs{#&WNGQy^AJh=x!oSl$H*CQZsPN8xRLL2An2mbBx9M}gS3lo3?y#zcwJoPns
zIqv48@tRfVg50sbBWf<{_7?eU!K|nA)OCd1i7zi}UZ=>PgN1I}2w0=}h`Oh|1qT^=
zG9vI5xPRYWB3<%)vP2-}8Ii^mW%qBVk-KXQI0$mWZ3Yn&G@6=G+V@dz&7Z5|Rj#cI
zio&?gt&3d^c_>anNdLJVBny8`Y&}lu@pj>y*zOvxWYVU&2`%YCT&i0R$Z+$-&zg1j
za;AWbrvCK(`y*Jthaaes2$9({#FdIFex}4E?*YEt%~1pKz}1wzvQNq4aY%@jOTW5@
z6eD+=Gk0`hQgdWksgQ^;L!g0n1xSFzFDg~EZ}XLmKQGXi;ka?g&uU^<-(?g%%g3$2
z+6$6oBu5j0x&FrPTmw{hcR{80TN3=IXvnPo&9?O0uvad~loZnOB9l=EK^NqBlImg*
zQxZmsO7nN#VgiB_OJoUSFRMXC>UdWiwA_ys_lvO4Vhp8iV%2DXzwrhXZKRp>$a4W3
zGlcRvBTfw?z0e6}oF8UHt&941y9N^?1RyCc<^f0s155iyj||Z_g3A90nozG~%nhOh
z^J|(>P6}I|9vO)*<4x0`n)qT1o}<5HuFe+(h%Psix&jq<Vhq?64!xrb9a)uQ)mjjU
zhvbEql8D`S^Wg>^{R#K2w>RA!Zk>Wx7G2bYn)i*!k7$uIzS1RS#aq%vGm7D0A@*@j
zKMAjk7#UX*7P%=gQlA8+v!@Yy1)C@SdHJ|xY<0!`l8Gy$!tR5MKn{PJMu6~*rED<n
z2zwAI8dQ*#E;%Z`uvIRX<5XasFPklM?Df_t3@6K6@Srdyh9u96X4a-@#ge{MEK#bu
zntQP+aOa)g@9k|3)e4`s7h>UW>BaKLie;3O@ZPazY1Pu$U$%0|Ut8u&Sb$xSz>Vm<
zxQs5$Y&U!)Is#+IPr6<}pZzTDb%98hExI+=qdusUW>B=trujU+x2IV?)vAtN9kY@y
zc{w^Zc5RV2ficC!FL~t2%MI`b>!;$Q-?gc><a6sb_|K<zl@hThCTQr&+B!NefCQMZ
zh?gQxd3um*{q`eIwv>0;Fasp3{Zj@aV&OFvj_hZ8MKkLDU~18=cJZ^bQ-<Yn;jsp2
zuOHy%9?ZF%mPUfC1|#Mu7w$B?<y(aC%C{d4OBC9wpNa@@aNH(_Cs-6p+#v6-E}1`L
zSdtPKf7=^@IA!%X-@D_OpzPQK|58jrAY(xQk+%3eX+KwPutyK`<jxpsfNO%CfVbns
z+9v^=m!x;iibP7J&YsYZ##V>=`bJ#mhs!kVPS>n4IH|8_bkBA;va%gf#YoG_+I!(6
zK?l$d4ho9xKYMM`$E#mb1kVxenXhhqx=!h0SV7jsn=?Y<nx}Rs1@64HU_2CTfXRiq
zS=Z)syR@LFU?fDmx7kQ}^SBuxmGl$!jGub<v@qT6TlsT$Cyz^bCEvH!J`n{I5XGA(
zPhXLna)MXm0Yf2c3^XMBZ5ka_NHWQ!To}%EUnXkBaG>e+b&aOTr77Z_s?{yEyi-AB
z%dtx$fbf#MM1J<T(0L%;)A~e~aPk3p_RAUXQjOAZ81?h<zSMby7&SNbuNR*pZ)twg
zW^dTi*1AX1*4=$NZc=5ucx|s#kAp5tO<7rGlxQkp?wWR{k%5Ej&xY>q#C%gg$h9i9
zS;~Utl^T<(*4lBMZs@bI^1M9WCj)B`7K<X~jJ{IkU&XJ2J)UGt^0o0B)b&4CfBR!^
z|E0swI?Sid&8TYTz@%P5O2;0x>`=Y-8OBAaXfTFJU?E(oqLM^c)N4FL@i_C5aRH4A
zmqz<^3#0wpR?Ik^1P0;f*{`1~V7{v}s4xPW$y^q=01G0wBkk5@nB77?svw@%n4-q1
zi8>>FaQy+7pjJIn<Xx=1^Uiq0oWXg_u0vI29_(%8uVFQp@=u6M@uQT=e!CwQH<{<c
z5fd)9TD#@OoTgtbxiaum{mBnrii0ga%gj5+M`HTMJ~i*m$3{o*Yf|=_J{L8xN1cL6
zS*P`WivMoIxDtGau)m;ryR`TF{b|P;__~j|n1wb{=3Y;ridIpvwGlZfr+-uQlUN@P
zCfM`WP26zn80aT<Pu9~1ZY9uT@wN5!=f6LbYT(~m-{0H2H*$S<eVw(q^xXz0^bv6d
z*}Z5&>V}(U5T^rg2eq)+eD%VZ9v8;K%T)wHha)yKYrb-0DNUd-Z>ijo)gm|Xw`6nU
zk;UigKg%UW1Ydp1(#JS?Or*#{+&mt{iU@(_ucb-fgIOx%kI=P@Jkz5i<rPJ+&51I(
zdS9zFqTjG2e=RJ4Z=zIvjY5`W<M2=*2`g>a$vpY8qP7Q%;<q9AX+teX)UAazG6}Jr
z3$L~CajGXOLTb{>j75(4b13%ZmBOC=%8NEKaxmJlEscRrFjC7rGW{^P0-xkdfK|c*
z)NCd?IScP-)j`kwkufZ+kX*Z)Da-fbe4wZ`WWP7ORh(D|f(ns&f0e3HIzGHqHZ!pj
zwN*Rm9x<!tAvM7r_}RrH!oK83i#Nv{(}ElF{5)8WcL~3^6dvq`Nf<*;LuuR_(B@e}
zvz6%}=&|H7Z%2;YYToVE$V=Pt425NmWw*F14ZOy^UgkE9-oMWVu~Y2CHjm5X-pl#$
zjqnGgZ1LCT9}7L)t#H13#fgramQ$<O!U9>cX=jft5F=A*0?Hg*FOQ!VEO;2iUwkg@
zl?sbGv1c>eO3rGma}p|gVEy99wHd72&)K5CS`_ZaLEES5le0X!<42n}V2NjqH;x_L
z)?6U5MsH3BG%)Z?aDqNM6CFcQB|D$X#<^mkxLt@!D~4|@Lne)f=Hk1~CO$6To$GXd
zrJAc`yyH=xs&uYvrt}?ovQ>=#^;gZfe=lNJ-DV)HY393!+kjV+i}p#3vS!blT>FgS
z&@8qWp}9Iz{uEAdXAOlR78oKVe=uzkBuS#SpNlrr%)pI7bY-)x5i=2qc#~vrC~0D+
zl94V7T>_nC5fP#p)^v6g`dw1x2N|ZCpZm=Cs=g7*ON6)7>ai4AHedU$fd)L(ps*$e
z+Wk>uuRl{en2GFOMRTRWo@$8?8*@u!=2P?fRrm%ATb#vj9Uga>*^81I6l)VYwDKbD
zO1^e%mcz%n3U`i9SM$pqmaHbLcqplb`RO?pMGQ^t#m~|^r8_zCe4HI`^<Fa&BbR+q
z=?+DPE`8+4jie7GuI`q(S|y4`ir+Z1mIkwqAv<E?H$wbM&Sz(C6L+(thfN#yC#<I)
z)b0LDu6c}iieTA*n;=k>R08ovoSuJ|W2Wamn;?ZNa??h6sfeIEzj*vN1q#9L&)Q8p
z@q2W)JW>O%MI5I>v+6^Nm5E*e-mcd!)&qy`=DkEKzK2#5tA^R9_|V5eP*k&HzLZl4
zb#Bnks+m-^AzhP_rtHw;Cy22iy-qk!;x?>Nh~`8eMi6bCp!*!bjo8(i(g+2+{10?b
z?nND+I4G#k+R&YoLSHL?89m#<jA3WX+9ZuN*wM=(urBVWh&XAPKXF8wG}a`ki%x42
zq>=F`WHmBnPs@CkNT04vYNjd*p@(Z=3x+7W*p$y9>SDE9*gK35)eJV8@<O?a9Y4rO
zO+>oDREq?Ah+G|C=sZ6$_Bfa3<!<{DO;YVyL}Q?vOhDexqo7RDzgID8R>J4RF_EBH
zV=u@ApK?c0_9{pGn$j)H(`)-kva6OK&qMh@swzYD2LqkD3(6j~Wj=7nPn49tvc24s
zbOx2;U5@oT)NNDG=ZEN+@}0OX6%Iu_Z=*sH7>I*@X@u%~Ex%2!4mM$XQxeUS;AM|+
zDjJGy$fP&QIhnq#uOPLAfYM42Dpc1{<vOVT;wirT4qeVqYP7UyP=Ai#MdaqCUD)sM
zFD_LNHZV?ZuFmJ)x_DQ1(xjeVD7b1EM<Hj89;f<m+6;{OC;KIu2z57W#%?O+?4>Bm
zHIxNfPme{Ee{A6ik3fikZ)%3{YRGtIyk}c~(Ba)Hpm?nHy(5v}g?8hE+?iukHZdOu
zT)ScSgK+iQ6;>H`xyhf^heZVD&FezqViFm7G5_sK*4i8N1Uyq7U1V0dpDnqG8Ta+u
zPGt(Uht+#{?ezF10PuY+j<JBv*+b4+L;9SC^}~D&(tJKCe*=c{UW=iA5!JGfdhtx)
z=a-d_g)IafRCgS4CB3dbdoB@_wo-Q&HIA5-=ndpFc?ZM~ir!V`pJSgmd7sDd?CWHV
z7&j_aOZw?!*i%BL!|$zc9WyXE*x6^I-t4>Kc~4wayM`X#yeR6{4BG!rq;W^Cw=&UJ
zXJ6!=k|<tqpeDO)7_-p{OQ@nF^SvQm{`=>0SCIybS6yrzJ@Kt(3bt=4-_^a}jolsS
zDL*g?YDYCCwI<uEezjtKugr*K4Y4Ts)e8B3J0S#z(GI5G%P<T+SFhyw<)JdfU?z1H
zM*etUNoRNBpfC5aI;Skj6A!(9xh^*g(bqfuy-A8*8gv_@^jb60t4|!XIL>n_BT<}e
zJmEl@d{s3w7TR=0h<%9xJ%jhSS$l`x4G5N8Zb+-DFpjh1B3rGlt1kulY`^XdXSdM3
zv6skb#U1*2eZo+q1Ko%eU{dps)G>*_F-D>PgTd`TK-(~pzp8qJLgxUCbhLxw1-#nL
z`bYEP#O%Ds)LWslQVM_INcrYlLv#;Q%WHX=`}1}cAIS^jT@_y#1n(61QkWf1T^v$9
zV~@O%2_N0Bv%u3R9{N!FVP3ReZh@P_dMEPDkW>$u=@&{~FOdz2o}IDfpq~ZnHP*3K
zFgDYo-JWGTT(6jvd8V5_!iO|@n0YUIU`TA84y>o*<`o1=A*6QE-w$4;1RhdfaP6~(
zdJsKuAM3`y*L8mPvuUY3L2Q+G1~$!dQ0w$jUatkO7XeS>A&$${A)!ET&OQ`N(K2R=
z!VSCYUJ&W+g!hmA`)8{y+F}U=zHoQUd&AyYkrge2ik%xiZIC!CShLh?B26w#<488y
zsI2rB`UHK=${U6k`VFRwyW{DRVte-NnX9BK<&veBUvkPEi`P3XEhS&X$5ah3gmDTm
z>#+Y4Z;-2Sn9n_lRz7G}hw7LH?l@n-I6hu;8LD#B9gdwkfBVh5n?0d6k^**1@!ee_
z%8=(HmMjz>AKi0rSQsy<;q>-dZ(6aX6KT*rIkZY)93#8+r;Yxk2TF)$wAEos{a3}j
z8DS!SYSW{O*#ED#HUHDLmZ&80WLzZz1Gx#sk^{hN%q$*NXw;@E)?Q-9{KD|L788L-
ziRHS)fL&+GG;9}kComG5wmxj~7B)H4ZLxO(n}*RGI_fauAhApr=2nR%+agsTbBc)N
zFGbJ%O*#6Pakad~1z-z1wbgN_<4ke5aC#;7&yG8LvzPD;YxY;<CXpDS)Z+w2-({7E
zVU<|ivMdWz@~;DK*Zb{u&Uo`CX5_eiI<E;C6z6`?Id_MZ*EwK0RN?3IPA#Hd^-sUw
zA6vXkwcg$AxC*EBxuYd~>^Q)hdurxdsMjf$xtiET_QUqa(0m5$?MWE^{=%_cEprpg
zC_!6*-Zyz)9igfPE3DX4x|bW_m%i6;e|<ZCnV}c3P-nOz+SwVz9UBa>D0&W;?fRad
zv<t&2#8TJK%rH45SH0+d^KB;LM*4uzPtkV!S%+EU^6R{N+k|sv=M!vXbkNwGiS(K(
zY?Hg+@+9j$O_uE+-I#vgg()xboE_a!Z~bYEKaD6Rn6ZiY&y5HZ5CluU07qQ|Tq<xZ
z;-UdtQ0f@0^rD$#tUs(U5GDe<B4CbzQg7=Ib_}3lfE{=IQ7iKQ0geHw3;<UEz5)&w
z(6EH)(!A)R&Hy2{{sS&&|G|_2F$;iLvOf?mnm&dB0V62h{Ff{daLxd42E?(+A0QcE
zvcv!6j?>WGF`A$Kfq{WmCHDWLDl?i=1}HNLx+*h(o59*OV3oo0HK2~s$nn3b5rHHS
z0MI}I32^5_G^`6S<15&oLd$6DAJ85GW*3e|i_vPwWDK;_5b)Fhiw3AQ;DP~04bW-P
zKU^;h8U;pIzGnP`TGydz;1lp)fPN83B>_YI@Sl>w6$}7LqoHiTRtx+QB98sF)~w*_
z`$*3*gSH9N=wDZyVIt^C><0hdhjK414Ess?i|4qMl*4&@!?k%H%F7e*hqr~rGH~I9
zW8GZEFPg=`Q3_N0eR2N6c{W$3{p%|kM&sn+Q}*Wh^8C@^(VgMEB{de3m|NUjxG@(z
z7rSaKM{?6(?GnAOOb-r3b2BU0s)vc@gn(t{b3j7u8dShR5zTvm1_nmGUNrlQb~<eW
zWio&>0@3<8ZqwQwbX_Ts1B<SA*9}&vLA5)uknIm#Rw2P)6BZOj1<cMIknwpIz4{b#
zzI!)2bn3^hT)JyW55lh}?-i>z3jBZ5nO4?rBgIoOSaGPwq9F8YteJN+3Uz{(9A%vl
zqx>Uf&dQ*RDyic&C)pjK#u+57744eCHY@cE8psf(i0jQ1Rr5e)A3Ka6dc^hcA)m<F
zVD3(U16ZEwm}=%fofXogmz(iyG-wFaFd=G+MN~Hj&<pMT-`4`9J=X`qVnjDyZ^QD2
z;Z+`}nv|7+b%w1xo(}WVH6<oYZ~XSIK|!K5h{CtQmM-nSOtvxt5|pTcRGzd)e#iwh
z?kyLTqFv<dNms=8aIo8q$E~XHO^Q02x)&b*0M+>1(l0|NuBY{IXmC4e+#1wyg3P#F
zQ%@OSnMz+k@HMdKm~c(jON1_}z>4(^*imc?C6(JX23o-ZlO9rZqqR8aBq$o%t@-y)
zU*+^~6T9vMD!aeztD1||LciEP3po%w?%kO}Mnf&6@+@yx6gXyi{6?;6VArTF9up%?
z>#RGmkU-FNHo0mUs$x?Vu9ot25T0(2nuW6y5)dpPO?2DCY4FwPp02=N*R2V=^N}C{
z6_G#dsvea#zRKljU1*ufQ3kz*N+(xp!U|(nu|xLG_eN@m+S!GTzaO|)0(OFb9lwPC
z#>~0U8H6i(pne^$H7XC|Juggy;ki<pa?Nj$K;}P*iiv%L13Ol$fSjD%-Q-zX(q4ET
zxQr5ZLi54k(n<9JnB0B)`3?J;9c{FbPQ&Gyn!J|9SHvAW_D?<wJUm&XnU6F}(YqZa
z<AYv!1=>wtSu7TJ-}&omRT)D*VJ&E(@tr}qJUD4IJE6MO(d6N-rVHcObPZOsQXFtN
zJU)(XQt0d@j~%ZSzk4lkiVdn~ku}SJfbIqzv1-DM>EF~E#~M*KvLCCL#`k~mPMZ~(
zfEPlId*OZ_D9x3%-00!ypHa)+ad0<x<8iR=9yo>5=TXI0c1(&w^huwMVVt2_=?dOT
znwLMf{HDom!hu@9*$dB}M>KB@z#?DnAMM=a3o?ul%^xF$yiQ4?pfzxU2<G4-UzRYG
z)xaL1mhoQl!*N^J#K!HrSmAo?rYf|V4)Qj41Zvn2P-xIm4G|umjZlYK1z3BvRoX{>
zGEw37so~!;)z<pP2|f{cG{u0OC4LV-1w!p&2dmN*Zuo%b*SJ%=w+Rm*qjd?%D6dly
zfHI>f9Gg6;Ki~9bAqo4yHeV4YNv#tF#vidb!(6brGj5mmz4Ojl$Oc{;A?BkRXg!HQ
zjlKuULged!*9BSMa1cwo!T!O)J-P$miR68}mlW*G5frsGN)V44Jc!Mt4Y>d`7v&Fx
zl2`H1xh%WYex?sOinHLb_q@`@$62wy?rh6jsVeTM;PfPd;t{VXtyM`-#BVnk*%VDL
zqDEVH*0?asICRcl+2#9LM;wK_qxcMGHzyHXoP`MP@Vv2CNnlqNg^-m#d&R7{15s%Z
zlO`dBP#w!>_<^-izVNpe4B3t~x2}<t8&SZ`n6K4PeT-s2^PLXJ$VT1?fw#w3xKv#c
z6z2&cjTXgI3g3wRL-OEZVKB*x7}v1|=(qlqcDjkT&A05he}bM6`zkI<yWZlNY4%(C
z7MoCQ9hDz^kSzC<R)qz7@Lb4H2zqJr%~u&Gyvk}TEoKfFHB%1pwqAIA;TVu|Bl@??
zWYouY8OGBCqHsRMm4*P+bO~(sC)FrMJ!gmOr1()i4hd}gM*DIJMnlQFHU0W*R_|JH
zGKm0`5`B*nDFY6}4eqq>^L8@5l&2!cB`p@A1-+U)Bk&_OUP|6-gFN#YEj)XOF&F_)
z)`m~Vk8gj%8?K&8cl2_zI4L`D(Qfir^RO;|j`txWz21-89+|GvR3q0wAYRy;7awOr
z|2V=kzF_8dj6Mtr7(wEe0f$MgZ|Yn<a9+@r57xjw*N6F;FD*j`PWF^FO}&>Y!2tnk
zE{88OvnX`@k{3E2cg?6@P4vJGzy+MHz0%!`6!6aQF7=sE@Y0~);~8M~zLbPY)3+4O
zWR$~<pq`$B&@x63+RYKWw>Rqvc<Dsn1!5NVo^||$)xJ%c&G9uPopPE-9Ip(3&6BvG
z#b3y|SV(!V4uOtpW8;v9%gh*lhihRe-jfIu<t5)A?Of=wDO>>qH(YUN8y+wb6=%{}
zP_6(`_|-mbW1z(i-l#xb>(oNcTeN*$Dt4pT5Wz3Zls`UqVBCIea$hr<*SzrK(T|Mc
z?owE$2{{U3EiGYMGd|)VSZ}~sV{LT<BApulJusJIPlg>XPR;lsK)x#FH}A||wClHd
z1OOA|uJ{9+#A<}<Ya?dKTO?~VkO|v<J#Yz7Ha)n}c=3G)hHf-=AMaVgB6-VCdycJX
z+Z}~P`=Z|UnCl)OgLYr0;x18(R(l^}7bYQ*cS{n%9!H(;X>rV?DIZtodp?<rwV;gp
z_R?RHiwqCDY(yj*D&Jqms_32^W+^3`YhoRb;e4kTr5liOb9P`g&Pah<Q-!1+7%4f(
z`T*vaMFH-gSr-Sp#%T8Syj^qQOr8I&67s6l;pTd!l_Qp9k8(x4%q#C6I0pg-1;4bd
z-rw3a-jUk})b^3LIM68!;u#o_ISl*z`U(SMU~WXKBeE0O2#r(jdft?vf?9P92&WJt
z+NzH=WCIXhQ8^cBjauWEPwJR{4h{|xu3*%-72L=~vRK<X<NRc!H7&!8W_4C1r@yrq
zi&|5~fKSx!Z2~v|nPv==@yt3QK#6)!%Cz<N#jlTLgTDdM$R%&(QuTr??qc$K9!p9|
zDXUNX$R*Q@>$OippME>AF(AnL)S(d<@aJNW&0^Re%-nEfCi_U$1olPmOvd%^EqCT<
zlp4s5q+}tYpuxVAG7?`epg$ZAS=)YDVIDeoS58eKf^bM+=N1awEkT(f*({s|^q?&H
zJ>FO-iX(5)p83N3CnfdR`!*M=@`iZ$?_8Q(lUhCIWZ^WOa&|U0woLGp3DTo2{6y=5
z1)nTL=ItO42k_sC4d-d?DcuVa?ArlOV<mo_tJT+UK#+0nf%=fYHV~)6Zz8ksx&GIj
zTu;hKFavD3B_M}F_LrvX`gdp;{9ewSYoYS9HveIDxo}@Mw{0{Ai*C<Lw*4`^nLNSJ
zg^f33#CvulPE9{=c@FfY*!7hM3-0`S)85`G1NOD$F+q!oh{(uXqN}H-1qe<_+M~K8
z&hlOzRu#VqkB|dZ4?MBhPuYjQR*k^hk6;e$(r@j`dadsIju}JdugKzhSAk?1@Mb!g
z8vvk0i+}~82~gC_yv0(@PUSeFFP8&ry>u|hF%yguDoi6X^*)OxGiVFG<x4Zz3-qlE
zVA~j7E#47HhoV^DdiMj%<cG`8(&1)B9~_4Rhoh&j%h}^h6%WaUd}OJ8V4lIjQaeBI
zeF72PYEMrO*a7}yw}t^pHo87y!peZww`i!8Z?d$+*XFCkt}3JMHsWO@k@*dwm)eW(
z)q_in`LBOUp**|068t@YvMP?^5#OtJ4l=xP8Ga2U+T3bxZ5;}vq>su*z%W0PBE&eA
zm}N53GVYPuBBuv~TqxkUG~<eM)I7n`=nzW`wxl{<$>J2x2bNEn%#lR!o|a9y7UY67
z1Sz1!9s;<gAhZ~XP)^f{TUVljZ03E@{yZ+D3OT;%-a4BkZ5MyX_esP<mGa&YqDckh
z9U!h&FEto14SUiK_WRJTY4q^4TWP2JTMpZ)3$p+{d87O@3-~j6y9X+qfh^KLfBx@t
z<6$D`Z0!FrjW9DuucC#Bs*T>2kZ)5fU2|G@sSP4dxPR`b$!M6x`Yu6ZDj-hp(_D0a
zKxS{=y8;SPw>Jvj)#1StJ3C!^uWB1l;Fs&NTZypoNWu}%yEn;)1*FMqa-JYEewOD;
z@zj}n%qijRC_2@Tz#^ZeC4^D(^Cx4ZNbaoCJuVQ;#T0+JaK>cZ^w6W~211H|_da|R
zqchm(ys%)BYC7B{8soXn=J`C~>Ff0(5w?dO3i1T=4~bZ+r?LAEX5~GkG7%UL)%G$o
z!vk@aNl<)ztU)w#%rADcS>Dz%yD%RA4u#6~XG%<L{GuDbH3H+doTlO}c+rwn9?Y}W
zq)lG#t9THn-5f&AU+9Mt8=!Ny`XabwL$Fl;3s^AkzB!sa!RN9omS1v)-wE5}TXp`~
z+n{3#?dX*+yTXhrlxWq{zr#Ip{lWD+cHUh&O@Uvwa#62|Jn>`uRL>_Obo9PI&EzSR
zCg43X#(!IVK1iT_XFfN?^v&UIE&RYh-S)zWqLE*&Z`4JW*lQ?OJ=-=PBC>|RQvDLl
zd(b_F)C^AJ^I5!pC4Tc!i3Z1y+QwQj8B#a?JtoiQC)YB97?b~+&;K*OURYQlMOTD2
z<)Jo7%BNw%|De`_34y{10BZXG3#7^*Yr?en_gO7Ei~N7Qj=AoSSH*8dZV@FDso_7z
zx@LjITDrO-Jq=(=WYyGpH9pFtvQMee{$a)3if1U}1%OaC!DQ7u-4R4X_SP%?(qnNd
zhI;G5IU^f7i3Q~<;K!iBk`Lq`<(pQ`1a(?_iRJ+CatNIV1Ou4W*^}j6|8{_pf7<nz
z%k_u;lF(}3$j_#{Rs|<*hWdTay8!iE$EgJK#n<^<h8oud+#U44y-|VRche)73+fET
zgo@^X6D&y$+=zx!6`gJ7AK-;|bL_HMp`1nngg{p0y<Y*$MB|aF1#k4ZYhnPX<NoaU
zp|}|zSvBmHD2|3LzFP@A3+bO7%Wk;9L;k`dwUlGa&^;aL*|HfI*|zC*V*2fK3Ho9r
z^Q2v!f?m5t6!6k|8{`!6aE(h&ezi?^8<Dm)zF>`3)5xiZ_J28~3T$NVeSLpO-4Vi^
zxqVy`PcZ-CUVN&kDawR1z-QJ(u&<BzMYFhO7L060PSYE5t{lbu`%4MD4T;crpTZum
zx2Pbe5p997H*D~_d0Q=h&6;yicC#hH=dPyvQ;t0LQtd?qHEl>&lBkoKGF<;~zG6;A
z1K$8;BDOaWnD>>#v%>1iWYItUeM3NADne}zp@I-2J#y&k5>te~{@QBBQ=s|4wa_PZ
z4)#h$^z?xg^sX#dDepAGHNa=tqxCb?SVGg>-aBOf=Ew<#U#E4><H&j5?VBYHG%9C7
z()4KvJrvv50hK2m>m|{%_OpIaDG?X-2#l*iBlsH^Wr8aKitij6u5rFlDOXGID8zm+
zAQwEGmV@B+O4?##5Tomz3m&)Fh@!&6VM1LT2Gpb_aE9jHojw@}cN$8U$tVx*684r(
zmX7A@F-}}Y+{^}X_nVCFPCv+4US38&MDXRy0YgK0UYcePnd56-gpq|Q1`k?vE0V$C
zFI~@Vy979)fu9h$VL&Df7q@)|Ke*jzG40rV{h&FF!q08(iunUaO)A0&RR&ubAZ4F!
z`Rq+AEB`e1!E9**+{y2{%Lw;)c3q^)9r(*?m&onj%@TMi(myYo{i|<>pFDR4nSytR
z8BajiPVSdyJdUlylm#>4rUFx1tOb1xOyH}<5WH5pu~U;X(q5_$9%e_mObm#ghgc2!
zxCrCI;n&nZ(Q-m75H*HJYp_?f0rHE#D-+Zg2YUr<UY@FfkMghIFDi1p$MvF<CQ!U0
zX)@gnB}uJ2+WSDD###3)rqedE5nIr$>iwLmxkg!Oo2HuXzLrLC9b#mQzW<xcmQf;Q
zKRqv@ek^+dB6$$5qG9nG>g*bPG%Z3`7i|HdD@Je;4Jo>bi!d7egl*r|(a<bG@Ft(G
zg;%okb~g7g_&^Nl6w4Z`vSbiO!LMIU7pH}NN<*|Vqtbl|U$ruLoqD}b<nWwWOwc*C
z&9zl@?QCwJeVXQ~TRz1p>M4(Y4Q1Ir4>+1felh8SZf<Q2T=WS;v%g>0v^_!!xrCxL
zXmxb$y*;K<uBm_$%P2J{?bd+F=W(L$Jp5wEZTh^$?cVnR+)?{U$82@=HIuc|h@7iL
zb|8Z44H8^ReGzHRZI%;tNOA9cGWJXLTt<@Xdg1A&tg@@T8|qh|OdCgR(aj~F&o?5b
z7ek|5^`rbSYF-uDyU1nVoxsf;Gekx}r9j%wQ%WhUfu4F;WW37?7U@1oiU}kzn^I)n
z;4|TDw?5JUnv=lpY@TjxJj3pZt=0AJQKvOwfpU*^3`#u?NhNGYovXwCy$HOv(2y^A
z9bg*vP;#+~{y`<a(jdQd20uaEh(T^i`OE8{fmI2VJJUxBg3-u4UH))>DrG|X#&UXp
zw{oy-K5R^WTP#?`(6!tRm2<jw_C!_{la{u{I%pOC&Ye4IDpGw+iT<D>P=sH@q7wRz
zMOtF)`>TZJ8icarb1gUBlolt>pvly!lL5U{;rk(OZ_^N3a|lP~mB}>*-rUujMef+S
z@R}x>Fj2gjo0nhzc@9D=RV01Olc(5Ou$E<&3I?cF2Aia^RrDwmd@_6*kvI_8sQ>M^
z!+xGdZ5X^mWrLF|QuvmP0aDN$Md48{1G|y0I^^Y9!j2539DqfLs>PPVb-+7{sXLle
z72vUW6ubiYV)C{lTeM7>bW|@to{y=1GJOk)C@3cEo}!O$bLsH=E*Z?yCzTJQo~k%=
zL+X~{r~Ub6Fn+NT%ocIH&`yGGjg<J;Fl3hgWaQs3)O}KOzYGekQ7JUwgcc%lS=R@Q
z5d6w_+Y>ye!nK}nv|t*k#PKWd>2eQ4gU4w&cSGj=HI%*Bj#nvW@t?M)q$f0g(mJo3
zDxVYu!{k=rQEF<euu~`OHg}Q8)Z#1;_Gze%Dt9&U0n?eG5;nSf=9X>_6y$lw&3^p=
zf5+4NIFfU>9eE<Xm{Pv;GUEVVUVEo~Q{1AQJvf-|ndZzVk`}|#OV(y6Q=YVAF<~Pw
zs1SUJ7`wre(7X~qfPTx*Ew%?d`Y35zjs%S0*cJ&E=O5#L!@Pr+E@nSo%DYy9_Yz7Q
zwn>1wBJon|o1fd}Bk0wwUG_iEg)>0V*kgTjLZODPtW@{lQUzJBLSH#KI)iB08gP95
zN&KFte%UH~*(o~@e(hvBzyK-L0{!VvxPR7iF>Br>ny6;s+U@W-lf4wX0=oY$#XYYy
zXuPPa*a~)x=WqJJl~|x?mxZ1a%8b5#k7<eJ$#c5Gw+9J71~hS&x7E0J{l5N8JsE{c
z#aGa6$yC$xA~_;G*OOceja1;NnNfSk5B9Kkbxn{eZm53RQ-@;yI1A>J3#yB0JtMxy
zj$C%xD3Ohz=z>BCbJvs>Xlqb}fY^mFOMsIIEODs|yM(U&t-qZC<RucJGnx{w^gYtu
zF^l4aeQ4}uLy1g2&s__?N7#+2=$2cqW~c29^7)E&bHqSJChvqcZ@Vvjs4>;Q60!Tk
zA@svd2>e8v`mAPipi%5J_ada6oqIP9>3>Bj(^f$FK1SE}D{1!uj;`-JiX|`mjPnC`
z*6LNY>2e1XBt`r*Vj$RuahZee)pS&q>b|`+d>WS@hqy827F}A!uTOEOuG<c!+9<?x
zU+%5_WsvHuv{-ES%zmz?hA}iGL}UejDf^(F`^57377^h}oMMkVHoDoRx}mzi2~B-E
zS^k<o{L|VaC?xi`wnyl{*Y?0f@BQxqTe>#d;`6+GriYdOt&&%`s?V0rVj#~_;H?MJ
zPv0af-61WwxXIK-VL9CL)Q;YZ4OD(n3TL?S*FPMU*7ilszjtOchsS7ooAh3heQ(n+
zpXXTS3HE!&eA=mgh~RmF72J8ryNcr|2cx+`%)SU|lMf`9Ia7U{GVB_4tK}N4^Py1g
zLPC&Dlel?ZVQhV?f%~|QV;(u_25OW-TESCm!%pB)tj*B=V!=h`SJG`F-LEZsY=Jf(
zwIFW<B!;1i9~d@W7;P*m*q6TCUO%##3dZdu=#nTX5^~E{3d>z?zpy^I&AU|4fiF!Y
zCS0M!9s1=qg{iA>EI%nWolW>ay{~zP{PO)h4PQSbgP<rc<JxcMz{Lmqnu(nizV1D7
zrvvz13zm537NGd^0MWBHK?$+HCvg8K-OvB-#e#{VQ-A(P#GIw=`TqVb73j0nS`9)y
zW4dA~ag+3|1jj@pPlZzYr#mzi(`h$M1d|liq!r&BpzfW~pG4aoF=JEL>P?8?e}+8&
zVfL^_A&95dgi(gVvg##0eyy=uBK90tNq@LI`Q(Fl&3Ic4e|-!l<7l3KiHCUvkBbel
z;b0cVRe3Tw9Q<PA!<!Q7$6Q|!+?7nri{~|^$k(S|?_xcrq*pQ4ot(eb_UM+t7|Hdg
zEdw*8!gM)|N2;nDu2<vzPEQu<sPki54TB3xXb9~X`n`4DQ5rUDf6>j9p1a$Qs*DdJ
z-qE$58wzwkei=%T4693;5zTGZQCu-vbY-qH5RLkjI)W?g&wgdO{3Ux(WOph1ka17M
zZ)(rFR@H>|xUAkNha&A;j^f8vR6wvZwej%>rTeSx3^&@rU-R{>{By^sbXFnbE9a0`
z-g`4I9w~mUm{{&;t9302f&RqZxuL4{4_y<QN=Wf=yg~7&4gQ*W|6Q$4NaDYCU%^BL
z|3e$fquWp!`i#t^RP5<9BS1Q+KbA4b7^&^QA%nRSt@MTKwWs2*95QKABiCiOweo%a
zSGSb#xR3SJ^I0`$m|8tp2#763lOu2N(W)z6&xkK!3?EXNBzot_>>B;KF-chI;ey(q
zkA=WS%*sL<0}`Z+oHhuIEUcqi3lnSMhTkVs{I_?JDfE-Q)$S)l6A8963mtC==bxyV
zA~>?6GMw!a8Td7dF1LbyXQ$i#8c~s$U2flR*6H5cR`4SY*grMgPpeEfE#aSgyfnDB
z9xi<B&L`t~<TClj!rb*kq4`EqzL6(k!-|Nf?W3U0R4yl`AiSv#%F9=usH;_J9=ujs
zNQBv1;k4g_<{mye`q}ONJ#!?=cUOb36Ed9#E^h){-oQI>dDKs6(?0pw`R!@^xzCUX
z1D0E`>c?V>Qk8lA9tke)2lijxN5w8Yeq!F3y}ys{cI1B^`JW~e{=3@=r@Y)3`cKnj
zVbT9Di^u;z<|Gj@VPO1QQqupdGk^R4D(%bTq3qtcN2Nj=g@{Oqkl7cK$i8NY8d4Ev
zXp(Jg<*w{xgtCOPuSpn#BvO(}*(w=J*-DnmS}F6M@%(<z^K0gLKkpy!_<U|>&Yb%!
z*SXGhuKV2A_qre~ikpMd#{-A(TXefxL*-<*G&xeQw4O}bIl%fhW@R01WNDam=>^@i
zU-MMCvgDv8xxDq!xR2WJBsFrDd2n)<CK146t_<90iBkOlvtG3L4C^%>wNx){(7F}Q
z$VZm8xg_S3e>T$hEHFgk&+mtJ#ub!UuZeTGX__@`Le#mhDof)TG@|C0)>gN~gw&ok
zXN1B{t?v!W^dfWL`MvFjQ~1iOg(FWJYkn#FnJ-I$TU|)#29NAENshe+<<*dztkkB6
z)sk&;+P@Z^WelgtyoAacAFAg`V#D-vW}2W~UYsD^_C+E}F<(U}C<rQcmc5nfEc!i$
z=4pH*_aOnP^^6|g!(56yeRxAD@6OdGQu?_C&r#M_v0aY6OJCoV2s|`C>}c(0SGDCe
z@w4u{U0KSTEkSmfIVCLV1mL4-K<bg1&eG~7HEZkVyo%A}js0cSL45XW_ooy+_pwQ&
zD^qsKN0JvODU!R7@%auyG6lcs4ns&fS~1(#Fx4iyzJJh8Hj!UDxqoJTwnK8(FS=a~
zN_!STk-XnFyFcz5ZhJ@d8d~p}T*H_p%1ipr@@l{BtwwKi9CUZc3Of?ZHt9NgunG+Z
zlH1MwgPtol)0yfESe(AJwSGst&yI5m^bMtcj<+Avr56}3@#)W@oo+wHnHS2AD%I#-
zrqA_aBf-&odVQ&<tms}73BJ;Sz&Kw+J`hSeCh{>o7f?`PNam~d^(+;M<Hr%Dwv&_#
zy9sgCi`pdXdmAWQ1f$4@96gk_wW=#l^p)>SrmKs;Hg=DH;&?fQY8&K17S<MZp!Ep6
z54K369#V87-s*vvYC2xi2SR-_s^w~gDd+C{wh(V1O|3NNS9b-+)R+3mejGE5xyE|W
zdoEGf)ZIlPluUj^UmTfwsnyeO<a|jrQ}^10hhU@FFPut#eS8m-MM#Ki8Ag2HToT;w
zqIN8m{&~YETBLEE{B<KDep<;GL2<D2@H=hyf)TyR2{Q=&9$9s+Vq&KwsRL==apytU
z&*>*AmiZ=WmDP1bof+^Pla`a#@FmH5TRHAn^OdSqTBErD<_4aVVw#)8y|uEpcU|sb
z7VFOdXQ;Jxa!;AkS4oYd?;RYK?kf}NcXh?wYVBWw72#GTV{_j<U_;mR#KhEt!mfiQ
z$~wgIUs;fYN#gR<fb?C`$JyFX)f4mL7Zh`sFkSrR)xMD<;4~=D9i5gNu!{b`_+pvW
zmcE35fZufOm}YI*!x8-JT)3|bQFdXWawz^h0Lwg#RVXPRb2_&E*@ecLCS%8EYV|=V
z2Q8Ik<M$PoT|}b|7!x}uk1n)n{SjV6!S02<MYB+#DzDm`dfix37<z#Cr9X0DKLGHU
z7)RHaI>>&RyWO4!{}r{qil<7>M*h+guZ2MT&AFc<Bo&p><&9mz71g(@qDGXTSEPIx
zJV6k;7x5|RrI6;(P%uxI-Mww+qXY%7+Ikns8Vco?mRGC0uDJ(GBqhDmc3;{#(A;@L
zF6u)!q-#%#+N2I1LK9m<$)@Gi*JDRYZ)UEIup%zIq(&C{4mslm!cKQI!6sy0R^?j`
zfAfDqr}Z%1^k!TOU%BLhxFl1Xv&;ozz9THcy=H})(hZ~LuF3Lsz3F4dE-jVWNoTKJ
z8~5!|O<w<j81<4vgpf^2@=rl6c!^D^N!x;;x*~ho0;E%4w{`Uoi%z-MNdoc7_lwBb
zv|Zgr>0+zL{n6rxDM|k{@g2&+FDBai`VYo5#>iiM5tW6}w-!(j@yRyi{d^L>9j+2t
zUur0u^8i#IR;!>kuQM51Os#84opq3PJXK(E3Eh#qY98PiL&(*W6b+dG73Z!#JRekB
z`1sDVGuT77OiXz;Y@~H2Hlho*t&Zybvbe;aEL+RMwn*tnVx+#Gjbjbn#w{>}H<Wa|
zC?SyIy0Jn^XdYk$GssmvOe6i7g!9PN^DeV3P92ArPhoWU6#1OoEa!zr_g%Ph@JPy-
zG&8vncmr;s6DKKoy90K;rP24DhH^x+b;+%I*JX7aka4?Qn#ZmU9WMqai>Zt!11~#%
z8m_C_F^DE_+oqV@DWglbK{Ot!0EMKPiGgf0>0Y^@x?)q=SFv}D1$sy?6cmVKd*5X1
z<`#;eFoKniC=GzNbf{)J6U%y-pLJ(UqDiDJ;rlF~j^)gekg0`92cht7s;$?RZwjZ4
z7YP)a*m-yqc$w_JF|DgZ$rmiB-jZ(o{^3H3zv2Py3m|q%kRcn7nfgX)f$C6ea8vxb
z!8yT(*8`m<Z<vMwykxC|dk>d(kGzbov*e$hpRWRN$`tC$fj5{00cVVW+{UA49ZX~P
zTG@*Ad;5K{zJYR7!a#h!YLed~$nKL<verkgZmSaRg<mdmAF@&|4bq6xuXlv2XEL^R
zg+CrJD;93udV+E%%ch`;N{Ar|6#d3D=Jptw-bi?Io~MdA1x|n+i7E?>&iM3{>*l*h
z_NY9*5~^3Qs3{#nH7iXIg`ap}!0T4|?hKOBR&V+=`cSS-VmBmqR@>b{i_WN2Q~F$p
zmND=-nvZE7FjLyuI$V;J*RD3?{ORjgUhUO5VryqntAwTCj)X>lag5c=c}T}BQYUvP
zKEIqSoj2Ox5%I?NpxgZ6b+3fFZa8|BSpdbjVoS!+`{*I_b4{uKqx+AW+@8`2yxhGe
za?Q08`7TRGkHlz5zd{a5lo-B#F{a0VU-psfZr1dKDy;b_wKHwvm)(q_WK7f_;5<yT
zTsr9d&w@mo<@7#oTE5HM?`;!v&!!~LV7W7p+D$?~mO3abm-<F9$ga&`r(u@(agWj@
zIS0otriYb`wVcoO#wXrvmoBkPl&7R#LsJg9Dp&x3&FF+8v^9S|s@`<3aBIlJlkl0=
z2_!zY?vC!#JU;bz*?k>^=j1v3HdS3SFX+i?rDIB%Dki0Q4#cYkFYROpnxu5x9U06i
zhQe<E7o2Y}Nntz~*p#Pt@6E2C3bHZck%I7FvRdVP3}p@o%BHpHUCGHdXc!dTqa`UK
z|KzUN?p`Ga)B#ORX#RdgL<ES!Sv36v)C+1SB@|1hQR`HqBRd~`IQ(nxO|sVHRAF!Y
zFI8X16HzPAzbksv%F`DL7&!jt{TX;~68{DHFN)y5J$|vxod10MYCG0;wh6w0x;1y2
zKCMR1-fxgMV=(z7c4lqRu3WRByVcu=`7T<;!^};0nKI$QLTMKw&{cL&kEz5Sn0Sv?
z6kTN7s^!pgmg`7;lR?fqM2L6ipK6pTALw6XBs%#AVu^xysvIs8ns&C`3*8s1=5gQN
znG%q@HvH)HueH8z(Tk6E3{v^s2DTYXY4O%kF7h!&AH8%srFDQ;H|TQu-L}5i5dQIp
z*^y5}_FC7KliobIa%-K;(C760uZ_Pugzi|Yzdv{T)6-0y#&22;YMo(H!{_!Yzz)XQ
z-VQ{RI~{h-_-QM>_mwPR@k0;a1T+%yy6kIX{r-g~`A3t`OS`@qXh@V5Yj@MKW|UQq
z*2ocS@{|_y@5!swTK~9#FLV*JinG4$)zq`jFLMuF@6#zcp|^#%(&&dBA3u`B*v6E*
z?KXd+Z}a-{qjI|Vb;_JrO_!PCy1>v{@wnMH)V4K6P8!~tr(VYKOH|4HPU7>1>SeDV
zt=VH*W2<p-#Nt$Hl9HUoVN_DZlV=$vyrJPsuImK@943zC@f<8nz%P>Cxm<EU+=t5V
zT{-pcj_+6M{TXlln^ch|nY7zO=5Mxc{jD`zQ9bMBC^K#O{FvUy?bFub0WTbPy;b#j
zqFVIGFS%N^NPlFVz|d`ZVukm*z|RnN^ZMGQ&9`eV6XX`%<KC4A_g}A^l(MZITI<_s
zDSst~cdT^jGDbPxd^omYS}jw<fyK*M8?u4TdmFI-wUEc4F^Q@|!ini$_WTReK^P>z
z0&szw34`5$!GH_ftFS-Z*8b(Q7C5X0E@S_1{%Ze!93;p9PqqIK4+;PBJn}Er`x)**
z;)D%hK^{WA=OV<`UqUnOrTcxlez67_abE=wRA_{bz1#fU`lG;_^(fT}=XXg{xD&S@
ztj*B(&3T!YEA<H=*cAc_y2hU_vdtL#Ps07#rhh=*G&T>gElPn;qnSD2xhQw=3lyi9
zBe-mJ04E+RpV*oUJXIaIb;7~HVIOe14}k9M0G!9c7Q_;s)A%$7K0xlU%~M6<+Ap*(
zSen%(G8cM`XWrg#BG!$`=i3Hu$y!*t5Rk{5`uuiCu|`MR^6fmZZ#eK&19(aWPQ*lp
zI!Ll~ppF3TEsTmyI}X{~+pquTRs{@D?+FoMN^ZGwkHH@LB&3T0?0~?Bc%?ESJtP_8
z&pz@Aj6h;jM99N~Cw}~#FWJAo70Aj?pt6=t5Z{GA%4#>0Pb6QvpU@6E4|G=TewDY(
zQ0mHS%h)cFQHI9Lgfp*I`1eKhY)8oqF?2`H&Ur%c?d#<S;+f#h!tkdnBc?TZY6b^T
z0z_pIf%fQRBhqTc>dHm+&AzIIW<k@8DMpd3pOg9xTbq)Z5+mls{I!kZ`X5xUHqO5I
zd@tO+H~i6&BbP*OZ8ev_RaaAUn5ZM_Ow_Gs1}M&0n=yl#BG-;s|ENq&`K+Sd=f7xG
z9LIMR5<XD!&@=RoXiS*2QQYQvk@A^=z!EQ_QZ;4qsj(MsE03JL^X9OZ#nMAseO6bf
z*H=}?KC!CbJU}m=bj@o6p(3JxsHs-PFT5cKon<-*7<+v=I3J^Z@yb!LJAA+pqA)(`
zxOHycr&aVwWrn0(p@EXWAJ&Z8JALakbHLbt0U~SP=(bza(mJK@=<`X|!A9@Lu`|9c
zn-9$=kr4OY^lhsK2GXcDqjcR`N?e)jt%#i`LNKKZYoAcB>4lR?HRvq44@a&Fof{Y^
zPS&=I`B7hyyf;&gQb%D@&RiO5)GSX18qe$Y&(bEB$(JbguTSLLdrY12^{zj@qrQDW
zjRFl)m>!0PFJFIOtFD~Q3vX_1qc=O8*kv|gEbu<axWt>+Y=<@d<nWHOOx6j*X-qNc
zL4`#tV<d0OJ}I5Ft;yuX$-7U|Zv?3;exXC*l%<Z<*IQ&|@()nf6xb+awe4BIDeLtm
zNqRNO`*{E@puYbgfb5$wy_q1q&Eg3m!7Y&EjB7lWFZub_pji50NsS}kL1{rnRr7~8
zYni!^GNz=w4R@vhD^%qp#3jO#>!w&SO|#c$=B($$K8snInVK1Qgq_3&D#o+fHAJuD
zu0UJAZed8U@cFpz{`&+Kdaa<E*tw0ScU~S%Cg+vc*VcAy4{$QbNE%^KEDU#s7ej`X
z6G3ftx6o9n`HXva5*hUNUqn|-s>z(6c5sEi;^S5{%2EI5=qU;rT0@v>r!a3O?0<oN
zcI|wl%_6eAomzMN2i|5<(#ZJc-mJEz>L6FWoigJujS1kTgnBew>;t2cAsXmG$%he_
zF-3_D=1QweBVK+hJyd_Bw}G`B1lf6HQ1?_%StO5m-o7z>LHrm`*K*!_|ImU?KOxa0
zxoxh?Ld0*@RF~5p)E?lZ<f6?8n-wDTZ4>mH`I$#!w{HE2NiA$O{t&Nzd!5jP>%o}U
zBSH1sMw`IP{n(ShQG(i()JbN?gE#9a4k-WS9V1gJ#dq(g!bHiwj++4#kL0Vks>xa1
z=#ZlP4dTpQcXys&pXfGcnNF&$iG`llKVIv2#;x|X(TS-V%|2UQva2$q{MCgde+3@?
zM*gy()W_Z8WWQNc6Q9ueUF&Z?BkwuOq+TB>ul+tEH!7?i1^3Uz_$vkow;Fy@=!8B#
zz8rb@GRZd-Bkz3Tn5u5fA{L_BjIa&%q2*uWbQQ)FdRqIcz+#0|y5q?CP+_nLz7>R*
z%sDfrjV3_IlX6*u%cqO((i!4GGSYhc+7E;-EFhkdbNU$i#}i8MHw}}AlCx8bg6)Rx
z$D3B%8<jMQi!CAfi^cj%83-J@qD;THQ(@3F=4Z9%#O;lwW(_h6dP8QqGw)p+wOBir
zK--ZUC}7=`JMV-oGa(m^^LlE>?8y0bx;c0LwKQ-SvX+uHusr)pvjNzKkJ2s9GILa0
zD{FMM9+*Tdyxz4rY=_Cc0G%`s$cbDf%y7E-)!Iwz-qvj0Kt2UUEt3r4!1HNW768zo
zmAtEZsyumw-vO2bB~z0H4VL*c>-L_BIP#oMA17A?s*nG0agX>Ul4}*ys$nEx3`cZE
zuRlb_oeDP3jwvW80Aks-fKpCTy*$Q1TSYPGVS&cS<PmZvp_Cx<I#w>f)qK@3?pwqi
zl4Bf$wQtfnq3gi@{RSDrz2Htt&;(s;Wqv`#UpeR|?B&H`)wQ3Uu6CHD`4=H6KW>W|
zZ*a|Xh_*CV&|ACnRPTkOiM5x3(WQPt{W+!$Wp69n+s>)mu8O-;3Y${xY>47lvfH!Y
z=gAcBWSk~@yXrpnk_)9@yIk5bA}zyEvPew7;hUM4eq+kWtKc~O4dZRreCKh7MM}}G
zRi3rbOCgnwrI&5CG@Sq81yB}xt}54CJZk#;r{3><{w_Dr&^fR4i?U<FdxLkUfJU8J
ze&=M`tx38-HATs2#;ev|=Bv)yh_zz6=JWi$zz?gHfAR0*{p)XsVCm^9feLxeJsZT2
z86mO+-&9GS@$Ch-y^c=!WqY;T?uAGa(=J;D(g!vOuvPR7GkuaeUIQ&8n!i5>J)1xx
zkK=3ePQT4M!;J9lrk))ji<VYR9U(nE9Gz^P(6NdKA9Wo{wCS~13t~th?TEEPq~`_A
z>+OOaH%tXAZW%hg%C9$!$#By(eDJt^6l{hgDLst7mVRSnNxSSRA2l7jo!-3Y4mZf?
zXixrWQQ;8mU>Q{Tu6?}{nK_^~)kLwY%92%WqTWG!rs&huj6F#{T69-eS3Z@n7i%av
zE>pwVkP@95V)Pos(I&rA@4O%_VlrcAR!1tMd^{TH=xmqi(tCQ>r99zdL_tj5=-w-%
zJvvH~XrI}HL(dcnbXr_14tWGf*+73ys$#3G`&(OoMad$bD-@5Yq^L@S#E%D|Nd_v`
zO&*)wwq62aXLg~N>f&t3vLY6WsbTA9E+D5PcS?~)gSE1bTsyoQp>bTDa*fG2Yi@YQ
zDPJS?XxIKT!3BAy6_1{I^JbVu7(_9wa>FYVz9f`AX|j$=EN|GWkZ=x4b!dB4GBA0=
zzCgH^QX+C~#BGr5hE-f@$Wqy&e-5vd7b{@ptd}v<$lr>l7Mow&s!n-M5vae(xcV{j
zrbLCwv&hGBdSdM#<B#4^@)a#{f}5I7@Sk;zWu%?&6I2;ti!wt2ql(B4ZWQC$H9@wF
zqRMExbMoU9u#Wa<t${W=W?&nQydGXz+VyFle^XMBVq|0ngUU3svq&g-XXfL~9P_mm
zy(n7U-syWjmae0max3R)k;T&uu3@<;zq(^(YiF^mMM(vvb{<Ufa8h9`-6*{qP~u|I
z1ACp@^9yYAR^Xs_TgewOO#M+@NPna7)}^LPQwwtSp1m1;5Ti>oPu6zKCwYu^YyI(l
zJhP>uyLa+tdiwca-@iG*4(uYDEVc5E(uORM2@{I%&*^mLT4MQiN(R%h&wzh+xmtdq
z%Y)@pS-ZR^$8X{;yJva=w<NGbhg?R^#ne6b)+m>YUn4$r3H~dZcOCR@qq#I&a1_M4
z){c03?fzB+8Kj?9wmbKer;vY7hUN>o%xSl2zJ=z*a@*Th*FTGWzC98{F8gY?MJ>{@
zEkneM$*7jKl~bKZmQ#W&>y;BJ44<{Uo1W9EZyqBa{~117?6reA{`Q@Tgb2~*wp|_n
z`9K{F>}J1Sh3ctWM-xgMGcA0MZgZcD`MS;T+$&rp$roz7sxfcp;d<cK)*)y6J(~;<
z4uNfea$PaCgFbt5>7n=MUy&&BHbcuB!*kjRYI?PMj`~WUh!uDi(s!~)TdU&W=qW)F
zeNyn2&($j`=FbFsslq{07-p%9*3=ofsY5=b0(-<xbVG+leGUI{QTrqNb@<IkO$#)1
z&N7Ru<e(ooWz*o8qA4Bz$i%0F0^wcu;ZoKnef#Ux_#YkpB&1IH-O|HYE;~J2yY=g7
zorqQAHL{W6o^y%=TDMJtH09?-^v9wna}V}{MO!ig9NAwR=~YYZGbj^PS^xORwUo>#
zywnrLFE?&>H3`ORibvF*4=~dIf~Uk#?3xjLP3IwAm9k?4rS@-rqec`d*1GR6=1-2v
zpu0L3;tI10>#TRU?mBG}OfHD^V(#=cyb}{Bxzl5-5Tl_Z!+=D$I-vheRw7BV!7yJW
zLF-s{Tbxu_WpR#sQ)Am5Ua#KdQO56v<dNd?+1a#(*lTvptMjkh4DvCHD+_Lz$Wy=P
z!$T6FF2{s5TH!ap>sfr0@o#yqz-EsL6X*Q34c*<7XZA#RKHGyezv3GFto3u@0}M$}
zY0ogu`BM#K?{#$_Y1IAWhbKPzVPGR!{76q-*@j(pF~g(uH|mNzG7yrqh`}+U<Dg^h
z-AyHrzoj+loXoWG&(6ERqEy;NVAl5zK<?C(uIUj*Ms=oa$)+k*Ej!h`$2Wd>kixbV
zEzi*GujZRQ8@>}e@JvmKKQ)XhLW@nP>xdcX>tmBpy($$_?MRwXUiUOp_oB(YhKA%<
zr&fEk8eR)}aR0u9on*pcy%5~btoxhs0<M{cK{1bBq`!GaQP=ED_@#P;ve}d0Inl{k
zP!!942K>)k(SP2tp}^S+d=m;Gt!m&*b|v{pgM*i3p1VA<0PzhFrYsf+xS|GI!I_rA
zSS&r3K8%H23FpF!qQPJSE3i`*OPlSGuMt2d0mKyGL5pERAiWH3IKWyDW0`}58VlqI
zv+<bV$ypAh$6<TGm4yZ1Q5AN=lVuIA6D$^zRS3|b&`M++Igs^{#oEWB!A^rh0N4s(
zpseBlgvep-Wu?Jbo**ZT#TsPePg(M8JSzZyvijJFRS-8P7^G!btW!GR_FfRaWd+sB
z>S1F$Tfk3J>~K7+ZWe0?>j#X??ngW86}XB*EY=HP*2-e}vNB<;PLTDKH3_bp*|<{H
zV-`yQgt%dy0_n!ezk=*kf%H0ncU=Uv>}4ZfXV}#_vsm}PfW${O^z}1H;8sHTsIdX5
zL+k=ItOZy<JF%J-z7m^;6#%?AzJ}OYbT%6H7px6jMPbiiu%{paDBTSH0r)NJE;xsX
z0%;bR)w~jr=Pf%RPYuZV3nt6D&0>AI%Pv4+ePGAqDPgBC6tb^{tkbX@koW>)&B1QM
zU}+#N1oCqeSB^ATP!lYMUG5T#l^G5al57wzINZ1d(upepc>-3Dy#ee(82~Np1A}>j
zbPVhaJ13R31?B=00DDV?v7_<;Sh6O}-k$y2^<yxYEsPzRhsAOLh+K0R%!HkeHv(5s
zM4$ZyBC=Ss0P(90z5sBt2^*!11L=$4Hyb2uC16iINXG(5^IniY2xG~Bua@jMNGUKG
z7)%;u-i1kmt1=taD-MJ8!eHCMSC$!oIt#;KCt$E7_SeNN;QEYxlml$9JJ~r#;Ou5I
z8(mC>VOBg;vRF&(xV8?fP>95=OIwqdU3kDtUT)ZYSnJ1CTUNpJI!e%26?SJ`6FRn0
zn@F@460cCQ%&IWTGc7c@@zfxTa@s>!ERUQ^>WMBi2)h69_shZ64-e@7ge0F!I7#jy
zblw^(9K*k|Xo+8z(f4j~rrFTuY}M}g(*62A8w_?K8WG)yCs6#dV#_Q|jE0jKAM`#y
z^u4pZH-1^VrIt2M<D<=8kfcZmOAJenOL_GTk=}priw`bx${XI(GDw?Kmk5)HP@{R}
zYCf@eY0>I=Z};zav{}h{$u@~`RZqGPooYX20A&Ejf7QbV`aiX3BD6ZmS8AQAekMNl
zqY4uSgKdbn(6<z)jNQK#^mn)Hro~8(Gu8I_^?m389qj&g*Qq!sYWMHWGy%yYk~p=_
z!O`#io|!qhyMMRRL?z`UZ1J79MhicDZ?@=<Ulwk8MMFt^!FRs(o%8Ibp8se7T^e?8
zDWSzlj7#~X4}Wj>OyB+ctiDD|7mZ4r^H38}zvI{K1Lc-|>KRoS{r)6=SzP~=en5*R
zZEjY=UBXZ8tY5BXpT*;jp7MeC2bIG+TZ(8>lH=|K7lN5*--H2ldzjF&L|c*^KjAGg
z_5F=SbNmDP@Y)trni*~GxCBo9p4vV2&cQK-F@;Z`J{UAS?0EhyIp@~y3s4KS<zUN6
z{hvz`ha{lQ_;5m})Y$e9+sFO8<AdorAx`PTp87xcNSLcdtKIa>)f_;yBHn##*!^3i
zMS!MA3y~ZzAcU*Cs5yA$LhlgF@~&@y@;tO^2@iD!p|fG4ru*BaVH5qI1X>#{PI6Xq
zT+{db*!QOL#`xeYr+BBRoUGlyZE4SF^|V#AxqV6!K@uergX*2PJ{_IFKePaJux;_6
zX-Yt9ogO}Cyd*w+f7Pryjek6~ZjHWwV*HD38&+7By$4{im}K(@Ji4o}xa6b<JfUk5
zC=?QjNtSNl*|7?XPu6JQQGwui0vZlZMcE(ev(o%42^0#B1B}m+hX6YWXC4Xxpbs47
zP$*#G#+k>qx%wjyd;z;v@^}N!?lm|#0g=3=kw+H7!Eu}gQ7Altt3ot}Z2<H~g(wUd
z99JHmz*!#}3H~_Bp-~9-(J&kWHU3Qn&<2jPVKf$n;JO)0VDGzsbOw#XB7uF#A9)xQ
z8qQfC1`TIBgZOVbcKdLUgGO_b6@%j@KL&?K0W&7{=kHEq@F*N`Q}9O~7KKA{<)Ja`
zAfJDh!$SnNk<Oo)1T0rU92`svM>!k<beuB}jU{kW3x`3YIHv@MM<Q0J0LK6KNN{*O
zoU0K6m=umi@NhVRvm73YXUFvWV<31GmWvngH~@S9pK>eo2l4&zoXmy5V6dEXhrqzO
z_yd8(qd6%E$AQQW|I^4yw{R%J|2F(r9tJ{iHUbtRhLe%tpnsgChU4Mf<?tvrSnUrg
z!0~7TR|kO`iN87s{X>4RBne!-CSc%PHxuwk&MAR|$OxPbBj89lXE_8Mi~OTLHvJJ`
z$ei<u0Ah-BJ`o5cnv=N@>^b2WF#>@ja8eL~1g&tEL!wX+cR>sn2@yyvH-8`rzz^-8
zq(-2S1g;UIa9mS|K!LgY>t5(@?nj^jAvh~UBe|9n0u3YsS2-MlYjj}RIe80-;-mtg
zKN3j*i}25pAdzSc=jf1V1eZ)l;E-JWfxw~IK8x6&e+Gxcz_}=m1N#-kRq$Wt4iD#M
zE<BoR<sbl8b5Vi7y-E;-fA$UNzdIm;049aAGXyNx(m@comm(4l=MvvYIDiIn)Q1Fu
zo}+^hdy%m5p?{DI2?QJ`xsV7jdz|GEDDHc~oN$!`(w4J6umOTCe?|WNGf!Zz<Ln_E
z^)H=4A^)WjFkp_+!I5Yjm#jdd@&61C`i}wv;;?e<Y)A~46wVQ2xHlps2F<lRkr+G|
z!y&Oq9H;z%kXQ_tvVjDY;atZ+1aPfwKm_i4aR8Rj*=ZaB&y|Nqu$TMhKj$5v?AZ*W
zMPRtc0|Yh~aRDE5b(4VN(x-sYJC3V)0-kG#C^+)3y%8|Q-zygd$8r%81yl*nwE~ne
zZmkl7=h{PoD#j%-fHH>u--%vfO0e&931T!B$;A<Dje~PmfilL`2%B*@DF}vv;-n1F
z#Q;-q%pefCT*8^HG;l67pp0>;D?l0hueAT0s#qXiIokjX_8+SL&!!ACO|F7K8ROyw
zpitvEsel7(nNx@ZWsFND1>^X0mtoT%hX;QgRKO9?T;u}E*dGcNo1cL)hU64!KpErW
z1)z*^tra|w!><3!3@a59&@0+HNV7@k<8_LB#@UO1|9)vzD{`Q-G*H5%RV_U{e5ApI
n081fN!?P|PAQueazji~XynOt<oL%_ADn_FD<>YkD_4xk}7;?*E

diff --git a/plot_fig4_topology.py b/plot_fig4_topology.py
index 1576275..2263332 100644
--- a/plot_fig4_topology.py
+++ b/plot_fig4_topology.py
@@ -29,20 +29,12 @@
 from matplotlib.colors import LogNorm, Normalize, LinearSegmentedColormap
 from matplotlib.cm import ScalarMappable
 
-# ── channel layout from sample.py ──────────────────────────────────────────
-# output channels (sample_N.csv):  0=u_x, 1=u_y, 2=rho
-# cond channels (cond_channel_N.csv):
-#   0=vf_arr, 1=strain_energy_fem, 2=von_mises_fem
-#   3=disp_x_fem, 4=disp_y_fem, 5=E_field (ref design)
-#   6=BC_node_x, 7=BC_node_y, 8=load_x, 9=load_y
 
 BINARIZE_THRESHOLD = 0.5
 
-# Path to SolidsPy mesh files (no BCs — BCs are applied at runtime from cond channels)
 _PROJECT_ROOT = os.path.dirname(os.path.abspath(__file__))
 _NO_BC_FOLDER = os.path.join(_PROJECT_ROOT, 'data', 'mechanics', 'solidspy_k_no_BC') + os.sep
 
-# Lazily initialised; shared across all samples in one run
 _STIFFNESS = None
 
 
diff --git a/plot_fig8_darcy.py b/plot_fig8_darcy.py
index 911895f..724f30f 100644
--- a/plot_fig8_darcy.py
+++ b/plot_fig8_darcy.py
@@ -35,7 +35,7 @@
 STEP = "step_300000"
 
 # ---------------------------------------------------------------------------
-# Darcy PDE parameters (must match main.py / residuals_darcy.py)
+# Darcy PDE parameters 
 # ---------------------------------------------------------------------------
 PIXELS_PER_DIM = 64
 PIXELS_AT_BOUNDARY = True   # True → grid from 0 to 1 inclusive, h = 1/(N-1)
@@ -68,7 +68,8 @@ def darcy_residual(K, p):
 
     Uses second-order central FD (np.gradient) with spacing h = 1/(N-1)
     for pixels_at_boundary=True (boundary-inclusive grid).
-    Returns |R| as a 2-D array of shape (N, N).
+    Returns |R| as a masked array; the boundary ring is masked out to suppress
+    the large spurious values that arise from one-sided FD at boundary pixels.
     """
     h = DOMAIN_LENGTH / (PIXELS_PER_DIM - 1) if PIXELS_AT_BOUNDARY else DOMAIN_LENGTH / PIXELS_PER_DIM
 
@@ -80,7 +81,16 @@ def darcy_residual(K, p):
     K_y  = np.gradient(K, h, axis=1)
 
     R = -(K * p_xx + K_x * p_x) - (K * p_yy + K_y * p_y) - F_S
-    return np.abs(R)
+    R_abs = np.abs(R)
+
+    # np.gradient uses one-sided differences at the domain boundary, producing
+    # large artificial residuals at edge/corner pixels — mask them out.
+    boundary = np.zeros_like(R_abs, dtype=bool)
+    boundary[0, :]  = True
+    boundary[-1, :] = True
+    boundary[:, 0]  = True
+    boundary[:, -1] = True
+    return np.ma.array(R_abs, mask=boundary)
 
 
 def load_sample(variant, sample_dir):
@@ -93,7 +103,7 @@ def load_sample(variant, sample_dir):
 
 
 # ---------------------------------------------------------------------------
-# Precompute all data and determine shared colour limits per column
+# Precompute all data (colour limits computed per row below)
 # ---------------------------------------------------------------------------
 data = []
 for variant, sample_dir, row_label in SAMPLES:
@@ -101,67 +111,77 @@ def load_sample(variant, sample_dir):
     R = darcy_residual(K, p)
     data.append({"K": K, "p": p, "R": R, "label": row_label, "variant": variant})
 
-K_all = np.concatenate([d["K"].ravel() for d in data])
-p_all = np.concatenate([d["p"].ravel() for d in data])
-R_all = np.concatenate([d["R"].ravel() for d in data])
-
-K_vmin, K_vmax = K_all.min(), K_all.max()
-p_vmin, p_vmax = p_all.min(), p_all.max()
-R_vmin = max(R_all[R_all > 0].min(), 1e-6)
-R_vmax = R_all.max()
+# Residual colormap: warm orange/pink matching the paper style.
+# 'hot' goes black→red→orange→yellow→white; mask (boundary) pixels → white.
+res_cmap = plt.get_cmap("hot").copy()
+res_cmap.set_bad(color="white")
 
 # ---------------------------------------------------------------------------
 # Plot
 # ---------------------------------------------------------------------------
 COL_TITLES = ["Permeability $K$", "Pressure $p$", r"$|R(K,p)|$"]
-CMAPS = ["viridis", "inferno", "viridis"]
+# inferno for K and p; custom hot-based cmap for residual
+CMAPS = ["inferno", "inferno", res_cmap]
 NROWS, NCOLS = 4, 3
 FIG_W, FIG_H = 10, 13
 
 fig, axes = plt.subplots(NROWS, NCOLS, figsize=(FIG_W, FIG_H))
 
 for row_idx, d in enumerate(data):
-    fields = [d["K"], d["p"], d["R"]]
+    # Per-row colour limits so each row's colourbar reflects its own data range
+    K_vmin, K_vmax = d["K"].min(), d["K"].max()
+    p_vmin, p_vmax = d["p"].min(), d["p"].max()
+    R_vals = d["R"].compressed()          # valid (non-masked) residual values
+    R_pos  = R_vals[R_vals > 0]
+    R_vmin = R_pos.min() if R_pos.size > 0 else 1e-6
+    R_vmax = R_vals.max()
+
     vnorms = [
         mcolors.Normalize(vmin=K_vmin, vmax=K_vmax),
         mcolors.Normalize(vmin=p_vmin, vmax=p_vmax),
         mcolors.LogNorm(vmin=R_vmin, vmax=R_vmax),
     ]
 
+    fields = [d["K"], d["p"], d["R"]]
+
     for col_idx in range(NCOLS):
         ax = axes[row_idx, col_idx]
-        field = fields[col_idx]
-        cmap = CMAPS[col_idx]
-        norm = vnorms[col_idx]
 
         im = ax.imshow(
-            field.T,           # transpose so x→horizontal, y→vertical
+            fields[col_idx].T,   # transpose: x→horizontal, y→vertical
             origin="lower",
-            cmap=cmap,
-            norm=norm,
+            cmap=CMAPS[col_idx],
+            norm=vnorms[col_idx],
             aspect="equal",
             extent=[0, 1, 0, 1],
         )
-        ax.set_xticks([])
-        ax.set_yticks([])
 
+        # ξ₁ / ξ₂ axis labels and minimal ticks on every panel
+        ax.set_xticks([0, 1])
+        ax.set_yticks([0, 1])
+        ax.tick_params(labelsize=6)
+        ax.set_xlabel(r"$\xi_1$", fontsize=8, labelpad=2)
+        ax.set_ylabel(r"$\xi_2$", fontsize=8, labelpad=2, rotation=0, va="center")
+
+        # Per-panel (= per-row) colourbar
         cb = fig.colorbar(im, ax=ax, fraction=0.046, pad=0.04)
         cb.ax.tick_params(labelsize=7)
-
         if col_idx == 2:
             cb.ax.yaxis.set_major_formatter(LogFormatterSciNotation(base=10))
 
-        # column titles on first row
+        # Column titles on first row only
         if row_idx == 0:
             ax.set_title(COL_TITLES[col_idx], fontsize=11)
 
-        # row labels on left
+        # Row label — (a)/(b)/(c)/(d) only, no model name, placed to the far
+        # left of the first column so it doesn't crowd the ξ₂ ylabel.
         if col_idx == 0:
-            ax.set_ylabel(
-                f"{d['label']} {d['variant']}",
-                fontsize=10,
-                rotation=0,
-                labelpad=60,
+            ax.annotate(
+                d["label"],
+                xy=(-0.55, 0.5),
+                xycoords="axes fraction",
+                fontsize=11,
+                ha="right",
                 va="center",
             )
 

From 5ab6f4bf4d42425f05a4cc8f93b9821786f9b50f Mon Sep 17 00:00:00 2001
From: dimanaStoyanova7 <stoyanovadimana557@gmail.com>
Date: Tue, 9 Jun 2026 16:53:00 +0200
Subject: [PATCH 09/12] add plotting scripts, updated main.py, sample_eval.py,
 slurm scripts

---
 main.py                              |  33 ++-
 sample_eval.py                       | 325 +++++++++++++++++++++++++++
 slurm/darcy_pidm_se.slurm            |   2 +-
 slurm/eval_darcy_diffusion.slurm     |  31 +++
 slurm/eval_mechanics_diffusion.slurm |  31 +++
 slurm/eval_mechanics_pidm.slurm      |  31 +++
 slurm/mechanics_pidm_se.slurm        |   4 +-
 7 files changed, 450 insertions(+), 7 deletions(-)
 create mode 100644 sample_eval.py
 create mode 100644 slurm/eval_darcy_diffusion.slurm
 create mode 100644 slurm/eval_mechanics_diffusion.slurm
 create mode 100644 slurm/eval_mechanics_pidm.slurm

diff --git a/main.py b/main.py
index c4a9f00..343a6df 100644
--- a/main.py
+++ b/main.py
@@ -188,7 +188,7 @@
                     cur_test_batch, residual_func = residuals, c_data = c_data, c_residual = c_residual,
                     c_ineq = c_ineq, lambda_opt = lambda_opt)
         
-        print(f'test loss at iteration {iteration}: {loss_test:.3e}')
+        print(f'[iter {iteration}] test_loss: {loss_test:.3e} residual: {residual_loss_test:.3e}')
         log_fn({'loss_test': loss_test.item()}, step=iteration)
         log_fn({'loss_data_test': data_loss_test}, step=iteration)
         log_fn({'residual_mean_abs_test': residual_loss_test}, step=iteration)
@@ -306,9 +306,34 @@
             df.to_csv(csv_path, index=False)
 
         if topopt_eval and gov_eqs == 'mechanics':
-            log_fn({'rel_CE_error': np.nanmean(output[1]['rel_CE_error_full_batch'].detach().cpu().numpy())}, step=iteration)
-            log_fn({'rel_vf_error': np.nanmean(output[1]['vf_error_full_batch'].detach().cpu().numpy())}, step=iteration)
-            log_fn({'fm_error': np.nanmean(output[1]['fm_error_full_batch'].detach().cpu().numpy())}, step=iteration)
+            ce_valid = np.nanmean(output[1]['rel_CE_error_full_batch'].detach().cpu().numpy())
+            vf_valid = np.nanmean(output[1]['vf_error_full_batch'].detach().cpu().numpy())
+            fm_valid = np.nanmean(output[1]['fm_error_full_batch'].detach().cpu().numpy())
+            log_fn({'rel_CE_error': ce_valid}, step=iteration)
+            log_fn({'rel_vf_error': vf_valid}, step=iteration)
+            log_fn({'fm_error': fm_valid}, step=iteration)
+            print(f'[iter {iteration}] valid CE: {ce_valid:.3e} VFE: {vf_valid:.3e} fm: {fm_valid:.3e}')
+
+            for test_level_name, dl_test_level in [('test_level_1', dl_test_level_1), ('test_level_2', dl_test_level_2)]:
+                cur_batch_test = next(iter(dl_test_level)).to(device)
+                no_samples_test = min(no_samples, cur_batch_test.shape[0])
+                cur_batch_test = cur_batch_test[torch.randperm(cur_batch_test.shape[0], device=device)[:no_samples_test]]
+                conditioning_test, x_0_test, bcs_test = torch.tensor_split(cur_batch_test, (3, 6), dim=1)
+                sample_shape_test = (no_samples_test, output_dim, pixels_per_dim+1, pixels_per_dim+1)
+                output_test = diffusion_utils.p_sample_loop(
+                    (conditioning_test, bcs_test, x_0_test), sample_shape_test,
+                    save_output=False, surpress_noise=True,
+                    use_dynamic_threshold=use_dynamic_threshold,
+                    residual_func=residuals, eval_residuals=eval_residuals,
+                    return_optimizer=return_optimizer, return_inequality=return_inequality,
+                    M_correction=M_correction, N_correction=N_correction, correction_mode=correction_mode)
+                ce_test = np.nanmean(output_test[1]['rel_CE_error_full_batch'].detach().cpu().numpy())
+                vf_test = np.nanmean(output_test[1]['vf_error_full_batch'].detach().cpu().numpy())
+                fm_test = np.nanmean(output_test[1]['fm_error_full_batch'].detach().cpu().numpy())
+                log_fn({f'rel_CE_error_{test_level_name}': ce_test}, step=iteration)
+                log_fn({f'rel_vf_error_{test_level_name}': vf_test}, step=iteration)
+                log_fn({f'fm_error_{test_level_name}': fm_test}, step=iteration)
+                print(f'[iter {iteration}] {test_level_name} CE: {ce_test:.3e} VFE: {vf_test:.3e} fm: {fm_test:.3e}')
 
         if iteration > 0:
             save_model(config, model, iteration, output_save_dir)
diff --git a/sample_eval.py b/sample_eval.py
new file mode 100644
index 0000000..1c3863c
--- /dev/null
+++ b/sample_eval.py
@@ -0,0 +1,325 @@
+"""sample_eval.py — parametrized version of sample.py for batch evaluation.
+
+Usage:
+    python sample_eval.py \
+        --directory_path ./trained_models/darcy/ \
+        --name PIDM-ME \
+        --load_model_step 300000 \
+        --output_dir ./results/reproduced/darcy/PIDM-ME
+"""
+import argparse, os, yaml, time
+import matplotlib.pyplot as plt
+import pandas as pd
+import torch
+from pathlib import Path
+from src.data_utils import *
+from torch.utils.data import DataLoader
+from src.denoising_utils import *
+from src.unet_model import Unet3D
+from src.residuals_darcy import ResidualsDarcy
+from src.residuals_mechanics_K import ResidualsMechanics
+
+parser = argparse.ArgumentParser()
+parser.add_argument('--directory_path', required=True)
+parser.add_argument('--name', required=True)
+parser.add_argument('--load_model_step', type=int, required=True)
+parser.add_argument('--output_dir', required=True)
+args = parser.parse_args()
+
+directory_path = args.directory_path
+name = args.name
+load_model_step = args.load_model_step
+output_base_dir = args.output_dir
+
+no_samples = 3
+create_gif = False
+topopt_eval = True
+eval_test_sets = True
+test_batches = -1
+
+load_path = directory_path + name
+config = yaml.safe_load(Path(load_path, 'model', 'model.yaml').read_text())
+
+use_ddim_x0 = False
+ddim_steps = 0
+
+residual_grad_guidance = config['residual_grad_guidance']
+correction_mode = config['correction_mode']
+M_correction = config['M_correction']
+N_correction = config['N_correction']
+
+gov_eqs = config['gov_eqs']
+if gov_eqs != 'darcy' and residual_grad_guidance:
+    raise ValueError('Gradient guidance only implemented for Darcy equation.')
+fd_acc = config['fd_acc']
+diff_steps = config['diff_steps']
+use_dynamic_threshold = False
+self_condition = False
+use_double = False
+
+save_output = True
+eval_residuals = True
+
+data_paths = None
+if gov_eqs == 'darcy':
+    input_dim = 2
+    output_dim = 2
+    pixels_at_boundary = True
+    domain_length = 1.
+    reverse_d1 = True
+    bcs = 'none'
+    pixels_per_dim = 64
+    return_optimizer = False
+    return_inequality = False
+    train_batch_size = 32
+    sigmoid_last_channel = False
+elif gov_eqs == 'mechanics':
+    input_dim = 2
+    output_dim = 3
+    pixels_at_boundary = True
+    domain_length = 64.
+    reverse_d1 = True
+    data_paths_valid = ('./data/mechanics/test/valid/fields/')
+    data_paths_test_level_1 = ('./data/mechanics/test/test_level_1/fields/')
+    data_paths_test_level_2 = ('./data/mechanics/test/test_level_2/fields/')
+    bcs = 'none'
+    pixels_per_dim = 64
+    return_optimizer = True
+    return_inequality = True
+    ds_valid = Dataset_Paths(data_paths_valid, use_double=use_double)
+    ds_test_level_1 = Dataset_Paths(data_paths_test_level_1, use_double=use_double)
+    ds_test_level_2 = Dataset_Paths(data_paths_test_level_2, use_double=use_double)
+    train_batch_size = 5
+    dl_valid = cycle(DataLoader(ds_valid, batch_size=train_batch_size, shuffle=False))
+    dl_test_level_1 = DataLoader(ds_test_level_1, batch_size=train_batch_size, shuffle=False)
+    dl_test_level_2 = DataLoader(ds_test_level_2, batch_size=train_batch_size, shuffle=False)
+    sigmoid_last_channel = True
+else:
+    raise ValueError('Unknown governing equations.')
+
+# Output dirs rooted at output_base_dir (no auto-increment — path is fully caller-controlled)
+output_save_dir_validation = os.path.join(output_base_dir, f'validation/step_{load_model_step}/')
+os.makedirs(output_save_dir_validation, exist_ok=True)
+
+if use_double:
+    torch.set_default_dtype(torch.float64)
+
+diffusion_utils = DenoisingDiffusion(diff_steps, device, residual_grad_guidance)
+
+if gov_eqs == 'darcy':
+    model = Unet3D(dim=32, channels=output_dim, sigmoid_last_channel=sigmoid_last_channel).to(device)
+elif gov_eqs == 'mechanics':
+    model = Unet3D(dim=128, channels=output_dim+3+4, out_dim=output_dim, sigmoid_last_channel=sigmoid_last_channel).to(device)
+
+load_model(Path(load_path, 'model', 'checkpoint_' + str(load_model_step) + '.pt'), model)
+
+if gov_eqs == 'darcy':
+    residuals = ResidualsDarcy(model=model, fd_acc=fd_acc, pixels_per_dim=pixels_per_dim,
+                               pixels_at_boundary=pixels_at_boundary, reverse_d1=reverse_d1,
+                               device=device, bcs=bcs, domain_length=domain_length,
+                               residual_grad_guidance=residual_grad_guidance,
+                               use_ddim_x0=use_ddim_x0, ddim_steps=ddim_steps)
+elif gov_eqs == 'mechanics':
+    residuals = ResidualsMechanics(model=model, pixels_per_dim=pixels_per_dim,
+                                   pixels_at_boundary=pixels_at_boundary, device=device,
+                                   bcs=bcs, no_BC_folder='./data/mechanics/solidspy_k_no_BC/',
+                                   topopt_eval=topopt_eval, use_ddim_x0=use_ddim_x0,
+                                   ddim_steps=ddim_steps)
+
+num_params = sum(p.numel() for p in model.parameters() if p.requires_grad)
+print(f'Number of trainable parameters: {num_params}')
+
+if gov_eqs == 'darcy':
+    conditioning_input = None
+    sample_shape = (no_samples, output_dim, pixels_per_dim, pixels_per_dim)
+elif gov_eqs == 'mechanics':
+    cur_batch = next(dl_valid).to(device)
+    if cur_batch.shape[0] < no_samples:
+        no_samples = cur_batch.shape[0]
+    sample_shape = (no_samples, output_dim, pixels_per_dim+1, pixels_per_dim+1)
+    cur_batch = cur_batch[torch.randperm(cur_batch.shape[0], device=device)[:no_samples]]
+    conditioning, x_0, bcs = torch.tensor_split(cur_batch, (3, 6), dim=1)
+    conditioning_input = (conditioning, bcs, x_0)
+
+output = diffusion_utils.p_sample_loop(conditioning_input, sample_shape,
+                        save_output=save_output, surpress_noise=True,
+                        use_dynamic_threshold=use_dynamic_threshold,
+                        residual_func=residuals, eval_residuals=eval_residuals,
+                        return_optimizer=return_optimizer, return_inequality=return_inequality,
+                        M_correction=M_correction, N_correction=N_correction,
+                        correction_mode=correction_mode)
+
+if eval_residuals:
+    seqs = output[0]
+    residual = output[1]['residual']
+    residual = residual.abs().mean(dim=tuple(range(1, residual.ndim)))
+    if return_optimizer:
+        optimized_quant = output[1]['optimized_quant']
+    if return_inequality:
+        ineq = output[1]['inequality_quant']
+else:
+    seqs = output
+
+if gov_eqs == 'mechanics':
+    cond_data = torch.cat((conditioning, x_0, bcs), dim=1)
+    for cur_sample in range(no_samples):
+        for channel_idx in range(cond_data.shape[1]):
+            os.makedirs(output_save_dir_validation + f'sample_{cur_sample}/', exist_ok=True)
+            np.savetxt(output_save_dir_validation + f'sample_{cur_sample}/cond_channel_{channel_idx}.csv',
+                       cond_data[cur_sample, channel_idx].detach().cpu().numpy(), delimiter=',')
+
+labels = ['sample', 'model_output']
+for seq_idx, seq in enumerate(seqs):
+    if seq_idx == 1:
+        continue
+    seq = torch.stack(seq, dim=0)
+    if len(seq.shape) == 6:
+        seq = seq.squeeze(-3)
+    last_preds = seq[-1].numpy()
+    sel_samples = np.arange(no_samples)
+    channels = np.arange(output_dim)
+    for sel_sample in sel_samples:
+        for sel_channel in channels:
+            last_pred = last_preds[sel_sample, sel_channel]
+            last_pred_normalized = (last_pred - last_pred.min()) / (last_pred.max() - last_pred.min())
+            image = np.uint8(last_pred_normalized * 255)
+            fig, ax = plt.subplots()
+            ax.imshow(image, cmap='gray', vmin=0, vmax=255)
+            ax.axis('off')
+            if eval_residuals:
+                title = f'residual: {residual[sel_sample]:.2e}'
+                if return_optimizer:
+                    title += f'\nopt: {optimized_quant[sel_sample]:.2f}'
+                if return_inequality:
+                    title += f'\nineq: {ineq[sel_sample]:.2e}'
+                plt.title(title, color='green')
+            filename = labels[seq_idx] + '_sample_' + str(sel_sample) + '_' + str(sel_channel) + '.png'
+            plt.savefig(output_save_dir_validation + filename, bbox_inches='tight', pad_inches=0)
+            plt.close(fig)
+            os.makedirs(output_save_dir_validation + f'/sample_{sel_sample}/', exist_ok=True)
+            np.savetxt(output_save_dir_validation + f'/sample_{sel_sample}/' + labels[seq_idx] + '_' + str(sel_channel) + '.csv',
+                       last_pred, delimiter=',')
+
+if eval_residuals:
+    residuals_array = residual.detach().cpu().numpy()
+    ineq_array = ineq.detach().cpu().numpy() if return_inequality else None
+    optimized_quant_array = optimized_quant.detach().cpu().numpy() if return_optimizer else None
+
+    df_data = {'Sample Index': list(range(no_samples)) + ['Mean'],
+               'Residuals (abs)': list(residuals_array)}
+    if return_optimizer:
+        df_data['Optimized quantity'] = list(optimized_quant_array)
+    if return_inequality:
+        df_data['Inequality'] = list(ineq_array)
+    df_data['Residuals (abs)'].append(np.nanmean(residuals_array))
+    if return_optimizer:
+        df_data['Optimized quantity'].append(np.nanmean(optimized_quant_array))
+    if return_inequality:
+        df_data['Inequality'].append(np.nanmean(ineq_array))
+    df = pd.DataFrame(df_data)
+    df.to_csv(os.path.join(output_save_dir_validation, 'sample_statistics.csv'), index=False)
+
+# Full test-set evaluation for mechanics (in-distribution = test_level_1, OOD = test_level_2)
+with torch.no_grad():
+    start_time = time.time()
+    if eval_test_sets and gov_eqs == 'mechanics':
+        test_datasets = [dl_test_level_1, dl_test_level_2]
+        test_datasets_names = ['test_level_1', 'test_level_2']
+        for ds_test_idx, dl_test in enumerate(test_datasets):
+            residual_mean_abs_list, rel_CE_error_list, rel_vf_error_list, fm_error_list = [], [], [], []
+            for batch_idx, batch in enumerate(dl_test):
+                cur_batch = batch.to(device)
+                sample_shape = (cur_batch.shape[0], output_dim, pixels_per_dim+1, pixels_per_dim+1)
+                conditioning, x_0, bcs = torch.tensor_split(cur_batch, (3, 6), dim=1)
+                conditioning_input = (conditioning, bcs, x_0)
+                output = diffusion_utils.p_sample_loop(conditioning_input, sample_shape,
+                                        save_output=save_output, surpress_noise=True,
+                                        use_dynamic_threshold=use_dynamic_threshold,
+                                        residual_func=residuals, eval_residuals=eval_residuals,
+                                        return_optimizer=return_optimizer, return_inequality=return_inequality,
+                                        M_correction=M_correction, N_correction=N_correction,
+                                        correction_mode=correction_mode)
+                if eval_residuals:
+                    seqs = output[0]
+                    residual = output[1]['residual']
+                    residual = residual.abs().mean(dim=tuple(range(1, residual.ndim)))
+                    if return_optimizer:
+                        optimized_quant = output[1]['optimized_quant']
+                    if return_inequality:
+                        ineq = output[1]['inequality_quant']
+                else:
+                    seqs = output
+                output_save_dir_tests = os.path.join(output_base_dir, test_datasets_names[ds_test_idx]) + '/'
+                os.makedirs(output_save_dir_tests, exist_ok=True)
+                if batch_idx == 0:
+                    labels = ['sample', 'model_output']
+                    for seq_idx, seq in enumerate(seqs):
+                        if seq_idx == 1:
+                            continue
+                        seq = torch.stack(seq, dim=0)
+                        if len(seq.shape) == 6:
+                            seq = seq.squeeze(-3)
+                        last_preds = seq[-1].numpy()
+                        sel_samples = np.arange(len(last_preds))
+                        channels = np.arange(output_dim)
+                        for sel_sample in sel_samples:
+                            cond_data = torch.cat((conditioning, x_0, bcs), dim=1)[sel_sample]
+                            for channel_idx in range(cond_data.shape[0]):
+                                os.makedirs(output_save_dir_tests + f'/sample_{sel_sample}/', exist_ok=True)
+                                np.savetxt(output_save_dir_tests + f'/sample_{sel_sample}/cond_channel_{channel_idx}.csv',
+                                           cond_data[channel_idx].detach().cpu().numpy(), delimiter=',')
+                            for sel_channel in channels:
+                                last_pred = last_preds[sel_sample, sel_channel]
+                                last_pred_normalized = (last_pred - last_pred.min()) / (last_pred.max() - last_pred.min())
+                                image = np.uint8(last_pred_normalized * 255)
+                                fig, ax = plt.subplots()
+                                ax.imshow(image, cmap='gray', vmin=0, vmax=255)
+                                ax.axis('off')
+                                if eval_residuals:
+                                    title = f'eq: {residual[sel_sample]:.2e}'
+                                    if return_optimizer:
+                                        title += f'\nopt: {optimized_quant[sel_sample]:.2f}'
+                                    if return_inequality:
+                                        title += f'\nineq: {ineq[sel_sample]:.2e}'
+                                    plt.title(title, color='green')
+                                filename = labels[seq_idx] + '_sample_' + str(sel_sample) + '_' + str(sel_channel) + '.png'
+                                plt.savefig(output_save_dir_tests + filename, bbox_inches='tight', pad_inches=0)
+                                plt.close(fig)
+                                os.makedirs(output_save_dir_tests + f'/sample_{sel_sample}/', exist_ok=True)
+                                np.savetxt(output_save_dir_tests + f'/sample_{sel_sample}/' + labels[seq_idx] + '_' + str(sel_channel) + '.csv',
+                                           last_pred, delimiter=',')
+
+                if eval_residuals:
+                    residuals_array = residual.detach().cpu().numpy()
+                    residual_mean_abs_list.append(residuals_array)
+                if topopt_eval:
+                    rel_CE_error = output[1]['rel_CE_error_full_batch'].detach().cpu().numpy()
+                    rel_vf_error = output[1]['vf_error_full_batch'].detach().cpu().numpy()
+                    fm_error = output[1]['fm_error_full_batch'].detach().cpu().numpy()
+                    rel_CE_error_list.append(rel_CE_error)
+                    rel_vf_error_list.append(rel_vf_error)
+                    fm_error_list.append(fm_error)
+
+                if test_batches != -1 and batch_idx > test_batches:
+                    break
+
+            if eval_residuals:
+                residuals_array = np.concatenate(residual_mean_abs_list, axis=0)
+                np.savetxt(output_save_dir_tests + 'residuals.csv', residuals_array, delimiter=',')
+            if topopt_eval:
+                rel_CE_error = np.concatenate(rel_CE_error_list, axis=0)
+                rel_vf_error = np.concatenate(rel_vf_error_list, axis=0)
+                fm_error = np.concatenate(fm_error_list, axis=0)
+                np.savetxt(output_save_dir_tests + 'rel_CE_error.csv', rel_CE_error, delimiter=',')
+                np.savetxt(output_save_dir_tests + 'rel_vf_error.csv', rel_vf_error, delimiter=',')
+                np.savetxt(output_save_dir_tests + 'fm_error.csv', fm_error, delimiter=',')
+
+            print(f'Evaluation of {name}: on {test_datasets_names[ds_test_idx]}.')
+            print('CE median error:', np.median(rel_CE_error),
+                  'VF mean error:', np.mean(rel_vf_error),
+                  'FM mean error:', np.mean(fm_error),
+                  'Mean residual:', np.mean(residuals_array),
+                  'Median residual:', np.median(residuals_array))
+
+    end_time = time.time()
+    print(f'Evaluation for model {name} done (time: {time.strftime("%H:%M:%S", time.gmtime(end_time - start_time))}).')
diff --git a/slurm/darcy_pidm_se.slurm b/slurm/darcy_pidm_se.slurm
index 59a2c39..df1cba7 100644
--- a/slurm/darcy_pidm_se.slurm
+++ b/slurm/darcy_pidm_se.slurm
@@ -5,7 +5,7 @@
 #SBATCH --cpus-per-task=4
 #SBATCH --gpus-per-task=1
 #SBATCH --mem-per-cpu=7500M
-#SBATCH --time=26:00:00
+#SBATCH --time=23:59:00
 #SBATCH --output=slurm/logs/%x_%j.out
 #SBATCH --error=slurm/logs/%x_%j.err
 
diff --git a/slurm/eval_darcy_diffusion.slurm b/slurm/eval_darcy_diffusion.slurm
new file mode 100644
index 0000000..f7a12e3
--- /dev/null
+++ b/slurm/eval_darcy_diffusion.slurm
@@ -0,0 +1,31 @@
+#!/bin/bash
+#SBATCH --job-name=eval_darcy_diff
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=7500M
+#SBATCH --time=02:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+set -euo pipefail
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+cd "$WORKDIR"
+mkdir -p slurm/logs
+module load cuda/12.1
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+python sample_eval.py \
+    --directory_path ./trained_models/ \
+    --name darcy_diffusion_9980528 \
+    --load_model_step 300000 \
+    --output_dir ./results/reproduced/darcy/diffusion
diff --git a/slurm/eval_mechanics_diffusion.slurm b/slurm/eval_mechanics_diffusion.slurm
new file mode 100644
index 0000000..aa475f6
--- /dev/null
+++ b/slurm/eval_mechanics_diffusion.slurm
@@ -0,0 +1,31 @@
+#!/bin/bash
+#SBATCH --job-name=eval_mech_diff
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=7500M
+#SBATCH --time=06:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+set -euo pipefail
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+cd "$WORKDIR"
+mkdir -p slurm/logs
+module load cuda/12.1
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+python sample_eval.py \
+    --directory_path ./trained_models/mechanics/ \
+    --name standard_diffusion \
+    --load_model_step 600000 \
+    --output_dir ./results/reproduced/topology/standard_diffusion
diff --git a/slurm/eval_mechanics_pidm.slurm b/slurm/eval_mechanics_pidm.slurm
new file mode 100644
index 0000000..e922f0d
--- /dev/null
+++ b/slurm/eval_mechanics_pidm.slurm
@@ -0,0 +1,31 @@
+#!/bin/bash
+#SBATCH --job-name=eval_mech_pidm
+#SBATCH --partition=gpu-a100
+#SBATCH --ntasks=1
+#SBATCH --cpus-per-task=4
+#SBATCH --gpus-per-task=1
+#SBATCH --mem-per-cpu=7500M
+#SBATCH --time=06:00:00
+#SBATCH --output=slurm/logs/%x_%j.out
+#SBATCH --error=slurm/logs/%x_%j.err
+set -euo pipefail
+WORKDIR="/scratch/dstoyanova/PhysicsInformedDiffusionModels"
+cd "$WORKDIR"
+mkdir -p slurm/logs
+module load cuda/12.1
+source "$HOME/miniconda3/etc/profile.d/conda.sh"
+conda activate pidm
+python - <<'PYEOF'
+import torch
+print("CUDA available:", torch.cuda.is_available())
+print("Torch CUDA:", torch.version.cuda)
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+else:
+    raise RuntimeError("CUDA not available")
+PYEOF
+python sample_eval.py \
+    --directory_path ./trained_models/mechanics/ \
+    --name PIDM \
+    --load_model_step 600000 \
+    --output_dir ./results/reproduced/topology/PIDM
diff --git a/slurm/mechanics_pidm_se.slurm b/slurm/mechanics_pidm_se.slurm
index f7bf382..0e21da6 100644
--- a/slurm/mechanics_pidm_se.slurm
+++ b/slurm/mechanics_pidm_se.slurm
@@ -4,8 +4,8 @@
 #SBATCH --ntasks=1
 #SBATCH --cpus-per-task=4
 #SBATCH --gpus-per-task=1
-#SBATCH --mem-per-cpu=8G
-#SBATCH --time=60:00:00
+#SBATCH --mem-per-cpu=8000M
+#SBATCH --time=23:59:00
 #SBATCH --output=slurm/logs/%x_%j.out
 #SBATCH --error=slurm/logs/%x_%j.err
 

From 2e1a5a3e5ca798d6e5f3ab4d7356918d38f8ebea Mon Sep 17 00:00:00 2001
From: dimanaStoyanova7 <stoyanovadimana557@gmail.com>
Date: Sat, 20 Jun 2026 10:45:15 +0300
Subject: [PATCH 10/12] plotting fig 2 - only 2(b)

---
 plot_fig2_darcy.py | 197 +++++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 197 insertions(+)
 create mode 100644 plot_fig2_darcy.py

diff --git a/plot_fig2_darcy.py b/plot_fig2_darcy.py
new file mode 100644
index 0000000..6ca998e
--- /dev/null
+++ b/plot_fig2_darcy.py
@@ -0,0 +1,197 @@
+"""
+Reproduce Fig 2 from Bastek et al. (ICLR 2025) — Physics-Informed Diffusion Models.
+
+Two subplots (log y-scale):
+  (a) Residual error RMAE over training
+  (b) Test data loss over training
+
+Data source: stdout training logs in slurm/logs/.
+
+Metric note:
+  The true per-iteration RMAE (residual.abs().mean(), stored as wandb metric
+  residual_mean_abs_test) is NOT emitted to stdout. The combined test loss
+  printed as "test loss at iteration N: X" equals:
+      loss_test = c_data * data_loss + c_residual * gaussian_nll(residual)
+  For Diffusion / PG-Diffusion / CoCoGen (c_residual = 0):
+      loss_test = data_loss    [exact]
+  For PIDM-ME (c_residual = 0.001) and PIDM-SE (c_residual = 1e-5):
+      loss_test = data_loss + c_residual * gaussian_nll(residual)   [combined]
+
+  Subplot (b) — test     data loss:
+      For c_residual=0 models: loss_test IS the data loss (exact).
+      For PIDM-SE: data_loss dominates (c_residual tiny), good proxy.
+      For PIDM-ME: loss_test is inflated by the physics penalty.
+
+  Subplot (a) — residual RMAE proxy:
+      For PIDM-ME / PIDM-SE: loss_test is dominated by the residual penalty
+      at early training (3.85e6 and 1.2e4 respectively at t=0), and decreases
+      as the model learns to satisfy the PDE — a meaningful proxy for residual
+      learning dynamics even though it is not identical to RMAE.
+      For Diffusion / PG / CoCoGen: loss_test = data_loss (no residual signal),
+      shown for reference — their curves reflect data quality, not PDE compliance.
+"""
+
+import re
+import os
+import numpy as np
+import matplotlib
+matplotlib.use('Agg')
+import matplotlib.pyplot as plt
+import matplotlib.ticker as mticker
+
+# ---------------------------------------------------------------------------
+# Config
+# ---------------------------------------------------------------------------
+LOG_DIR = os.path.join(os.path.dirname(os.path.abspath(__file__)), 'slurm', 'logs')
+
+# Colors and styles chosen to match the qualitative appearance of the paper's
+# Fig 2 (5 perceptually distinct colors from matplotlib's Tab10 cycle).
+MODELS = [
+    {
+        'name':       'Diffusion',
+        'file':       'pidm_darcy_diffusion_9980528.out',
+        'color':      '#1f77b4',   # Tab10 blue
+        'ls':         '-',
+        'lw':         1.5,
+        'c_residual': 0.0,
+    },
+    {
+        'name':       'PG-Diffusion',
+        'file':       'pidm_darcy_pg_9980534.out',
+        'color':      '#ff7f0e',   # Tab10 orange
+        'ls':         '--',
+        'lw':         1.5,
+        'c_residual': 0.0,
+    },
+    {
+        'name':       'CoCoGen',
+        'file':       'pidm_darcy_cocogen_10004050.out',
+        'color':      '#2ca02c',   # Tab10 green
+        'ls':         '-.',
+        'lw':         1.5,
+        'c_residual': 0.0,
+    },
+    {
+        'name':       'PIDM-ME',
+        'file':       'pidm_darcy_pidm_me_9955859.out',
+        'color':      '#d62728',   # Tab10 red
+        'ls':         (0, (3, 1, 1, 1)),   # dense dash-dot
+        'lw':         1.8,
+        'c_residual': 0.001,
+    },
+    {
+        'name':       'PIDM-SE',
+        'file':       'pidm_darcy_pidm_se_10059383.out',
+        'color':      '#9467bd',   # Tab10 purple
+        'ls':         ':',
+        'lw':         1.8,
+        'c_residual': 1e-5,
+    },
+]
+
+SMOOTH_WINDOW = 15       # rolling-mean window (number of log-points, each 500 iters)
+SKIP_ITERS   = 3         # drop first N log-points (iters 0/500/1000 — not yet converged)
+
+
+# ---------------------------------------------------------------------------
+# Helpers
+# ---------------------------------------------------------------------------
+
+def parse_log(filepath: str):
+    """Return (iterations, test_loss) arrays from a training stdout log."""
+    pattern = re.compile(r'test loss at iteration (\d+):\s*([0-9.eE+\-]+)')
+    iters, losses = [], []
+    with open(filepath) as fh:
+        for line in fh:
+            m = pattern.match(line.strip())
+            if m:
+                iters.append(int(m.group(1)))
+                losses.append(float(m.group(2)))
+    return np.array(iters, dtype=float), np.array(losses, dtype=float)
+
+
+def rolling_mean(arr: np.ndarray, window: int) -> np.ndarray:
+    """Causal rolling mean; edges filled with cumulative mean to avoid phase lag."""
+    out = np.empty_like(arr)
+    for i in range(len(arr)):
+        lo = max(0, i - window // 2)
+        hi = min(len(arr), i + window // 2 + 1)
+        out[i] = arr[lo:hi].mean()
+    return out
+
+
+# ---------------------------------------------------------------------------
+# Main
+# ---------------------------------------------------------------------------
+
+def main():
+    fig, axes = plt.subplots(1, 2, figsize=(10, 4.2))
+    fig.subplots_adjust(wspace=0.38)
+
+    for m in MODELS:
+        path = os.path.join(LOG_DIR, m['file'])
+        iters, losses = parse_log(path)
+
+        # Drop initial pathological points (model not yet trained)
+        iters  = iters[SKIP_ITERS:]
+        losses = losses[SKIP_ITERS:]
+
+        losses_sm = rolling_mean(losses, SMOOTH_WINDOW)
+        x = iters / 1e3   # display in thousands
+
+        kwargs = dict(color=m['color'], linestyle=m['ls'], linewidth=m['lw'],
+                      label=m['name'])
+
+        # ── (a) Residual RMAE proxy ──────────────────────────────────────
+        # For PIDM-ME / PIDM-SE: combined loss is dominated by the residual
+        # penalty, so it tracks physics learning dynamics.
+        # For Diffusion / PG / CoCoGen: combined loss = data loss (c_residual=0).
+        axes[0].semilogy(x, losses_sm, **kwargs)
+
+        # ── (b) Test data loss ───────────────────────────────────────────
+        # Exact for Diffusion / PG / CoCoGen.  PIDM-ME slightly inflated by
+        # physics penalty; PIDM-SE is a good proxy (c_residual = 1e-5).
+        axes[1].semilogy(x, losses_sm, **kwargs)
+
+    # ── Axis formatting ──────────────────────────────────────────────────
+
+    for ax, letter, ylabel in [
+        (axes[0], 'a', 'Residual Error RMAE'),
+        (axes[1], 'b', 'Test Data Loss'),
+    ]:
+        ax.set_xlabel('Training Iterations (×10³)', fontsize=11)
+        ax.set_ylabel(ylabel, fontsize=11)
+        ax.set_title(f'({letter})', loc='left', fontsize=12, fontweight='bold')
+        ax.set_yscale('log')
+        ax.yaxis.set_major_formatter(mticker.LogFormatterSciNotation())
+        ax.yaxis.set_minor_locator(mticker.LogLocator(subs='auto'))
+        ax.grid(True, which='major', linestyle='--', linewidth=0.5, alpha=0.5)
+        ax.grid(True, which='minor', linestyle=':', linewidth=0.3, alpha=0.3)
+
+    # Legend on subplot (b) only to avoid repetition
+    axes[1].legend(fontsize=9, loc='upper right', framealpha=0.85)
+
+    # Annotation explaining the RMAE proxy on subplot (a)
+    axes[0].text(
+        0.98, 0.98,
+        'Proxy: stdout test loss\n'
+        '(wandb RMAE not in logs)\n'
+        'c_res=0 models: data loss only',
+        transform=axes[0].transAxes,
+        fontsize=6.5, color='#555555',
+        ha='right', va='top',
+        bbox=dict(boxstyle='round,pad=0.3', fc='white', ec='#cccccc', alpha=0.8),
+    )
+
+    plt.tight_layout()
+
+    out_pdf = os.path.join(os.path.dirname(os.path.abspath(__file__)), 'fig2_darcy.pdf')
+    out_png = out_pdf.replace('.pdf', '.png')
+    fig.savefig(out_pdf, bbox_inches='tight')
+    fig.savefig(out_png, bbox_inches='tight', dpi=150)
+    print(f'Saved {out_pdf}')
+    print(f'Saved {out_png}')
+
+
+if __name__ == '__main__':
+    main()

From 04ccf756ac968d3d0880ad2f9e925b9df986bc0a Mon Sep 17 00:00:00 2001
From: dimanaStoyanova7 <stoyanovadimana557@gmail.com>
Date: Sat, 20 Jun 2026 10:53:19 +0300
Subject: [PATCH 11/12] commented out proxu on subplot (a)

---
 plot_fig2_darcy.py | 29 +++++++++++++----------------
 1 file changed, 13 insertions(+), 16 deletions(-)

diff --git a/plot_fig2_darcy.py b/plot_fig2_darcy.py
index 6ca998e..60ca2fe 100644
--- a/plot_fig2_darcy.py
+++ b/plot_fig2_darcy.py
@@ -17,7 +17,7 @@
   For PIDM-ME (c_residual = 0.001) and PIDM-SE (c_residual = 1e-5):
       loss_test = data_loss + c_residual * gaussian_nll(residual)   [combined]
 
-  Subplot (b) — test     data loss:
+  Subplot (b) — test data loss:
       For c_residual=0 models: loss_test IS the data loss (exact).
       For PIDM-SE: data_loss dominates (c_residual tiny), good proxy.
       For PIDM-ME: loss_test is inflated by the physics penalty.
@@ -143,10 +143,7 @@ def main():
                       label=m['name'])
 
         # ── (a) Residual RMAE proxy ──────────────────────────────────────
-        # For PIDM-ME / PIDM-SE: combined loss is dominated by the residual
-        # penalty, so it tracks physics learning dynamics.
-        # For Diffusion / PG / CoCoGen: combined loss = data loss (c_residual=0).
-        axes[0].semilogy(x, losses_sm, **kwargs)
+        # axes[0].semilogy(x, losses_sm, **kwargs)
 
         # ── (b) Test data loss ───────────────────────────────────────────
         # Exact for Diffusion / PG / CoCoGen.  PIDM-ME slightly inflated by
@@ -156,7 +153,7 @@ def main():
     # ── Axis formatting ──────────────────────────────────────────────────
 
     for ax, letter, ylabel in [
-        (axes[0], 'a', 'Residual Error RMAE'),
+        # (axes[0], 'a', 'Residual Error RMAE'),
         (axes[1], 'b', 'Test Data Loss'),
     ]:
         ax.set_xlabel('Training Iterations (×10³)', fontsize=11)
@@ -172,16 +169,16 @@ def main():
     axes[1].legend(fontsize=9, loc='upper right', framealpha=0.85)
 
     # Annotation explaining the RMAE proxy on subplot (a)
-    axes[0].text(
-        0.98, 0.98,
-        'Proxy: stdout test loss\n'
-        '(wandb RMAE not in logs)\n'
-        'c_res=0 models: data loss only',
-        transform=axes[0].transAxes,
-        fontsize=6.5, color='#555555',
-        ha='right', va='top',
-        bbox=dict(boxstyle='round,pad=0.3', fc='white', ec='#cccccc', alpha=0.8),
-    )
+    # axes[0].text(
+    #     0.98, 0.98,
+    #     'Proxy: stdout test loss\n'
+    #     '(wandb RMAE not in logs)\n'
+    #     'c_res=0 models: data loss only',
+    #     transform=axes[0].transAxes,
+    #     fontsize=6.5, color='#555555',
+    #     ha='right', va='top',
+    #     bbox=dict(boxstyle='round,pad=0.3', fc='white', ec='#cccccc', alpha=0.8),
+    # )
 
     plt.tight_layout()
 

From 5901053fdc97aa920e8f95109475076f6170ac89 Mon Sep 17 00:00:00 2001
From: dimanaStoyanova7 <stoyanovadimana557@gmail.com>
Date: Sat, 20 Jun 2026 11:22:04 +0300
Subject: [PATCH 12/12] added sublot (a) for plot b - no proxies

---
 plot_fig2_darcy.py | 93 ++++++++++++++++++++++++++++++----------------
 1 file changed, 60 insertions(+), 33 deletions(-)

diff --git a/plot_fig2_darcy.py b/plot_fig2_darcy.py
index 60ca2fe..bfd3e56 100644
--- a/plot_fig2_darcy.py
+++ b/plot_fig2_darcy.py
@@ -22,13 +22,9 @@
       For PIDM-SE: data_loss dominates (c_residual tiny), good proxy.
       For PIDM-ME: loss_test is inflated by the physics penalty.
 
-  Subplot (a) — residual RMAE proxy:
-      For PIDM-ME / PIDM-SE: loss_test is dominated by the residual penalty
-      at early training (3.85e6 and 1.2e4 respectively at t=0), and decreases
-      as the model learns to satisfy the PDE — a meaningful proxy for residual
-      learning dynamics even though it is not identical to RMAE.
-      For Diffusion / PG / CoCoGen: loss_test = data_loss (no residual signal),
-      shown for reference — their curves reflect data quality, not PDE compliance.
+  Subplot (a) — residual RMAE:
+      PIDM-ME and PIDM-SE only, using the explicit residual field from
+      new-format logs: "[iter N] test_loss: X residual: X".
 """
 
 import re
@@ -89,6 +85,25 @@
     },
 ]
 
+# PIDM-ME and PIDM-SE from newer runs that emit explicit residual RMAE.
+# Used only for subplot (a).
+RESIDUAL_MODELS = [
+    {
+        'name':  'PIDM-ME',
+        'file':  'pidm_darcy_pidm_me_10244029.out',
+        'color': '#ff7f0e',   # orange — matches paper
+        'ls':    (0, (3, 1, 1, 1)),
+        'lw':    1.8,
+    },
+    {
+        'name':  'PIDM-SE',
+        'file':  'pidm_darcy_pidm_se_10244030.out',
+        'color': '#e377c2',   # pink/magenta — matches paper
+        'ls':    ':',
+        'lw':    1.8,
+    },
+]
+
 SMOOTH_WINDOW = 15       # rolling-mean window (number of log-points, each 500 iters)
 SKIP_ITERS   = 3         # drop first N log-points (iters 0/500/1000 — not yet converged)
 
@@ -110,6 +125,22 @@ def parse_log(filepath: str):
     return np.array(iters, dtype=float), np.array(losses, dtype=float)
 
 
+def parse_log_new(filepath: str):
+    """Return (iterations, test_loss, residual) from '[iter N] test_loss: X residual: X' logs."""
+    pattern = re.compile(
+        r'\[iter\s+(\d+)\]\s+test_loss:\s*([0-9.eE+\-]+)\s+residual:\s*([0-9.eE+\-]+)'
+    )
+    iters, losses, residuals = [], [], []
+    with open(filepath) as fh:
+        for line in fh:
+            m = pattern.search(line)
+            if m:
+                iters.append(int(m.group(1)))
+                losses.append(float(m.group(2)))
+                residuals.append(float(m.group(3)))
+    return np.array(iters, dtype=float), np.array(losses, dtype=float), np.array(residuals, dtype=float)
+
+
 def rolling_mean(arr: np.ndarray, window: int) -> np.ndarray:
     """Causal rolling mean; edges filled with cumulative mean to avoid phase lag."""
     out = np.empty_like(arr)
@@ -128,32 +159,40 @@ def main():
     fig, axes = plt.subplots(1, 2, figsize=(10, 4.2))
     fig.subplots_adjust(wspace=0.38)
 
+    # ── (a) Residual RMAE — PIDM-ME and PIDM-SE only ────────────────────
+    for m in RESIDUAL_MODELS:
+        path = os.path.join(LOG_DIR, m['file'])
+        iters, _, residuals = parse_log_new(path)
+
+        iters     = iters[SKIP_ITERS:]
+        residuals = residuals[SKIP_ITERS:]
+
+        residuals_sm = rolling_mean(residuals, SMOOTH_WINDOW)
+        x = iters / 1e3
+
+        axes[0].semilogy(x, residuals_sm,
+                         color=m['color'], linestyle=m['ls'], linewidth=m['lw'],
+                         label=m['name'])
+
+    # ── (b) Test data loss — all 5 models ───────────────────────────────
     for m in MODELS:
         path = os.path.join(LOG_DIR, m['file'])
         iters, losses = parse_log(path)
 
-        # Drop initial pathological points (model not yet trained)
         iters  = iters[SKIP_ITERS:]
         losses = losses[SKIP_ITERS:]
 
         losses_sm = rolling_mean(losses, SMOOTH_WINDOW)
-        x = iters / 1e3   # display in thousands
-
-        kwargs = dict(color=m['color'], linestyle=m['ls'], linewidth=m['lw'],
-                      label=m['name'])
+        x = iters / 1e3
 
-        # ── (a) Residual RMAE proxy ──────────────────────────────────────
-        # axes[0].semilogy(x, losses_sm, **kwargs)
-
-        # ── (b) Test data loss ───────────────────────────────────────────
-        # Exact for Diffusion / PG / CoCoGen.  PIDM-ME slightly inflated by
-        # physics penalty; PIDM-SE is a good proxy (c_residual = 1e-5).
-        axes[1].semilogy(x, losses_sm, **kwargs)
+        axes[1].semilogy(x, losses_sm,
+                         color=m['color'], linestyle=m['ls'], linewidth=m['lw'],
+                         label=m['name'])
 
     # ── Axis formatting ──────────────────────────────────────────────────
 
     for ax, letter, ylabel in [
-        # (axes[0], 'a', 'Residual Error RMAE'),
+        (axes[0], 'a', 'Residual Error RMAE'),
         (axes[1], 'b', 'Test Data Loss'),
     ]:
         ax.set_xlabel('Training Iterations (×10³)', fontsize=11)
@@ -165,21 +204,9 @@ def main():
         ax.grid(True, which='major', linestyle='--', linewidth=0.5, alpha=0.5)
         ax.grid(True, which='minor', linestyle=':', linewidth=0.3, alpha=0.3)
 
-    # Legend on subplot (b) only to avoid repetition
+    axes[0].legend(fontsize=9, loc='upper right', framealpha=0.85)
     axes[1].legend(fontsize=9, loc='upper right', framealpha=0.85)
 
-    # Annotation explaining the RMAE proxy on subplot (a)
-    # axes[0].text(
-    #     0.98, 0.98,
-    #     'Proxy: stdout test loss\n'
-    #     '(wandb RMAE not in logs)\n'
-    #     'c_res=0 models: data loss only',
-    #     transform=axes[0].transAxes,
-    #     fontsize=6.5, color='#555555',
-    #     ha='right', va='top',
-    #     bbox=dict(boxstyle='round,pad=0.3', fc='white', ec='#cccccc', alpha=0.8),
-    # )
-
     plt.tight_layout()
 
     out_pdf = os.path.join(os.path.dirname(os.path.abspath(__file__)), 'fig2_darcy.pdf')